项目名称: 基于关注度的可分级音频编码方法研究

项目编号: No.61201247

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 电子学与信息系统

项目作者: 杭波

作者单位: 湖北文理学院

项目金额: 25万元

中文摘要: 公共安全突发事件频发使我国对安防监控需求日益迫切,音频监控不受角度、光照及遮挡限制,是不可或缺的关键支撑技术。监控网络带宽波动频繁,严重影响监控音频质量。可分级音频编码是带宽波动情况下提升音质的最有效手段,但当前基于能量、信掩比等人耳感知特性的可分级音频编码,与安防监控关注音频能量、方位快速变化等特征不吻合,导致分级增强层被抛弃时关注音频信号质量下降。 针对此问题,本课题研究基于心理选择性关注机制的可分级音频编码方法,提升安防监控关注音频质量:1针对传统关注度模型无法表达音源方位快变的问题,引入空间线索变化度量音源方位快变关注度,建立安防监控音频关注度模型;2依据关注失真更易察觉的原理,研究基于关注度失真的带宽可分级编码方法,和基于关注度优先级的信噪比可分级编码方法。本研究对探索基于心理因素的高效音频压缩编码算法具有重要研究价值,对提高安防监控主观音质,促进音频监控技术进步具有重要意义。

中文关键词: 安防监控;音频编码;关注度模型;空间线索;可分级

英文摘要: The frequent occurrence of the public safety emergencies makes the demands for security surveillance increasingly urgent, audio surveillance not limited by the surveillance angle, lighting, and hidden block, is an indispensable security surveillance key supporting technology. Monitor network bandwidth fluctuates frequently, which seriously impacts surveillance audio quality. Scalable audio coding is the most effective means to enhance sound quality under bandwidth fluctuations. But the scalable audio coding based on human perception such as energy, signal-mask-ratio etc. doesn't match the characteristics of attention audio such as energy, location rapidly changing in security surveillance, which result the decline in the quality of the attention audio signal when the scalable enhancement layer is abandoned. To solve this problem, the subject is going to research the scalable audio coding methods which are based on mental selective attention mechanism to enhance the quality of the attention audio in security surveillance: 1.For the traditional audio attention model can't present the fast changing of sound source location, we introduce the spatial cues changing to measure the attention level of the rapidly varying of the sound source location, and establish the audio attention model of the security surveillance; 2

英文关键词: Surveillance;Audio Coding;Attention Model;Spatial Cues;Scalable

成为VIP会员查看完整内容
0

相关内容

【CVPR2022】基于序列对比学习的长视频帧方向动作表示
专知会员服务
9+阅读 · 2022年3月29日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
编码计算研究综述
专知会员服务
21+阅读 · 2021年10月26日
专知会员服务
34+阅读 · 2021年10月17日
贝叶斯迁移学习: 迁移学习的概率图模型概述
专知会员服务
67+阅读 · 2021年10月17日
专知会员服务
37+阅读 · 2021年9月8日
专知会员服务
14+阅读 · 2021年3月26日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
如何亿点点降低语音识别跨领域、跨语种迁移难度?
微软研究院AI头条
0+阅读 · 2022年3月31日
视频隐私保护技术综述
专知
3+阅读 · 2022年1月19日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
人脸专集5 | 最新的图像质量评价
计算机视觉战队
27+阅读 · 2019年4月13日
图像美学质量评价技术发展趋势
科技导报
18+阅读 · 2018年6月25日
一文读懂图像压缩算法
七月在线实验室
15+阅读 · 2018年5月2日
如何设计基于深度学习的图像压缩算法
论智
40+阅读 · 2018年4月26日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月17日
Arxiv
27+阅读 · 2021年11月11日
Attentive Graph Neural Networks for Few-Shot Learning
Arxiv
40+阅读 · 2020年7月14日
小贴士
相关VIP内容
【CVPR2022】基于序列对比学习的长视频帧方向动作表示
专知会员服务
9+阅读 · 2022年3月29日
视频隐私保护技术综述
专知会员服务
34+阅读 · 2022年1月19日
编码计算研究综述
专知会员服务
21+阅读 · 2021年10月26日
专知会员服务
34+阅读 · 2021年10月17日
贝叶斯迁移学习: 迁移学习的概率图模型概述
专知会员服务
67+阅读 · 2021年10月17日
专知会员服务
37+阅读 · 2021年9月8日
专知会员服务
14+阅读 · 2021年3月26日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
相关资讯
如何亿点点降低语音识别跨领域、跨语种迁移难度?
微软研究院AI头条
0+阅读 · 2022年3月31日
视频隐私保护技术综述
专知
3+阅读 · 2022年1月19日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
SFFAI分享 | 黄健:语音情感识别【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2019年6月11日
人脸专集5 | 最新的图像质量评价
计算机视觉战队
27+阅读 · 2019年4月13日
图像美学质量评价技术发展趋势
科技导报
18+阅读 · 2018年6月25日
一文读懂图像压缩算法
七月在线实验室
15+阅读 · 2018年5月2日
如何设计基于深度学习的图像压缩算法
论智
40+阅读 · 2018年4月26日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员