项目名称: 智能环境下基于音视频特征融合的多说话人跟踪研究

项目编号: No.61263031

项目类型: 地区科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 曹洁

作者单位: 兰州理工大学

项目金额: 44万元

中文摘要: 本项目立足智能环境下音、视频信息之间的相关性与互补性,研究非合作场景下音视频融合的多说话人跟踪问题。通过深入分析说话人数目以及音、视频重叠对系统模型的影响,研究复杂环境下多说话人跟踪系统的建模问题,探索合作与非合作场景下的模型交互方法,并在多说话人运动模型的基础上,研究高维度非线性系统的滤波方法;通过分析麦克风阵列与摄像机之间的校准方法,研究传感器坐标系与笛卡尔坐标系之间的映射关系,建立说话人三维位置空间与视频二维图像之间的校准机制,并以信息熵理论为基础,探索鲁棒、高效的音视频信息融合方法;深入研究系统初始化时间和初始化精度与跟踪精度之间的关系,为建立系统整体性能评价指标提供新的思路。本项目是人机交互领域的前沿性研究课题,在视频会议系统、多媒体系统、机器人等领域有着广泛的应用,其研究成果将进一步提升我国远程会议系统以及自动会议分析系统的应用水平,具有重要的应用前景和社会价值。

中文关键词: 智能环境;说话人跟踪;音视频融合;证据理论;粒子滤波

英文摘要: This project is based on audio and video information complementarity and correlation in intelligent environment which studies the multiple speakers tracking problem of audio and video feature fusion in the non-cooperative scene. First, we explore the interactive method of model with the cooperative and non-cooperative scene, analyse the modeling problem of multiple speakers tracking system in the complex environment, and explore the nonlinear system filtering method of high dimension through establishing a reasonable speakers motion model. Second, we research mapping relation of the sensor coordinate system and cartesian coordinate by analysing the calibration method between the microphone array and cameras, set up the calibration mechanism between 3D space position and video 2D image of speakers, and explore robust and efficient information fusion method of audio and video with the information entropy theory as a foundation. Third, we try to provide new ideas for establishing overall performance evaluation system by researching the relationship between system initialization time and initialization tracking precision.This project is a new and crucial in the field of human-computer interaction, which has a wide applications in the video conference system, multimedia system and robot field. The results of the stud

英文关键词: intelligent environment;speaker tracking;audio video fusion;evidence theory;particle filter

成为VIP会员查看完整内容
0

相关内容

对话推荐算法研究综述
专知会员服务
46+阅读 · 2022年2月18日
智能视频监控关键技术:行人再识别研究综述
专知会员服务
36+阅读 · 2021年12月30日
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
12+阅读 · 2021年9月13日
专知会员服务
26+阅读 · 2021年9月13日
专知会员服务
64+阅读 · 2021年5月21日
专知会员服务
14+阅读 · 2021年3月26日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
综述 | 激光与视觉融合SLAM
计算机视觉life
18+阅读 · 2020年10月8日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
综述 | SLAM回环检测方法
计算机视觉life
14+阅读 · 2019年8月19日
视频大脑:视频内容理解的技术与应用
AI前线
13+阅读 · 2019年4月18日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
图像检索研究进展:浅层、深层特征及特征融合
机器学习研究会
65+阅读 · 2018年3月26日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月30日
Arxiv
17+阅读 · 2021年3月29日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
小贴士
相关VIP内容
对话推荐算法研究综述
专知会员服务
46+阅读 · 2022年2月18日
智能视频监控关键技术:行人再识别研究综述
专知会员服务
36+阅读 · 2021年12月30日
面向行人重识别的局部特征研究进展、挑战与展望
专知会员服务
26+阅读 · 2021年10月13日
专知会员服务
12+阅读 · 2021年9月13日
专知会员服务
26+阅读 · 2021年9月13日
专知会员服务
64+阅读 · 2021年5月21日
专知会员服务
14+阅读 · 2021年3月26日
基于视觉的三维重建关键技术研究综述
专知会员服务
154+阅读 · 2020年5月1日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
相关资讯
综述 | 激光与视觉融合SLAM
计算机视觉life
18+阅读 · 2020年10月8日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
综述 | SLAM回环检测方法
计算机视觉life
14+阅读 · 2019年8月19日
视频大脑:视频内容理解的技术与应用
AI前线
13+阅读 · 2019年4月18日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
图像检索研究进展:浅层、深层特征及特征融合
机器学习研究会
65+阅读 · 2018年3月26日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员