Recently, ad-hoc microphone array has been widely studied. Unlike traditional microphone array settings, the spatial arrangement and number of microphones of ad-hoc microphone arrays are not known in advance, which hinders the adaptation of traditional speaker verification technologies to ad-hoc microphone arrays. To overcome this weakness, in this paper, we propose attention-based multi-channel speaker verification with ad-hoc microphone arrays. Specifically, we add an inter-channel processing layer and a global fusion layer after the pooling layer of a single-channel speaker verification system. The inter-channel processing layer applies a so-called residual self-attention along the channel dimension for allocating weights to different microphones. The global fusion layer integrates all channels in a way that is independent to the number of the input channels. We further replace the softmax operator in the residual self-attention with sparsemax, which forces the channel weights of very noisy channels to zero. Experimental results with ad-hoc microphone arrays of over 30 channels demonstrate the effectiveness of the proposed methods. For example, the multi-channel speaker verification with sparsemax achieves an equal error rate (EER) of over 20% lower than oracle one-best system on semi-real data sets, and over 30% lower on simulation data sets, in test scenarios with both matched and mismatched channel numbers.


翻译:与传统的麦克风阵列设置不同,专用麦克风阵列的空间安排和麦克风的麦克风数量事先并不为人所知,这妨碍了传统扬声器核查技术适应临时麦克风阵列。为了克服这一弱点,我们在本文件中提议用临时麦克风阵列进行多声道声带校验。具体地说,我们在一个单一通道扬声器核查系统的集合层之后,增加一个通道间处理层和一个全球聚变层。在频道间处理层沿频道设置应用所谓的剩余自留自留装置,将重量分配给不同的麦克风。全球聚变层将所有频道都结合到与输入通道数目独立的方式。为了克服这一弱点,我们在本文件中提议用特别热声麦克风阵列进行基于关注的多声道声器校验。我们进一步将剩余自留声式麦克风声阵列中的软式传声器操作器操作员替换为零。在30多个频道扬声器的自动麦克风阵列中展示了拟议方法的有效性。例如,多声带自留音器的自留自留自留自留自留自留,在对不同麦克声器的声器上进行对各声器的自留式自留式自留式自留置式自留式自留式自留式自留式自留至不同麦克式自留式自留置,对各频道内,对各频道内,对各频道的模拟,对准率率率都为20,对等的低速率数据,对准率数据,对等的模拟,对准数据,对调率率率率率率率数据,对准率率次,对准数据,对准率率率率率率率率在20,对准数据,对准率在20,对准率率率在20,对准率上,对准率次,对准率,对准数据,对准数据,对准率率率率率率在20,对准率均,对准率,对准率,对准率,对准率均,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对低,对

0
下载
关闭预览

相关内容

【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
专知会员服务
31+阅读 · 2020年10月13日
专知会员服务
123+阅读 · 2020年9月8日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
计算机 | EMNLP 2019等国际会议信息6条
Call4Papers
18+阅读 · 2019年4月26日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
【TED】生命中的每一年的智慧
英语演讲视频每日一推
9+阅读 · 2019年1月29日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
计算机 | CCF推荐会议信息10条
Call4Papers
5+阅读 · 2018年10月18日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
6+阅读 · 2018年7月29日
VIP会员
相关VIP内容
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
专知会员服务
31+阅读 · 2020年10月13日
专知会员服务
123+阅读 · 2020年9月8日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
相关资讯
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
计算机 | EMNLP 2019等国际会议信息6条
Call4Papers
18+阅读 · 2019年4月26日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
【TED】生命中的每一年的智慧
英语演讲视频每日一推
9+阅读 · 2019年1月29日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
计算机 | CCF推荐会议信息10条
Call4Papers
5+阅读 · 2018年10月18日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员