In this paper, we conduct a cross-dataset study on parametric and non-parametric raw-waveform based speaker embeddings through speaker verification experiments. In general, we observe a more significant performance degradation of these raw-waveform systems compared to spectral based systems. We then propose two strategies to improve the performance of raw-waveform based systems on cross-dataset tests. The first strategy is to change the real-valued filters into analytic filters to ensure shift-invariance. The second strategy is to apply variational dropout to non-parametric filters to prevent them from overfitting irrelevant nuance features.


翻译:在本文中,我们进行了一项关于通过语音校验实验嵌入的参数和非参数原始波形扬声器的交叉数据集研究;一般而言,我们观察到这些原始波形系统与光谱系统相比的性能下降幅度更大;然后,我们提出了两项战略,以改进以交叉数据集测试为基础的原始波形系统的性能;第一项战略是将实际价值的过滤器改为分析过滤器,以确保不动。第二项战略是将变式退出应用到非参数过滤器,以防止它们过度配置不相干微分特征。

0
下载
关闭预览

相关内容

Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
已删除
将门创投
3+阅读 · 2018年6月20日
Arxiv
0+阅读 · 2021年12月3日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
6+阅读 · 2018年7月29日
Arxiv
3+阅读 · 2018年6月19日
VIP会员
相关资讯
已删除
将门创投
3+阅读 · 2018年6月20日
Top
微信扫码咨询专知VIP会员