【EMNLP2020最佳论文】无声语音的数字化发声

2020 年 11 月 20 日 专知
今年的最佳论文奖项颁发给了加州大学伯克利分校的研究《Digital Voicing of Silent Speech》。


  • 论文链接:https://www.aclweb.org/anthology/2020.emnlp-main.445.pdf

  • 作者:David Gaddy、Dan Klein(加州大学伯克利分校)


在最佳论文中,来自加州大学伯克利分校的研究者们探究了无声语音的数字化发声任务,其中基于捕获肌肉冲动的肌电图(EMG)传感器度量,将无声口语单词转换为可听语音。尽管此前已经有利用有声语音期间收集的 EMG 训练语音合成模型的研究,但该研究首次利用了在无声发音期间收集的 EMG 进行训练。

模型中所使用数据的三个组成部分。

具体而言,研究者提出了一种通过将音频目标从有声信号转换为无声信号来对无声 EMG 进行训练的方法。与仅使用有声数据进行训练的基线方法相比,该方法显著提升了从无声 EMG 中生成音频的清晰度。在某种数据条件下,该方法将转录词误差率从 64% 降至 4%;另一种数据条件下,转录词误差率从 88% 降至 68%。为了促进这一研究任务的进一步发展,该研究已经共享了无声和有声面部 EMG 度量的新数据集。

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DVS2” 就可以获取【EMNLP2020最佳论文】无声语音的数字化发声》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【EMNLP2020】序列知识蒸馏进展,44页ppt
专知会员服务
38+阅读 · 2020年11月21日
专知会员服务
26+阅读 · 2020年11月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
ECCV 2020接受论文出炉,1361篇都在这了
专知
23+阅读 · 2020年7月4日
KDD2020接受论文列表!338篇论文都在这了
专知
20+阅读 · 2020年6月26日
自然语言处理ACL2020论文列表
专知
12+阅读 · 2020年6月23日
自然语言处理(NLP)前沿进展报告(PPT下载)
NLP论文的技术播客-NLP Highlights
专知
14+阅读 · 2018年8月6日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
3+阅读 · 2018年4月18日
Arxiv
5+阅读 · 2018年1月23日
VIP会员
Top
微信扫码咨询专知VIP会员