来源 / Two Minute Papers
翻译 / 季伟
校对 / 贤儿响叮当
整理 / 雷锋字幕组
AI 研习社出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。
第3期介绍文字语音转换技术。也就是,我们写下一段文字,计算机把文字转化成语音。这在阅读新闻或者在无官方旁白的情况下,对于创作有声读物非常有用。
一般来讲,我们可以获取语音波形,也可以对语音波形进行编辑。但手工波形则非常困难,因为传统技术通常无法准确地找到波形中单词或字母的分界,更不用说编辑了。
有了这种技术,我们可以剪切、复制甚至编辑文本。这项工作由普林斯顿大学和Adobe的研究人员共同完成,被Adobe自诩为配音界的Photoshop。
想看看基于文本的音频叙述编辑到底怎么操作的?戳下方视频了解详情。
本期论文
"VoCo: Text-based Insertion and Replacement in Audio Narration"
音频编辑技术VoCo:基于文本的插入和替换
▷ 观看论文解读大概需要 3 分钟
学霸们还请自行阅读论文以获得更多细节
论文原址
http://gfx.cs.princeton.edu/pubs/Jin_2017_VTI/
关注 AI 研习社(okweiwu),回复 1 领取
【超过 1000G 神经网络/AI/大数据、教程、论文!】
后台回复 “我要进群” 加入 AI 技术讨论群
吴恩达这本书是你踏入DeepLearning.ai的必修课
▼▼▼