普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

2017 年 8 月 10 日 AI研习社


来源 / Two Minute Papers

翻译 / 季伟

校对 / 贤儿响叮当 

整理 / 雷锋字幕组


AI 研习社出品系列短视频《 2 分钟论文 》带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

第3期介绍文字语音转换技术。也就是,我们写下一段文字,计算机把文字转化成语音。这在阅读新闻或者在无官方旁白的情况下,对于创作有声读物非常有用。

一般来讲,我们可以获取语音波形,也可以对语音波形进行编辑。但手工波形则非常困难,因为传统技术通常无法准确地找到波形中单词或字母的分界,更不用说编辑了。

有了这种技术,我们可以剪切、复制甚至编辑文本。这项工作由普林斯顿大学和Adobe的研究人员共同完成,被Adobe自诩为配音界的Photoshop。

想看看基于文本的音频叙述编辑到底怎么操作的?戳下方视频了解详情。

本期论文


"VoCo: Text-based Insertion and Replacement in Audio Narration"

音频编辑技术VoCo:基于文本的插入和替换


▷ 观看论文解读大概需要  3  分钟

学霸们还请自行阅读论文以获得更多细节

论文原址  

http://gfx.cs.princeton.edu/pubs/Jin_2017_VTI/


关注 AI 研习社(okweiwu),回复 1 领取

【超过 1000G 神经网络/AI/大数据、教程、论文!】

后台回复 “我要进群” 加入 AI 技术讨论群


吴恩达这本书是你踏入DeepLearning.ai的必修课

▼▼▼

登录查看更多
0

相关内容

Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
69+阅读 · 2020年2月29日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
78+阅读 · 2020年2月3日
【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程
专知会员服务
84+阅读 · 2019年12月11日
【学界】GAN跨界合成高保真音乐,Jeff Dean听了都陶醉
GAN生成式对抗网络
7+阅读 · 2019年3月1日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
已删除
将门创投
5+阅读 · 2018年11月15日
视频 | 波士顿动力进化【8min】
机器学习算法与Python学习
4+阅读 · 2018年11月15日
Arxiv
9+阅读 · 2018年10月24日
Arxiv
7+阅读 · 2018年4月24日
Arxiv
3+阅读 · 2015年5月16日
VIP会员
相关资讯
【学界】GAN跨界合成高保真音乐,Jeff Dean听了都陶醉
GAN生成式对抗网络
7+阅读 · 2019年3月1日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
已删除
将门创投
5+阅读 · 2018年11月15日
视频 | 波士顿动力进化【8min】
机器学习算法与Python学习
4+阅读 · 2018年11月15日
Top
微信扫码咨询专知VIP会员