搜狗AI合成主播再次进化,发布站立式合成主播

2019 年 2 月 20 日 量子位
晓查 发自 凹非寺
量子位出品 | 公众号 QbitAI

这一次,新闻主播的“失业危机”,连新华社主播自己都开始担心起来。

因为搜狗AI,又给演播室带来了新员工。

去年12月乌镇世界互联网大会,搜狗和新华社就联手推出了全球首个AI合成主播

现在,3个月后,这个AI主播不仅能“坐在”演播室,开始替代人类播报新闻。还能“手舞足蹈”,运用起肢体语言丰富表达了。

没错,肢体语言,就是搜狗和新华社赋予AI合成主播的最新技能。

2月19日下午,搜狗与新华社新媒体中心达成战略合作,双方在签约仪式上联合发布了站立式AI合成主播,让它站起来用更生动的方式播报新闻。

3个月后再度进化

去年11月世界互联网大会期间,搜狗的全球首个AI合成主播初次亮相,负责为新华社播报大会相关新闻。

它的出现引发国内外多家媒体关注,包括路透社、华盛顿邮报都对此进行了报道,搜狗也成为了中国展示AI技术实力的窗口。

AI合成主播并不仅仅只在世界互联网大会上登台,还报道了首届进博会、2019年春运等热门话题,今年还计划让他来播报2019两会新闻。

搜狗方面表示,3个月来AI合成主播已生产了3400余条新闻报道,累计时长达10000多分钟。

如今,这个“男主播”不仅能站起来,还有了自己的名字——“新小浩”。这让它的原型,也就是新华社主播邱浩倍感压力。

今天发布的新AI合成主播,将过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,标志着“搜狗分身”技术再次取得突破。

在此次发布会上,搜狗还为“新小浩”带来了一位新同事:全球首个AI合成女主播“新小萌”。它展示了“搜狗分身”技术的通用能力,可以根据不同的要求复制AI合成主播“分身”。

AI主播背后的技术

搜狗AI合成主播师从国内顶级新闻播报员,由新华社邱浩和屈萌两位主播“亲自”调教。

它是对真人主播声音、唇形、表情动作等特征进行高效提取,通过语音合成、唇形合成、表情合成以及深度学习等技术,创造出具备和真人主播一样播报能力的AI合成主播。

这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,如今搜狗又将合成肢体语言的能力加入其中。

同时,“搜狗分身”的个性化定制成本低,仅需使用少量用户真实音视频数据,即可快速定制出高逼真度的分身模型。搜狗仅在3个月后就推出了完成度极高的“新小萌”形象,再次证明了这项的技术的通用性。

除了加入新功能,搜狗还对AI合成主播原本的声音、图像技术进行升级。

“新小浩”的声音加入了领先的wavernn波形建模技术,实现更逼真的语音合成效果,让声音情感更真实。

在图像生成方面,通过模型优化及多风格数据的使用,实现更加逼真的表情合成、肢体动作与语义的恰当匹配以及更加自然的唇动效果。

未来应用场景

站立式AI合成主播将打破只能在演播室的局限,将“走出大门”参与2019年全国两会的报道,站立并且声情并茂为观众播报前方消息。

今后,搜狗和新华社将以AI合成主播项目为核心,在人工智能应用于新闻采编领域开展全方位长期合作,你可以在新华社客户端、微信公众号上看到两位主播的身影。

搜狗CEO王小川还介绍说,除了在新闻领域的应用,作为AI合成主播的技术核心,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域。

作者系网易新闻·网易号“各有态度”签约作者


加入社群

量子位现开放「AI+行业」社群,面向AI行业相关从业者,技术、产品等人员,根据所在行业可选择相应行业社群,在量子位公众号(QbitAI)对话界面回复关键词“行业群”,获取入群方式。行业群会有审核,敬请谅解。


此外,量子位AI社群正在招募,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式。

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !



登录查看更多
3

相关内容

搜狗凭借对前瞻性技术趋势的把握和敏锐的市场嗅觉,已经成为中国互联网的创新典范,也是最具发展潜力的公司之一。搜狗的产品围绕互联网的最基础应用,其中输入法、浏览器、搜索三大产品均名列前茅。2010年8月9日,在引入阿里巴巴集团和云峰基金等战略投资者之后,搜狗从搜狐分拆,成为独立运营的公司,王小川出任搜狗首席执行官。
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
从无到有!自动化所提出海量虚拟数据生成新方法
中国科学院自动化研究所
5+阅读 · 2019年9月16日
重磅 | 腾讯教育业务布局首次公开
雷锋网
5+阅读 · 2019年2月14日
AI算法起家的今日头条为何败给了色情?
大数据技术
4+阅读 · 2018年1月5日
Arxiv
14+阅读 · 2019年11月26日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
SepNE: Bringing Separability to Network Embedding
Arxiv
3+阅读 · 2019年2月26日
Arxiv
12+阅读 · 2019年2月26日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
3+阅读 · 2018年4月3日
VIP会员
相关论文
Arxiv
14+阅读 · 2019年11月26日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
SepNE: Bringing Separability to Network Embedding
Arxiv
3+阅读 · 2019年2月26日
Arxiv
12+阅读 · 2019年2月26日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
8+阅读 · 2018年11月27日
Arxiv
3+阅读 · 2018年4月3日
Top
微信扫码咨询专知VIP会员