Voicemod玩转AI变声：8种角色，还能变成大影星！

会员服务 ·

Voicemod玩转AI变声：8种角色，还能变成大影星！

2022 年 6 月 28 日 新智元

新智元报道

编辑：拉燕

【新智元导读】幻想一下自己的声音变成好莱坞男神——摩根·弗里曼，谁听谁耳朵不怀孕啊。

都听说过变声器吧。

3岁小孩能发出70岁老爷爷的声音，50岁大妈能发出18岁帅小伙的声音。

小编也见过那种奇奇怪怪的变声器广告，用于一些不可言说的目的。

不过，今天要聊的变声器可不是上面这些。

今天的主角，是AI变声，是不是比那些变声器要高级多了？

AI处理+实时变声，看了就想用

Voicemod是啥？

一款平平无奇的用AI操作的实时变声器罢了。

再往下听听呢？

Voicemod能把你的声音变成摩根弗里曼、变成飞行员、变成航天员等八种不同角色。

最近，Voicemod发布了最新的测试版本。

听名字就知道，Voicemod就是专门干这个的。多年来，Voicemod一直致力于应用人工智能来改变人们的声音。

而上面提到的摩根弗里曼的声音是其中最有特色的。任何人都可以通过Voicemod把自己的声音变成这位著名影星。

而且，Voicemod并不只是在改变人的声音下了功夫，他们还通过给声音加入环境音，来营造一种逼真的氛围。

比方说，飞行员这个选项就能让使用者的声音听起来像他真的在驾驶一架飞机一样。

而且，所有的声音改变都是实时的，也就是不需要传统变声器的反应处理时间。

用户可以在直播软件上，或是视频通话时改变自己的声音，制造点节目效果什么的。

所有声音的数据库都由以英语为母语的专业配音演员辅助生成，而配音演员的声音和Voicemod重建的声音是匹配的。

配音演员念脚本录音，生成数据，供人工智能模型学习。然后，声音设计师再用传统的声音设计技巧把录好的声音转化成最终的成品。比如弗里曼的声音等等。

而就像上面提到的飞行员声音一样，许多生成的声音还包括各种动态效果、过滤器，以及背景音乐。

手机PC都能跑，算力有要求

如果用个人计算机来运行Voicemod的AI生成功能的话，就会需要更多的CPU算力。最起码比普通的Voicemod功能需要更多。

而最近Voicemod也是开启了全新的测试版，用户可以先跑一下试试，看看自己的计算机能不能运行Voicemod的新功能，会不会出现漏音，或是其它性能方面的问题。

现在Voicemod的主要版本只能在个人计算机上使用，Mac版还得期待一下。

随着时间的推移、技术的发展，合成声音变得越来越逼真，也越来越令人印象深刻。

虽然AI生成的声音是个新事物，但是像Resemble AI，还有Respeecher这些工具都已经展示出了内容创建者的潜力。声音编辑者可以用语音克隆的办法来进行编辑。

目前Voicemod AI生成声音的功能主要为了内容创作者服务。他们能用上这项技术，从一个侧面表明了我们每一个人和自由生成声音之间，并不遥远。

我们每一个人都可能是内容创作者，我们是AI声音技术发展浪潮中很重要的一份子。

另外，值得一提的是，Voicemod还推出了PowerPitch技术，能让用户为不同的环境或场合生成不同的语音身份。

就类似于，打游戏有软妹音，开会有霸总音，在学校有学生音等等。

除了用于娱乐和恶作剧以外，还能让数百万语音障碍患者从中受益。借助这个工具，语音障碍患者可以改善自身声音的音调、响度、音色，等等各类问题。

再往深一步想，这项技术还能让跨性别者受益，也就是lgbt里那个t。

虽说现在人工智能还没有被应用在PowerPitch上，但用户能用AI生成的语音来开会、打电话估计也能很快实现。

参考资料：https://www.theverge.com/2022/6/15/23169012/voicemod-morgan-freeman-ai-voice-astronauts-pilots

登录查看更多

相关内容

时变

关注 0

不可错过！专门为AI产品经理开设！Delft 大学最新《机器学习设计》课程，9节课带你落地ML到智能产品中

专知会员服务

27+阅读 · 2022年6月17日

高管必看！《赋予 AI 领导力：AI 企业高管（C-Suite）工具包》世界经济论坛2022发布122页PDF，Empowering AI Leadership: AI C-Suite Toolkit

专知会员服务

28+阅读 · 2022年4月1日

【MM 2021】基于单张图像的多风格说话人合成，Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis

专知会员服务

6+阅读 · 2022年3月22日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

89+阅读 · 2021年1月12日

打怪升级！2020机器学习工程师技术路线图

专知会员服务

99+阅读 · 2020年6月3日

“柯南领结”变成现实，字节跳动智创语音团队SAMI发布新一代实时AI变声方案

机器之心

1+阅读 · 2022年8月4日

苹果的新Siri：不男，也不女

量子位

0+阅读 · 2022年2月24日

人人影视落幕，鱿鱼游戏杀疯！要什么字幕，AI配音5秒生成

新智元

0+阅读 · 2021年12月6日

写Rap，编菜谱，你画我猜……这些 AI demo 我可以玩一天！

夕小瑶的卖萌屋

0+阅读 · 2021年11月24日

iOS 15 自带的「一起听」好不好用？用过之后我想说……

少数派

0+阅读 · 2021年10月29日

Wnt信号调节蛋白Gpr177在小鼠上腭发育中的功能研究

国家自然科学基金

0+阅读 · 2012年12月31日

4D特种电影“#19977;叠纪海怪”

国家自然科学基金

0+阅读 · 2011年12月31日

数据和模型混合驱动的虚拟人动作姿态快速生成与交互控制技术研究

国家自然科学基金

1+阅读 · 2010年12月31日

一种胃癌负相关miRNA的基本生物学功能及其分子机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于WWT平台的天文科普展览与e-Science理念普及教育

国家自然科学基金

0+阅读 · 2009年12月31日

FuzzerAid: Grouping Fuzzed Crashes Based On Fault Signatures

Arxiv

0+阅读 · 2022年9月2日

Challenges of Artificial Intelligence -- From Machine Learning and Computer Vision to Emotional Intelligence

Arxiv

19+阅读 · 2022年1月5日

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Image-Audio Encoding to Improve C2 Decision-Making in Multi-Domain Environment

Arxiv

28+阅读 · 2021年6月3日

Explainable Reasoning over Knowledge Graphs for Recommendation

Arxiv

11+阅读 · 2018年11月12日

VIP会员