新智元报道
编辑:拉燕
都听说过变声器吧。
3岁小孩能发出70岁老爷爷的声音,50岁大妈能发出18岁帅小伙的声音。
小编也见过那种奇奇怪怪的变声器广告,用于一些不可言说的目的。
不过,今天要聊的变声器可不是上面这些。
今天的主角,是AI变声,是不是比那些变声器要高级多了?
AI处理+实时变声,看了就想用
Voicemod是啥?
一款平平无奇的用AI操作的实时变声器罢了。
再往下听听呢?
Voicemod能把你的声音变成摩根弗里曼、变成飞行员、变成航天员等八种不同角色。
最近,Voicemod发布了最新的测试版本。
听名字就知道,Voicemod就是专门干这个的。多年来,Voicemod一直致力于应用人工智能来改变人们的声音。
而上面提到的摩根弗里曼的声音是其中最有特色的。任何人都可以通过Voicemod把自己的声音变成这位著名影星。
而且,Voicemod并不只是在改变人的声音下了功夫,他们还通过给声音加入环境音,来营造一种逼真的氛围。
比方说,飞行员这个选项就能让使用者的声音听起来像他真的在驾驶一架飞机一样。
而且,所有的声音改变都是实时的,也就是不需要传统变声器的反应处理时间。
用户可以在直播软件上,或是视频通话时改变自己的声音,制造点节目效果什么的。
所有声音的数据库都由以英语为母语的专业配音演员辅助生成,而配音演员的声音和Voicemod重建的声音是匹配的。
配音演员念脚本录音,生成数据,供人工智能模型学习。然后,声音设计师再用传统的声音设计技巧把录好的声音转化成最终的成品。比如弗里曼的声音等等。
而就像上面提到的飞行员声音一样,许多生成的声音还包括各种动态效果、过滤器,以及背景音乐。
手机PC都能跑,算力有要求
如果用个人计算机来运行Voicemod的AI生成功能的话,就会需要更多的CPU算力。最起码比普通的Voicemod功能需要更多。
而最近Voicemod也是开启了全新的测试版,用户可以先跑一下试试,看看自己的计算机能不能运行Voicemod的新功能,会不会出现漏音,或是其它性能方面的问题。
现在Voicemod的主要版本只能在个人计算机上使用,Mac版还得期待一下。
随着时间的推移、技术的发展,合成声音变得越来越逼真,也越来越令人印象深刻。
虽然AI生成的声音是个新事物,但是像Resemble AI,还有Respeecher这些工具都已经展示出了内容创建者的潜力。声音编辑者可以用语音克隆的办法来进行编辑。
目前Voicemod AI生成声音的功能主要为了内容创作者服务。他们能用上这项技术,从一个侧面表明了我们每一个人和自由生成声音之间,并不遥远。
我们每一个人都可能是内容创作者,我们是AI声音技术发展浪潮中很重要的一份子。
另外,值得一提的是,Voicemod还推出了PowerPitch技术,能让用户为不同的环境或场合生成不同的语音身份。
就类似于,打游戏有软妹音,开会有霸总音,在学校有学生音等等。
除了用于娱乐和恶作剧以外,还能让数百万语音障碍患者从中受益。借助这个工具,语音障碍患者可以改善自身声音的音调、响度、音色,等等各类问题。
再往深一步想,这项技术还能让跨性别者受益,也就是lgbt里那个t。
虽说现在人工智能还没有被应用在PowerPitch上,但用户能用AI生成的语音来开会、打电话估计也能很快实现。
参考资料:https://www.theverge.com/2022/6/15/23169012/voicemod-morgan-freeman-ai-voice-astronauts-pilots