近日,一段通过 AI 技术把朱茵在《射雕英雄传》中扮演的角色“黄蓉”的脸替换成杨幂的视频在网络引起热议。
这是朱茵饰演的黄蓉:
替换成杨幂后:
还是朱茵活灵活现的表情,但五官已然变成了杨幂,视频看起来毫无破绽,简直让人以为就是本幂演的了。
网友都被这样的操作惊呆了,微博话题阅读量瞬间飙到 1.3 亿。
这种换脸术看起来“好玩”,但有网友质疑是否侵犯肖像权。
27 日,杨幂“换脸”视频的制作者回应,制作视频的本意是用于技术交流,并无营利行为,但已将相关视频下架,并表示:“对所有人来说是一个警示,大家应尊重版权与肖像权,专注于技术本身。”
这种神奇的黑科技被称作 AI 换脸!然而,如此高阶的换脸技术引来了无数网友的恐慌,“怎么实现的换脸?如果这一技术被用在其他地方,会怎么样?我会不会被别人假冒了都不知道?目前的人脸识别技术还安全吗?”
可怕的换脸 AI 技术
其实 AI 换脸两年前从国外论坛流传开来,而国内也有不少仿效者,比如有网友把女主播的脸,换成唐嫣、杨幂、刘亦菲等明星。
是不是觉得很震撼?人工智能正在以我们所有人想象不到的速度,飞速前进,颠覆我们以往的认知.....
换脸哥制作这段逼真视频的工具叫 Deepfake ,这一 AI 技术在国外已经火了两年多。
视频中左侧为真实视频,右侧是 Deepfake 合成
当年,美国国防部把这项技术誉为人类对于 AI 的军备竞赛的一个开端,能把视频中的人脸换成其他人,同时保持脸部肌肉运动和谐,口型和声音匹配。
Deepfake 合成后的「希拉里·川普」
什么是 DeepFakes?
最初,在 Reddit 网站上,一位用户名为“deepfakes”的网友发布了自己制作的换脸视频,将成人影片的女主角换成了神奇女侠,短时间吸引了大量的人气,广大网友顺理成章地把他的网名作为这项技术的命名。
《神奇女侠》的扮演者盖尔·加朵的这一面你见过么?其实这是一段合成视频,视频中并非盖尔·加朵本人。
而是通过机器学习技术搭建了一个系统,让 AI 学习了女明星的面部特征,最后合成到了成人片里的女演员的头部。
没过多久,同名算法在 GitHub 开源,由 deepfakes 技术制作的视频在网上也越来越多。杰西卡·阿尔芭、艾玛·沃特森等好莱坞明星纷纷被“换脸”。
好莱坞影星纷纷“中招”
除了 Reddit 上的讨论外,在 2018 年 1 月,还有人推出了 Windows 程序的 FakeApp,这大大降低了 DeepFake 的使用门槛,它允许用户很轻松地自制换脸视频,即使你没有任何人工智能方面的知识。
但是由于许多用户将 deepfakes 技术用于制作虚假视频,例如伪造政治家公开演讲,制作著名女星色情内容等,导致这项技术声名狼藉。
DeepFakes 实际上是一种人脸交换技术,顾名思义,也就是在图像或视频中把一张脸替换成另一张脸。
事实上,人脸交换技术在电影制作领域已经不是个新鲜词了,但是之前电影视频中的人脸交换非常复杂,专业的视频剪辑师和 CGI 专家需要花费大量时间和精力才能完成视频中的人脸交换。
这是《速度与激情 7》里的保罗,他在电影没杀青之前就意外去世,着实令人心痛。但后期通过一种 CGI 的技术换脸呈现出来了,这才让我们看到了分叉口永别的这一幕。
DeepFakes 的出现可以说是人脸交换技术的一个突破。利用 DeepFakes 技术,你只需要一个 GPU 和一些训练数据,就能够制作出以假乱真的换脸视频。
这可以说是一个非常了不起的突破了,因为你只需要把上百张人物的样图输入至一个算法,就能完成人脸交换,制作出非常逼真的视频效果。就算你是个对视频剪辑一窍不通的外行,也能做到这样。
DeepFakes 的出现还意味着我们可以在视频中进行大规模的“换脸”。我们大多数人都曾经把自己的照片上传到网络上,因此,我们大多数人的脸都能够轻易地被替换到一些视频中,成为视频的“主角”。
不得不说,这是件非常可怕的事情,但这也并不那么值得恐慌,毕竟我们大家早已接受了“照骗”(照片造假)。
DeepFakes 的技术原理
DeepFakes 的核心是一个“自动编码器”,这个“自动编码器”实际上是一个深度神经网络,它能够接收数据输入,并将其压缩成一个小的编码,然后从这个编码中重新生成原始的输入数据。
在这个标准的自动编码器设置中,网络将尝试学习创建一个编码,从中网络能够重新生成输入的原始图片。只要有足够多的图像数据,网络就能学会创建这种编码。
DeepFakes 让一个编码器把一个人脸压缩成一个代码和两个解码器,一个将其还原成人物 A(Fallon),另一个还原成人物 B(Oliver)。
下面的图能够帮助你理解:
在这个案例中,使用的编码器是一样的,但是 Fallon 和 Oliver 的解码器是不同的。
在训练的过程中,输入的人脸会被扭曲,从而模拟一个“我们希望得到这样的人脸”的概念。
下面介绍算法训练的三个步骤:
首先,我们给编码器输入了一张 Jimmy 扭曲脸的图片,并尝试用解码器 A 来重新还原他的脸,这就使得解码器 A 必须要学会在纷繁复杂的图片中识别并且还原出 Jimmy 的脸。
然后,把 Oliver 扭曲脸的图片输入至同一个编码器,并用解码器 B 来还原 Oliver 的脸。
我们不断重复上面的操作,直到两个解码器能够分别还原出两个人的脸,同时编码器也能够学会通过抓取人脸关键信息,从而分辨出 Jimmy 和 Oliver 的脸。
等到以上的训练步骤都完成以后,我们就能把一张 Jimmy 的照片输入至编码器,然后直接把代码传输至解码器 B,将 Jimmy 的脸换成 Oliver 的脸。
这就是我们通过训练模型完成换脸的全过程。解码器获取了 Jimmy 的脸部信息,然后把信息交给解码器 B,这时候解码器 B 会作出这样的反应:“这又是一条干扰信息,这不是 Oliver 的脸,那么我就把你换成 Oliver 吧。”
一条算法仅通过观察许多图片就能够再次生成、还原这些图片,这听起来挺不可思议的,但 DeepFakes 确确实实做到了,而且效果还相当不错。
为避免彻底沦落为一个成人网站,Reddit 无奈只得关掉了 Deepfake 频道,其 GitHub 开源代码也被清除。
Twitter 火速删除了相关内容,并且封禁了相关内容的搜索。FakeApp 的官网目前也已无法使用。
2019 年 1 月,荷兰 DeepTrace 实验室发布了一份 DeepFake 发展报告,数据显示 2018 年“deepfake”关键词的谷歌搜索次数比 2017 年增长了 1000 倍。
在 deepfake 诞生之前,视频换脸技术主要应用于电影拍摄中,而且它需要相对较高的技术和资金投入。
但现在,deepfake 等深度学习技术的出现大大降低了换脸门槛,使用者不仅用它来捏造针对政要人士的假新闻,还用它来制造女明星的色情片。
这些假视频、假新闻的危害性之大这里就不赘述了。而且 deepfake 去年甚至惊动了美国五角大楼。
他们通过美国国防部高级研究计划局(DARPA)委托全美各地的专家,想方设法检测各类视频的真实性。
不久后,DARPA 就研发了一款能够自动监测出被换了脸的假视频的 AI 工具,根据假视频一般不会表现出眨眼、呼吸和眼球运动这些特征,能够以 99% 的准确率识别出假视频。
相关论文和数据集:
https://arxiv.org/abs/1901.08971
https://github.com/ondyari/FaceForensics
如今这项技术正在被越来越多人使用,而且用途不明。在这种前沿技术面前,每个人都可能成为潜在的受害者。
一旦被人滥用,真实照片与语音模拟器或语音合成系统相结合,就可以生成任意“假新闻”,任何人可以变成任何人。
如今,眼见已经不为实,对于泛滥的消息,我们还需加强鉴别,切莫人云亦云。
那些由于技术滥用对当事人造成的伤害,对整个社会造成的反噬,是人类对新技术缺乏敬畏必须付出的代价。
技术从来都是双刃剑。让技术进步真正成为我们的铠甲,而非软肋,还需要更健全的、与时俱进的规则与法律的保护。
“图之于未萌,虑之于未有”。新技术的出现,不断冲击着我们的法律观、道德感,提高应对能力,在可能到来的风险面前做好准备,才能让新技术始终行驶在正确的轨道里,不会冲出道德、法律的“篱笆”。
你认为 AI 换脸技术究竟是好还是坏?欢迎底部留言分享。
精彩文章推荐: