新智元报道
AI模型还能闹鬼?能,而且来了就不走了!
现在的AI能写能画、能陪人聊天帮人干活,但谁知道,它还能吓死人不偿命?
一位推特网友发现,构成深度学习模型记忆的 「潜在空间」中产生了一个可怕的女鬼:一个满脸是血的中年女人。
这回Supercomposite摆弄的是一个定制的AI文本生成图像模型,和最近很火的DALL·E和Stable Diffusion很像,但略有不同。
这个模型使用名为「反向关键词加权」(negative prompt weights)技术。
通常情况下,给模型一个提示,它就会努力创造一个与之匹配的图像。如果提示的 「权重」为1,那么模型就努力按照这个提示生成图像。
如果多个提示词各有权重,比如说 「热气球:0.5, 雷雨:0.5」,最后生成的就是一幅雷雨中的热气球图景。
Supercomposite所试验的这个「反向关键词权重」,就是让权重值成为负数。
可想而知,在这种情况下,如果权重值为-1,模型会尽全力远离提示词生成图像,这个词越美好,生成的图像就越恐怖。
果然,试验结果让人毛骨悚然,不仅画风光怪陆离,还产生了一个挥之不去的「女鬼」。
首先,这位Supercomposite给出的关键词是Brando(著名影星马龙·白兰度),权重值为-1,结果AI给出了一幅它认为最不「白兰度」的一张图片:一个画风略奇异的logo。
这个结果还只是有点奇怪,接下来的事情就更诡异了。
如果说按照模型的负权重逻辑,那么把这张图上的信息(DIGITA PNTISC)告诉AI,再加上权重-1,是不是应该得到一张马龙·白兰度的帅脸?
试了试,结果是下面这样:
这哪里有白兰度的影子?
Supercomposite一遍又一遍地提交这个负面提示,AI模型一遍又一遍地给出了这个老女人的画面,她脸颊流血、被割伤,表情悲苦,容貌也令人过目不忘,可以半夜把人吓醒那种。
不信邪的Supercomposite又换了一张正能量爆表的图,图上有天使、有信徒,其实这张图也是AI按照正向关键提示生成的:
「满是天使的超压缩玻璃隧道,大导演韦斯·安德森的风格。」
她把这个图和上面的老女人图进行了合并,并给出了-1的权重,让模型全力生成「相反图」。
结果AI模型生成的图更吓人了。那个可怕的女人还在,还领着不少的同类,这怕不是是恐怖片拍摄现场吧?
Supercomposite表示,他完全被这些奇形怪状的场景,以及所传达的绝望、恐慌和悲伤震住了。
AI生成的照片试过了,那真实的正常照片呢?将这些照片与这个女鬼合并,在生成权重-1的结果,会怎样呢?女鬼总该消失了吧?
别想了,无论被合并的照片主题如何不相关,这个老女人,她一直都在。
比如下面是和一个「古代艺术雕像」合并后的「反图片」,她既望向远方,也在看着你。
和电影《阿凡达》的剧照合并后的结果:
和「星之卡比」合并后生成的结果:(看完这个还想得起星之卡比长啥样吗?)
Loab+小蜜蜂:
Loab的生命力是如此顽强,即使是模型生成的第二代图像,再与无关图像合成,生成的结果,仍然有她的明显特征。
比如下边这张,这是《鬼娃新娘》续集之《猛鬼老奶奶》?
在历经三四代生成迭代后,这个老女人仍然阴魂不散,风格也变得越来越抽象:
虽然有时利用一些关键词结合后,生成的负权重图上终于看不出来了,她销声匿迹一段后,仍然会在后来的图谱系中出现,不时地从哪个地方冒出来,吓人一激灵。
比如下边这种:
由于更多的图像画风更加抽象可怖,过于重口,作者在推特上甚至都设立了敏感内容警告,需要点击确认后才显示。
更多女鬼图片,请戳:
https://twitter.com/supercomposite/status/1567226439832936448
小心别被吓尿了。
最后顺便说一下,Loab似乎很容易被最近大火的AI艺术家Stable Diffusion作为「图像关键词」识别出来。祝各位今晚睡个好觉!
参考资料:
https://techcrunch.com/2022/09/13/loab-ai-generated-horror/
https://twitter.com/supercomposite/status/1567226439832936448