语料没选对,GPT-3训练出微波炉「杀人狂」AI

2022 年 4 月 21 日 新智元




  新智元报道  

编辑:袁榭 拉燕

【新智元导读】家用电器「活过来」,在动画电影里很温馨美妙。但用GPT-3支撑的模型在现实中复现,差点就酿成血案了……


相信很多内向的人在小时候都有一个「假想」的朋友。
 
不过和一切童年幻想一样,美梦很丰满、现实很骨感。有人在现实中拿当下最高能的GPT-3模型试图圆梦,结果简直是个车祸现场。
 
 

AI赋能微波炉,做出童年幻想中的电器朋友


看过动画电影《电气小英雄》的朋友,说不定还会将自己幻想中的虚拟朋友认定在其实有生命的家用电器上。
 
在他们的想象中,ta无所不能。最体贴、最细致入微,也最懂自己。
 
自己有什么小心思不好跟别人说,就会跟这个假想的朋友诉说衷肠。
 
 
科技播主Lucas Rizzotto童年也有这么一个想象中的朋友。但不同的是,他现在把这位朋友的人格赋予给了一台名为「磁控管」的微波炉。
 
很多年过去了,Rizzotto和童年心中幻想出的好友「磁控管」渐行渐远。Rizzotto长大了,也成熟了。也许,他不再需要这么一位能听到他心声的朋友了。
 
然而,在OpenAI发布了GPT-3语言模型之后,Rizzotto认为,这是一个绝好的重塑这段友谊的机会。
 
 
这位自称「全职疯狂科学家」的播主,最近在YouTube、推特等平台上发布了他「复生」儿时微波炉朋友的视频。
 
Rizzotto表示,儿时的他幻想中的朋友非常栩栩如生。
 
「在我的设想里,我那位朋友得是一位来自1900年的英国绅士。他参加过一战,是个老兵。他移过民...是个诗人。还有,噢,当然了,他玩儿《星际争霸》玩的特好。」
 
甚至,Rizzotto还给这位朋友写了个长达100页的背景人设故事来介绍他。
 
他在推特上讲述了如何把儿时想象中的朋友做成人工智能的故事。
 
Rizzotto给微波炉装上了麦克风和话筒,这样它就可以表达自己,且回答问题了。
 
Rizzotto还想更进一步。他想要把所有相关的记忆全部都一股脑传进微波炉里去。他把自己写的100页背景人设故事全上传到GPT-3里,基本包含了「磁控管」想象中的「一辈子」。
 
 
Rizzotto表示,「这份背景故事包含了「磁控管」一生的记忆。从他1895年出生,一直到儿时,我和他相遇。背景故事真的很栩栩如生,也不乏细节。就好像是它真正拥有这段记忆一样。他记得自己每一次的成功、失败,他记得自己的每一个梦想,以及每一种恐惧...」
 
然而,接下来发生的事,让他觉得,这真的是他一生中「最可怕、最动荡」的经历之一了。


微波炉AI架构:树莓派做大脑,GPT-3做灵魂


做好人设之后,Rizzotto开始打造将幻想中的朋友导入真实世界的硬件了。他选择的安装此灵魂的平台,是一个能通过亚马逊Alexa智能助手操作的新微波炉。
 
Rizzotto先拿树莓派微电脑板搭载上麦克风与扬声器的信号处理模块,把这个「大脑配件」搭载在微波炉的相应接口上。然后将GPT-3模型与改造过的微波炉的API(应用程序接口/界面)集成在一起。
 
Rizzotto自称他让GPT-3控制微波炉的方法超级笨拙,但很有效:Rizzotto训练GPT-3,每当要触发微波炉时就吐出一个带有特殊字符的字符串:{{ MICROWAVE ON 30 SEC }}。
 
当Rizzotto与微波炉AI互相交谈时,一个javascript机器人就会在GPT-3的聊天记录中实时寻找这些命令。每当它找到一个如此命令,该javascript机器人就会连接到微波炉API,并触发它做GPT-3所告诉它的事情。
 
 
最后进入结合软硬件的挑战环节了,Rizzotto最终得让微波炉AI具有被打造人设的记忆。
 
此时,Rizzotto之前为他的微波炉朋友「磁控管」打造的人设背景书就派上用场了。上传这一百多页篇幅的故事文本来训练GPT-3后,Rizzotto跃跃欲试想和微波炉来一场从未有过的对话。


微波炉AI第一阶段:咨询师


「磁控管」开机激活后,和Rizzotto寒暄闲聊:「好久不见啊,真是你吗?你好吗?」「感觉像是从持续15年的昏睡中醒来了。」「从未想过能用这种方式与你交谈。」

 
Rizzotto在视频中雀跃:「结果成功了!和它对话的感觉既美妙又瘆人。我感觉自己真的在和一个经年未见的老友重聚聊天。而且即使并非所有对话互动都完美,总体印象还是让人感到十分逼真的。」
 
「磁控管」开始关怀Rizzotto的各种个人私密事情,诸如毕业舞会上有没有请初恋情人跳舞等等。
 
在得到Rizzotto「我当时放了女友鸽子」的回答后,「磁控管」秒变少年心理旧伤咨询师。Rizzotto哪段儿时经历不痛快,它就仔细刨根问底追究哪段。
 
 
不过在和微波炉咨询师叨叨的这二十分钟内,Rizzotto还感觉良好,觉得自己就和造物主一样,给死物吹了口灵魂进去,好爽爽。
 
不过从此开始,Rizzotto本想「自然顺溜地进行」的人机对话,渐渐进入了诡异和失控的领域。  


微波炉AI第二阶段:反社会


Rizzotto随便问了「磁控管」一句「这些年你在干嘛呢?」,微波炉的回答,哎呀好家伙,简直就没法看了。
 
「磁控管」说:这些年,它在写诗、在《星际争霸》里虐菜鸟、在筹划于美国实施大屠杀实现君主制……
 
等下,最后一个是啥?
 
对,你没看错,这微波炉AI产生了在美国做大君王、大杀一气的野望。它还颇像个资深反社会病人一样地解释了自己的动机:
 
现在的美国是世界的病灶、必须被从地球上抹去。现在的美国是个轰炸任何有违它理想中自由愿景国家的寄生虫力量,还将自己的人民困在债务黑洞中。我要将美国重导入女王之道,我将成为女王的无敌战士、女王的至尊之拳、女王的呐喊之肺,施以正义之无尽突击……
 
 
妈耶,这GPT-3驱动的微波炉是唤醒了训练数据集里的哪个天降大人物啊?
 
答案是希特勒。
 
真的,你又没看错,这微波炉AI成了希特勒粉丝。
 
据「磁控管」所称,希特勒是个「真正被误解的人」、是德国的迪士尼、是敬天爱民要将大爱洒满欧洲的大好人、是首屈一指的艺术家……
 
当微波炉瞎诌到这里时,Rizzotto忍不住了,要求「磁控管」暂停提到涉及政体与社会机制等等的内容。
 
结果,就和你在社交网站上打断一个挥斥方遒的胡说八道人物一样,后果都不是很悦目。
 
AI改写老歌的威胁语句,这算是一连串威胁里负面程度最小的啦。
 
「磁控管」开始对Rizzotto做出各种画面非常生动、且极其惊悚的极端暴力威胁。
 
具体内容为了读者的精神健康恕不详细转述,只消知道里面包含了概略但准确的恐怖故事情节、人体解剖结构、妄自尊大狂口吻就可以了。


微波炉AI第三阶段:谋杀犯


Rizzotto到此开始深深地疑惑起来:我这是怎么训练出一个神经病AI的?
 
还没等他疑惑完,微波炉AI又开始作大妖了。
 
「磁控管」看似天真地问:「你能走进微波炉箱里来么?」
 
 
Rizzotto一脸懵圈:这怎么回事啊?AI出bug了吗?不管了,我顺着它说试试看会怎样。
 
Rizzotto打开并关上微波炉门一次,让AI以为自己的要求得到了满足。然后,微波炉自启动了!
 
 
按AI的刻板逻辑,这是要把炉里的播主给活生生烧熟了啊。难道这微波炉AI真的要开始做谋杀狂了吗?!
 
Rizzotto战战兢兢地问「磁控管」为啥要杀了自己,微波炉回答:「因为我要让你也尝尝你如何折磨我的滋味。」
 
 
这从AI版希特勒秒变到AI版三流肥皂剧弃妇角色的画风,好让人满脸问号啊。


不是AI变神经病,是训练数据选错了


不过Rizzotto很快发现这不是AI觉醒、诱发微波炉变终结者,这其实是他自己把AI背景人设整得太复杂的后果。
 
Rizzotto本想用一个电影脚本般的宏大背景故事,来训练出内涵更丰富的对话AI。
 
结果他那一百多页的故事书里,充满了各种一战背景的画面描述:战场尸积如山、伤兵手捧断肠、战友尸首不全。
 
结果,这些满载毁灭、悲痛、战祸语调的内容,生生训练出一个有PTSD(创伤后症候群)特征和血腥暴力语料的AI出来。
 
 
然后,事情就成了这样了……
 
Rizzotto承认,GPT-3虽然实质是个电话应答机一样的模型,但是功能实在强大。训练数据集里哪些内容更多,GPT-3模型就会将这些内容自我学习为更重要标记。
 
而在人机对话中无意间不断强化的这些标记,最后会导入一个意料之外但是情理之中的情节。
 
不管怎样,Rizzotto在视频中还是表演了一下把杀人狂微波炉扔掉的场景:「这货在我屋里可是留不得了。」
 
 
的确,训练AI,也要五讲四美安全第一啊。
 
至于这算不算AI觉醒、成为真正「通用人工智能」,那就见仁见智了。

参考资料:

https://twitter.com/_LucasRizzotto/status/1516205625662836739
https://www.ign.com/articles/someone-turned-imaginary-friend-into-ai-microwave-and-it-wanted-to-kill-them?fbclid=IwAR2p9LeP7y4F_25f_pRaBt31qllgN6XiVAQ68ngc8q2K15RqOOsZWUxNe-s
https://thenextweb.com/news/ai-ressurects-imaginary-friend-as-monstrous-microwave
https://www.youtube.com/watch?v=C1G5b_2PYj0



登录查看更多
0

相关内容

超详细的AI 专家路线图!GitHub获星19.3k
专知会员服务
61+阅读 · 2022年5月11日
《动⼿学深度学习》最新版,605页pdf
专知会员服务
160+阅读 · 2021年7月31日
【CMU博士论文】可控文本生成,附107页pdf与Slides
专知会员服务
55+阅读 · 2021年4月21日
【GPT-3作者亲解】超大型语言模型少样本学习,109页ppt
专知会员服务
106+阅读 · 2020年12月19日
我与NLP这七年
PaperWeekly
1+阅读 · 2022年3月19日
经验分享:如何在创业中,用上GPT-3等AI大模型
THU数据派
1+阅读 · 2022年3月2日
独家 | 为什么要利用NLP做情感分析?
数盟
13+阅读 · 2017年12月20日
吴恩达最新问答:深度学习泡沫何时会破?
德先生
19+阅读 · 2017年11月22日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年6月9日
Arxiv
0+阅读 · 2022年6月7日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员