失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音

2020 年 1 月 21 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

本文授权转载自:大数据文摘

作者:牛婉杨


「爱人离世,你会把TA的记忆交给AI吗?

 

《奇葩说》的这期辩题似乎在探讨一个离我们仍遥远的科幻话题,但去年9月,阿里巴巴人工智能实验室真的接到了这样一个请求。


 

请求帮助的是一位上海妈妈,她的女儿因患T淋巴母细胞性淋巴瘤离世,年仅14岁。


怀抱着太多孩子生前未能实现的遗憾,这位妈妈决定将女儿做成“AI”,用另一种方式缅怀她。去年9月,她尝试在微博向阿里巴巴人工智能实验室发出了这条消息。


“可以把我故去的女儿做成和我互动的软件吗?”


没想到,这条求助很快有了回应


三个月的时间让失独妈妈重新听见女儿


考虑许久,阿里巴巴人工智能实验室负责人、语音助手首席科学家聂再清接受了这位妈妈的求助。


单从技术角度考虑,在足够的语料数据和算法的加持下,通过目前的语音合成技术,“复制”一个虚拟人的难度并不大。


聂再清称,目前的技术条件下,通过个性化语音合成技术以及对话技术,需要大概十分钟的、特别干净的音频信号,就能够让我们的机器进行学习。


但对阿里人工智能团队而言,帮这位妈妈重现女儿的音容,面对的不只是技术难点。


首先,最大的技术问题是可用语料不足。要实现语音合成必须给算法提供大量可供训练的素材,但女儿生前留下的语音素材并不多,而且能提供的多是用智能手机录下的视频,大多环境嘈杂。据阿里团队称,所有的片段加在一起,能够用作训练的语音素材,只有短短的两三分钟。


这就让训练难度变得极大。因此,聂再清告诉求助者,凭借现有的技术很难达到她心中理想的效果,而这也就意味着,无论技术团队如何攻坚,AI终究不是“真实”的女儿。


其次,除了语音合成,聂再清团队也坦诚向她表达了对“AI女儿”认知上的担忧。当妈妈问出一个问题,“AI女儿”是否能够以女儿的认知水平和价值观来回答,在这方面,技术难度较大。


另外,市面现有的语音助手,例如siri和天猫精灵,当输入的语言超过AI的理解范围时,它的设定是去网络检索一个最接近的回答进行反馈,这就存在很大的不可控性。比如上个月,亚马逊的语音助手Alexa就因为从维基百科中提取到了一些恶意文本,劝主人“自杀”,对英国一位29岁的医生丹妮说出了“用尖刀刺入心脏”这样可怕的话。


为这位妈妈做出的“AI女儿”,也因此会存在回应的随机性,这很有可能在某些情况下冒犯到她和她的家人。


了解了可能面对的风险后,这位妈妈和她的丈夫还是坚持了最初的想法,她表示不在乎虚拟女儿偶尔的“冒犯”,这是成长期孩子最正常的表现。之后,他们配合技术团队列出了女儿生前感兴趣的话题,希望在这些话题下进行训练,确保在某种程度上,虚拟女儿的回答是可控的。


除了技术难点,阿里的工程师也就此与罗汉堂专家,以及外部的心理学家在技术之外的可能性上展开了探讨。三个月后,他们终于输出了一份小成果,帮助这位妈妈合成了一段女儿长达20秒的语音,存在了天猫精灵里。


这段语音复原了女儿写的一篇作文,记录了她和妈妈一起去爬山的故事。


图片来自《人物》


尽管最终做出的音频样本与设想还有一些差距,但妈妈表示,音频开头的语气,和女儿几乎一模一样。


关于具体的研发过程、算法实现等,大数据文摘尝试采访阿里巴巴相关负责人。但阿里表示,现阶段仍不希望在过多的聚焦在技术细节上,他们也担忧在相关伦理探讨更清晰前,这一举动会被模仿。


美国记者自学代码,让去世的父亲在手机中复活


想要用人工智能留住逝去的亲人,这位上海失独妈妈并不是第一例。


2016年,一位美国记者James Vlahos的父亲查出肺癌晚期,悲痛的他想要尽可能留住自己与父亲的记忆。

 


James突然冒出了一个疯狂的想法:与其将这些信息存在纸上,不如利用AI让它们活过来,他决定开发Dadbot——拥有父亲记忆的聊天机器人。


James首先说服了自己的家人与父亲本人,老爷子对此意外的没有任何抵触,同时还觉得很酷。于是James让父亲在生前最后几个月讲述其生平故事。


接下来他开始攻克技术难关,自学代码,利用AI公司Pull String的开源软件进行开发。其中包括140多个相关的问题词条,并用多达9万个词的语料库训练AI。


最终,赶在父亲离世前,他完成了一个为父亲量身定制的人工智能程序,当他和家人想父亲时,就打开这个程序聊几句,这给他和他的家人莫大安慰。


-老爹,你在吗?
-机器人会休息吗?傻小子。


在James心中,这还差的很远,他要的不是智能的语音助手,而是那种与父亲交流时的熟悉感。但显然,9万字的生平记录也无法填充一个真实的灵魂,于是他不得不为父亲重新制作了一块更大的“记忆拼图”。


新的问题框架更为庞大详细,这些问题涵盖了父亲的父母,他的童年时光,学生时期,与母亲的甜蜜邂逅,职业的选择等。另外聊天机器人的训练极为枯燥,据James介绍,他只能频繁的与其交流,让Dadbot能够理解每句话的含义。同时要寻找BUG,很多词汇机器人并不理解,需要他手动调整。为此他经常拉着全家人和Dadbot聊天,全方位的“轰炸”这位AI老爸。


这段时期对于James来说也非常难熬。他不确定自己是否扭曲了对父亲的感情,也很犹豫Dadbot设定应该无限趋于真实的父亲,亦或是仅仅作为一个回忆道具。


Dadbot在成长的同时,父亲的生命也在流逝。好在功夫不负有心人,随着技术提升与不断的调整测试,Dadbot最终在父亲临终前拥有了一定的智能表现,聊天不再是一问一答的独白,更像是有思维的对话。


当前技术的迅速发展让这种“复制”技术的门槛迅速降低,也许很快,不止技术机构,很多非专业人员通过自学也能够完成。


去年热播日剧《轮到你了》中,男主角就通过大量的照片和聊天记录,复原了去世的女主,在手机里创造了一只“菜奈AI”。TA能够用女主的声音和语气与人对话,成为了男主案件调查过程中的最大安慰。受其启发,有不少网友也分享了如何通过风格迁移等方式,让机器模仿自己的话语,制作一个AI版自己。


日前,78岁的美国间谍小说家、好莱坞编剧安德鲁·卡普兰已同意成为“AndyBot”——一个数字人,他将在云上永生数百年,甚至数千年。如果一切按照计划进行,未来几代人将能够使用移动设备或智能语音计算平台与他互动,即使在他的肉身去世很久之后,仍能得到他一生经验的宝贵建议。



但是,这样的举动是否存在伦理问题和法律风险?其所属权如何定义?针对逝者的留存数据归谁所有的问题,文摘菌也咨询了相关专家,其表示“逝者虚拟化”仍然是一个非常新的技术领域,和目前法律界已有相对成熟共识的“克隆人”以及“AI人格”议题都不太一致,当前法律界还没有一个定论。


如果用AI“还原”已逝亲人正成为一种作用于失独家庭的新可能,那么需要首先确定的是,如何让它成为辅助疗愈的手段,而不是让失去亲人的人沉溺在被技术还原的陪伴中,影响真正意义上的康复。


在开头提到的《奇葩说》辩题中,六位辩手用了近两个小时的时间,去探讨“还原”已逝亲人是会治愈我们,还是会令我们跌入思念的深渊。当前技术条件下,尽管被“复活”的AI目前只能完成一些微弱的功能,距离科幻片中的场景还有很大距离,但依然值得更广泛的讨论。


和所有的技术一样,AI最终仍要作用于人。如何在智能和人性中实现平衡,是一道永恒的命题。


而面对这一问题,这位想要复活女儿的妈妈早已有了自己的判断。


“尽管技术的完善需要时间,但已经给人带来了希望,这是最重要的。


相关报道:

https://mp.weixin.qq.com/s/gY_KetYopg-FZZ8BXaUwvA
https://www.cnblogs.com/SlashOut/p/10948998.html
https://www.bilibili.com/video/av83723889/?redirectFrom=h5

重磅!CVer-学术交流群已成立


扫码可添加CVer助手,可申请加入CVer大群和细分方向群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索等群。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

麻烦给我一个在看!

登录查看更多
0

相关内容

聂再清,清华大学国强教授、智能产业研究院首席研究员、大数据智能实验室主任。曾任微软亚洲研究院首席研究员、微软学术搜索和人立方的发起人和负责人、自然语言理解平台LUIS技术负责人。发明的知识图谱相关技术等广泛应用于互联网搜索引擎、聊天机器人等领域。在阿里巴巴人工智能实验室担任北京负责人和阿里巴巴天猫精灵首席科学家期间,带领团队从无到有实现了天猫精灵相关算法研发和创新工作。
【2020新书】社交媒体挖掘,212pdf,Mining Social Media
专知会员服务
60+阅读 · 2020年7月30日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
76+阅读 · 2020年5月24日
专知会员服务
30+阅读 · 2020年5月20日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
听完了1000+首古风歌曲,我发现自己也能火
PingWest品玩
4+阅读 · 2019年6月2日
程序猿的终极噩梦,祖传代码,一动,修半年!
九章算法
4+阅读 · 2018年12月20日
抖音完了!这次道歉也没用了
今日互联网头条
9+阅读 · 2018年7月2日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
Phase-aware Speech Enhancement with Deep Complex U-Net
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Arxiv
5+阅读 · 2018年3月28日
VIP会员
相关VIP内容
【2020新书】社交媒体挖掘,212pdf,Mining Social Media
专知会员服务
60+阅读 · 2020年7月30日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
76+阅读 · 2020年5月24日
专知会员服务
30+阅读 · 2020年5月20日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
相关资讯
听完了1000+首古风歌曲,我发现自己也能火
PingWest品玩
4+阅读 · 2019年6月2日
程序猿的终极噩梦,祖传代码,一动,修半年!
九章算法
4+阅读 · 2018年12月20日
抖音完了!这次道歉也没用了
今日互联网头条
9+阅读 · 2018年7月2日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
相关论文
Top
微信扫码咨询专知VIP会员