会员服务 ·

AI空谈情怀，也是要输的 | 人机辩论大战

2019 年 2 月 12 日 量子位

郭一璞夏乙假装发自旧金山
量子位报道 | 公众号 QbitAI

蓝色的舞台上，正中间立着一块黑色的面板，面板上蓝色的扁圆形屏幕正在闪动，后面传出冷静而理性的女声。

而右侧的讲台上，一位西装革履的小哥正在聆听这个面板的“演讲”，时而动笔记录，时而面色凝重，时而嘴角露出邪魅一笑，看起来信心满满，胸有成竹。

这是IBM的AI与人类冠军辩手的对决，也是今年Think 2019大会的一个环节。

人机大战的一方是IBM的的AI，Project Debater，那块黑色面板就是它在人间的载体。去年6月，它击败了2016以色列全国辩论冠军Noa Ovadia，创下了AI在辩论方面击败人类的历史记录。

△ 左为Project Debater，右为哈利什

另一方则是2012年欧洲辩论冠军哈利什·纳塔拉（Harish Natarajan），一位牛津本、剑桥硕的学霸，本科主修政治、哲学、经济（PPE）专业，因此他也是英国前首相卡梅伦的学弟；硕士则在研究哲学和国际关系；现在则是AKE咨询公司的经济风险主管。

谁胜谁败？由现场观众的选票决定。

这场辩论的规则比较简单，拿到辩题后，双方各有15分钟的时间进行准备，提出自己的论点和可以反驳对方的论据；

正式开始后，双方各有4分钟的时间进行开场立论，之后各有4分钟时间进行驳论，最后各有2分钟时间进行总结；

而场下的观众评审则是由湾区学校里的顶尖辩手和100多名记者组成，在辩论开始前和开始之后，观众评审们各进行一次投票，选出自己支持的观点，辩论后观点支持人数增加的一方获胜，另一方失败。

直击人机辩论

主持人送出一句“May the best debater win”的祝福，人类辩手出场，Project Debater“站”在台上静静等待。

他们今天的辩题，也算关乎人类的未来，起码关乎下一代：

We should subsidize preschool。

我们应该资助幼儿园。

正方：AI辩手，反方：人类代表哈利什。

AI认为，资助幼儿园这不仅仅是个经济问题，也是道德和政治问题。她的观点可以归结为三个方面：资助幼儿园能帮儿童摆脱贫穷、有助于后续的学业，甚至还能节约医疗开支、降低犯罪率。

从立论陈述到总结陈词，AI都旁征博引：

为了说明高质量幼儿园能让孩子在之后的学业上表现更好，她引用了杜克大学的一项研究；

为了说明幼儿园和犯罪率之间的关系，她拿来新泽西州的案例，还用了好几次“大量研究表明”，列举了不少数据；最后的总结，还用上了人类作文要诀——名人名言。

人类代表哈利什也说，AI提供了丰富的信息，列举了很多事实和数据。

而他的辩论风格和AI截然不同，人类辩手当然不能和一台电脑比拼查资料举例论证的能力。

哈利什选择抓住弱点反驳，再谈现实状况。他抓住的弱点，是AI反复论证的“拯救贫穷”，谈的显示状况，是政府的钱是有限的，投资了幼儿园就要耽误其他方面。

他说，投资幼儿园帮不了最贫穷的人，而是那些本来无论如何也要送孩子去幼儿园的中产。而“良好的幼儿园”带来的那些好处，一来只是推论，二来也不是穷人能享受得到的。

所以，还不如花在更实在的地方。

这场辩论充满反差感。AI动之以情，讲人文关怀和人类尊严；人类晓之以理，谈政府要认清现实精打细算。

在驳论环节的最后，AI甚至还学会了“升华”。她（对，官方给定义了性别）说：资助幼儿园事关basic human decency，人类基本尊严。

在围观了整个过程的量子位看来，“人类基本尊严”由黑色面板背后的冷静女声说出来，现场观众大概不会有什么共鸣。AI虽然打着感情牌，整体辩论风格却是充满英美老牌报刊的气息，如同托福高分作文一般，讲论点列论据。

而人类代表抑扬顿挫，有一丝丝网络论坛上流传的阴谋论味道：别听她的，能得到好处的，还是那群中产！

我们节选了开场环节的视频，来一起领略一下AI与人类的辩论：

最终，旁征博引谈人类尊严的AI还是输给了抓住漏洞狠狠攻击的人类。

辩论开始前，现场79%的观众支持投资幼儿园，而20分钟辩论过后的第二轮投票，支持者只剩下62%。

人类冠军说服了17%的观众。

best debater，属于人类代表哈利什。

主持人在公布结果、恭喜人类辩手时，甚至一度口误，把“congratulations to him”说成了“to them”。

“带路党”哈利什

虽然取得了本场人机大战的胜利，哈利什却是个AI带路党。他认为在不久的将来，AI的辩论水平总会比人强。

在赛后采访中，他说，AI根据论点来引用论据、统计数据的能力让他印象深刻，Project Debater如果和人类的能力结合起来，潜力巨大。

哈利什认为，相比象棋、围棋、星际2这些项目，机器想在辩论上赢过人类要难得多。在辩论赛中取胜，需要三个条件：

一，辩手需要巨大的信息量支持，并将这些信息组成支持己方观点的论点；
二，辩手必须将复杂的论点用清晰、有条理的方式讲出来；
三，辩手需要让观众认同这些论点至关重要。

也就是说，整个辩论的过程中，辩手需要谨慎的发言，表达情感，使用修辞，恰当举例。机器很容易在第一点中胜过人类，它可以方便的获取大量信息，并组成论点；但第二点和第三点对机器来说非常具有挑战性。

虽然难度很大，不过哈利什还是觉得未来会有AI在这三个方面都能超越人类。

AI是怎么辩论的

辩论，需要收集信息、形成结构化论点、再用精确的语言表达出来，要清晰，要有说服力。

面对现场辩论中的陌生辩题，Project Debater需要几分钟的时间来做准备。

整个过程，从搜寻资料开始。她会为了立论陈述从语料库中搜寻有用的短文本，找出几百条相关的片段。

下一步，就是根据这些片段，构建出强力、丰富的论据，来支撑要谈的观点。移除冗余信息，选择最强的语句和证据，根据主题把它们组织起来，构成叙述的基础。

几分钟时间准备好4分钟立论陈述之后，Project Debater还要听取对手发言，准备驳论。

这个过程无论是对人类来说，还是对机器来说都很难。作为一个AI，Project Debater需要识别对手的论点和论据，寻找论点论据来回应它们。

和人类冠军面对面的Project Debater，从2014年就开始为此准备了。

它自带一个庞大的知识库，从报纸杂志摘录了100亿个句子，还具备理解和生成语言的能力，还用知识图谱来寻找辩题背后隐含的悖论。

从项目开始到现在，Project Debater团队发表了30多篇论文，还开放了一个数据集。

花这么长时间培养一个会辩论的AI，有什么用？IBM说，它可以帮网上各种论坛、评论区的辩论变得更文明更有营养，还能帮律师准备庭审资料，甚至能在金融领域辅助投资决策。

负责说话的那个女声，更是可以用到各种各样的领域。

离开爸爸保护的AI辩手

去年六月的那场辩论赛，人类高手输给了Project Debater。

不过，当时的观众评审是一群自带利益相关体质的IBM研究员，也就是Project Debater的爸爸。

比赛进行了两场，第一场是Project Debater对战2016年以色列全国辩论冠军Noa Ovadia，讨论“我们是否应当资助太空探索”，Project Debater为正方，Noa Ovadia为反方。

第二场则是Project Debater对战另一位以色列辩论专家Dan Zafrir，讨论“我们是否应当更多的使用远程医疗”，依然是Project Debater正方，人类反方。

当时的两场辩论赛中，Project Debater的语言表达相对生硬，但传递出的信息量更大，Project Debater说服的观众更多一些——当然，负责投票的观众们是Project Debater的“爸爸”，毕竟是自家儿子，投票的时候也可能偏心了。

传送门

关于Project Debater的论文合辑
https://www.research.ibm.com/artificial-intelligence/project-debater/research.html

— 完 —

加入社群

量子位现开放「AI+行业」社群，面向AI行业相关从业者，技术、产品等人员，根据所在行业可选择相应行业社群，在量子位公众号（QbitAI）对话界面回复关键词“行业群”，获取入群方式。行业群会有审核，敬请谅解。

此外，量子位AI社群正在招募，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式。

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

登录查看更多

相关内容

AI与人

关注 0

AI对人的影响，利弊未知，众说纷纭。

【DeepMind硬核课】深度学习自然语言处理前沿进展，附103页ppt

专知会员服务

135+阅读 · 2020年6月28日

商业数据分析，39页ppt

专知会员服务

165+阅读 · 2020年6月2日

麻省理工学院MIT马丁信托创业中心创业知识库，218页干货内容教你创业三十六计

专知会员服务

52+阅读 · 2020年4月30日

简明扼要！Python教程手册，206页pdf

专知会员服务

48+阅读 · 2020年3月24日

【马老师推荐】阿里巴巴-浙江大学医学院附属第一医院《新冠肺炎防治手册》

专知会员服务

19+阅读 · 2020年3月23日

【调查研究】人工智能在预防与治疗新冠状病毒中起到多大作用？

专知会员服务

61+阅读 · 2020年3月10日

人类语言技术展望，中国科学院自动化研究所研究员宗成庆

专知会员服务

48+阅读 · 2020年2月15日

武汉疾控中心编撰《新型冠状病毒肺炎预防手册》，108页ppt学习掌握科学知识守护你我(附下载)

专知会员服务

37+阅读 · 2020年1月23日

【大佬约架】Yoshua Bengio与Gary Marcus之圣诞AI论战「 AI 之道」，附视频地址与slides下载

专知会员服务

24+阅读 · 2019年12月25日

【O'Reilly AI Conference 2019】让Alexa和Siri互相交流（Make Alexa and Siri speak with each other: Toward a universal grammar in AI），whoelse.ai创始人， Tobias

专知会员服务

5+阅读 · 2019年11月6日

剑桥女博士创立情绪识别 AI 公司，帮助自闭症患者理解他人表情

程序人生

5+阅读 · 2019年9月16日

钱炜：与山同坐，成为灯塔

罗辑思维

16+阅读 · 2019年6月30日

吴恩达“官宣”荣升准爸爸~

AI100

4+阅读 · 2019年1月18日

美国顶尖 AI+教育公司，都在研究些什么？

硅谷第一线

4+阅读 · 2019年1月18日

「AI寒冬论」| 风未停，猪未醒

线性资本

4+阅读 · 2018年8月27日

机器创作不可避免，用AI打造新《格林童话》的Botnik还想守住文化

机器之能

3+阅读 · 2018年5月5日

徐小平：区块链革命到来，这是一场顺我者昌，逆我者亡的伟大技术革命

云头条

4+阅读 · 2018年1月9日

人工智能的阴暗面

计算机与网络安全

6+阅读 · 2018年1月8日

古代荀子也懂AI？达芬奇的手术机器人有多神奇? 听浙大吴飞扒一扒人工智能的“古今中外”！

AI100

3+阅读 · 2017年11月26日

为国庆献礼：无人智能系统，守护祖国海空长城

深度学习大讲堂

7+阅读 · 2017年10月2日

Message Passing for Complex Question Answering over Knowledge Graphs

Arxiv

6+阅读 · 2019年8月19日

ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

Arxiv

10+阅读 · 2018年12月11日

Hypernetwork Knowledge Graph Embeddings

Arxiv

9+阅读 · 2018年10月18日

Semantically Enhanced Models for Commonsense Knowledge Acquisition

Arxiv

3+阅读 · 2018年9月27日

Unsupervised Multilingual Word Embeddings

Arxiv

3+阅读 · 2018年8月27日

Efficient and Effective $L_0$ Feature Selection

Arxiv

5+阅读 · 2018年8月7日

Tiny-DSOD: Lightweight Object Detection for Resource-Restricted Usages

Arxiv

5+阅读 · 2018年7月29日

Differential Attention for Visual Question Answering

Arxiv

5+阅读 · 2018年4月3日

Baselines and test data for cross-lingual inference

Arxiv

3+阅读 · 2018年3月2日

A Comparison of Word Embeddings for the Biomedical Natural Language Processing

Arxiv

3+阅读 · 2018年2月1日

VIP会员

AI空谈情怀，也是要输的 | 人机辩论大战

郭一璞 夏乙 假装发自 旧金山量子位 报道 | 公众号 QbitAI

△ 左为Project Debater，右为哈利什

直击人机辩论

“带路党”哈利什

AI是怎么辩论的

离开爸爸保护的AI辩手

传送门

相关内容

郭一璞夏乙假装发自旧金山
量子位报道 | 公众号 QbitAI