历经一个炒作周期，聊天机器人为什么还没成功？

会员服务 ·

历经一个炒作周期，聊天机器人为什么还没成功？

2018 年 6 月 13 日 网易智能菌

▼

点击上方蓝字关注网易智能

为你解读AI领域大公司大事件，新观点新应用

2016年，我们说，机器人模式的转变将比过去十年从网络向移动应用的转变更具破坏性和趣味性。我们相信，聊天机器人是下一个即将发生的大事件。

当时，我们的期望很高，并认为这个行业已经成熟，并且翘首以待迎接新的创新时代：是时候开始与机器进行社交了。

那人类又何乐而不为呢？所有的预测都表示未来将会非常成功。

在2017年的世界移动通信大会上，聊天机器人是主要的头条新闻。会议组织者引用在“品牌和企业对聊天机器人的关注不可避免地转移”的情况下，“压倒性的认可”。

事实上，关于聊天机器人的唯一重要问题是谁会垄断这个领域，而不是聊天机器人是否会首先突然成功。一个单一的平台是否将会出现并占领聊天机器人以及个人助理生态系统中呢？

一年过去了，我们对这个问题有了答案吗？

然而并没有，因为没有一个生态系统可以使一个平台占据主导地位。

被另一个炒作周期愚弄

聊天机器人并不是第一个被堂而皇之谈论而后突然暴跌的技术性发展。这个古老的炒作周期以熟悉的方式展开。

一些意见领袖在写了一些非常严肃的文章，称硅谷十分看好与智能自动化对话的前景，各种信息也开始充斥聊天机器人。Slack经历了指数级增长，甚至还推出一个面向聊天机器人投资的基金。

期望逐渐建立，建立，然后……一切都失败了。预测并没有成为现实。

我们回顾了我们令人窒息的乐观情绪，然后向彼此求助，如今有点困惑：“是吗？这就是我们所期待的聊天机器人革命吗？”

Digit的伊桑·布洛赫总结了普遍的共识：“我甚至不确定我们是否可以说'聊天机器人已经走到尽头'，因为我甚至不知道它们是否曾经活过。”

Heap负责产品设计的副总裁戴夫·费尔德曼说，聊天机器人不仅仅是遇到一个问题但失败了：它们承担了几个任务，而且都失败了。

文本vs语言vs.GUI：一段显著的历史

机器人可以通过不同的方式与用户交互。最大的区别是文本和语言。在（计算机接口）开始的时候是（书面的）单词，用户必须手动输入命令才能完成任何操作。然后，图形用户界面（GUI）出现并挽救了局面。我们被窗户、鼠标点击和图标所吸引。嘿，我们最终也提取到了颜色！

与此同时，一群研究科学家正忙着开发与数据库发的自然语言（NL）接口，而不是必须学习一种晦涩难懂的数据库查询语言。另一群科学家正在开发语音处理软件，这样你就可以直接和你的电脑说话，而不必打字。

事实证明，这比任何人最初意识到的要困难得多，有这么多不同的口音，人们可能说话太快或太慢，只是喃喃自语。

你说过“recognise speech”或“wreck a nice beach”吗？

议程上的下一个项目是与一台机器进行双向对话。这里有一个示例对话框（可以追溯到20世纪90年代）和VCR安装系统：

用户：“你好。”

机器人：“你好，你叫什么名字？”

用户：“Candy。”

机器人：“你好，Candy！”

用户：“让我们设定时钟。”

机器人：“现在几点了？”

用户：“时间是上午11点。”

机器人把时钟拨到上午11点。

很酷，对吧？系统以协作的方式进行转换，并且以聪明的方式确定用户需求。它是精心制作的，用来处理涉及录像机的谈话，而且只能在严格的限制下进行操作。

现代的机器人，不管它们需要打字还是语音输入，都必须面对所有这些挑战，但也要在各种平台上以一种高效、弹性的方式工作。基本上，我们仍在努力实现类似30年之前的突破创新。

然而，以下是我们出现偏差的地方：

从机器人与应用的角度思考问题

一个超大的假设是，APP已经“结束”，将被机器人取代。通过将两个截然不同的概念相互对立（而不是将它们看作是为不同目的而设计的独立实体），我们鼓励机器人开发。你可能还记得十年前当应用首次出现时，类似的战斗口号：但你还记得当应用程序（APP）取代互联网的时候吗？据说，一种新产品或新服务需要满足以下两个要求：更好、更便宜或更快。聊天机器人比应用程序更便宜或者更快吗？不，至少现在还没有。

他们是否“更好”是主观的，但我认为更合理地来讲，当今最好的机器人无法与当今最好的应用相提并论。此外，没有人认为使用Lyft过于复杂，或者在应用程序上订购食物或购买裙子太难。太复杂的是尝试让机器人完成这些任务——并且让机器人失败。

一个伟大的机器人可以和普通的应用程序一样有用。当涉及到丰富、复杂、多层次的应用程序时，就没有竞争了。这是因为机器让我们能够访问庞大而复杂的信息系统，早期的图形信息系统在帮助我们定位这些系统方面取得了革命性的进步。现代的应用程序受益于数十年的研究和实验。那我们为什么要把它丢掉呢？

但是，如果我们把“替换”这个词换成“扩展”，事情就会变得有趣多了。今天最成功的机器人体验采用了一种混合工艺的方式，将聊天融入更广泛的战略之中，同时包含更多的传统元素。

从以上图片中看出，佩妮在传统的账户控制面板和交易列表旁边提供了一些很好的建议和提醒。

HubSpot对话系统将Facebook Messenger、现场聊天、社交媒体、电子邮件和其他消息渠道统一为一个共享收件箱。

Layer给开发者提供了工具，从而可以在移动网络和桌面web以及原生应用上创建个性化的消息传递体验。

下一波将是多模式应用，你可以在这里说出你想要的（比如Siri），然后通过地图、文本，甚至是语音回复的方式收到信息。

为机器人而出现的机器人

我的产品需要机器人吗？现有的平台是否能够支持其功能？我是否有足够的耐心去建造一个能够做我想做的事情的机器人？

大肆宣传的另一个问题是，它往往会绕过像这样的基本问题。对于很多公司来说，机器人并不是一个正确的解决方案。在过去的两年里，机器人被盲目地应用于没必要的问题之上。为了建造机器人而建造机器人，让它自由进展，并期待最好的结果永远不会有好结果。

图：完全必要的Maroon 5聊天机器人图

绝大多数的机器人都是使用决策树逻辑构建的，在这个逻辑中，bot的响应依赖于在用户输入中发现特定的关键字。这种方法的优点是，很容易列出它们被设计用来覆盖所有的情况。这也是他们的劣势所在。这是因为这些机器人纯粹是对他们设计者的能力、一丝不苟以及耐心的反映，以及对他们能够预见到的用户需求和投入的反映。当生活拒绝使用它们时，问题就出现了。

根据最近的报道，在Facebook Messenger上的10万个机器人中，70%不能完成简单的用户请求。这在一定程度上是由于开发人员无法将他们的机器人专注于一个优势的焦点领域。当我们在建造“咆哮机器人”时，尽管人们可能会对潜在的资本问题感到过度担忧，但是我们决定专门针对销售和市场营销人员进行设计：而不是使其成为一个“全能选手”。

记住：能很好完成一件事的机器人比一个能做多件事的机器人更有帮助。

不可接近性

一个有能力的开发人员可以在几分钟内构建一个基本的机器人——但是一个可以进行对话的机器人呢？这是另一个故事。尽管围绕人工智能的炒作不断，但我们要做出任何类似人类的东西还有很长的路要走。在一个理想的世界中，NLP（自然语言处理）的技术应该帮助聊天机器人理解它所接收到的消息。但是NLP只是刚刚从研究实验室起步，而且还处于起步阶段。有些平台提供了一些NLP，但即使是最好的平台也能达到“孩子的水平”（例如，想想Siri理解单词，但是不理解他们的意思）。正如Matt Asay概述的那样，这导致了另一个问题的出现：未能抓住开发人员的注意力和创造力。

“除非机器智能能够接近人类智能，否则消费者的兴趣永远不会实现。”用户的兴趣取决于人工智能，这使得与机器人对话对消费者来说是有值得的。”

今天基于规则的对话系统过于脆弱，无法应对这种不可预测性，而使用机器学习的统计方法也同样有限。人工智能对话所需的人工智能水平目前来说还不具备。与此同时，很少有高质量的机器人引领潮流。就如戴夫费尔德曼评论道：

“Slack、Facebook、谷歌、微软、Kik和其他公司是否应该打造自己的内置机器人来引领这一发展？”他们是否应该更积极地利用他们的机器人基金和孵化器，雇佣导师来教育参与者，或者提供工程和设计资源？在高知名度的合作伙伴中资助战略机器人计划呢？在我看来绝对是的。当涉及到平台时，开发人员是用户；我们不依赖于用户来理解为何或如何使用我们的产品。我们必须向他们展示。”

GUI不应该被忽略

曾几何时，与计算机交互的唯一方法就是在终端上输入晦涩的命令。使用Windows、图标或鼠标的可视化界面是我们操作信息的一场革命。计算从基于文本的到图形用户界面（gui）的转换是有原因的。在输入端，点击比输入更容易，也更快捷。点击或选择显然比输入整句话更可取，即使是具有预测性（通常容易出错）的文本也是如此。在输出端，有句老话说，一张图片值一千个字，这句话通常是正确的。

由于我们是高度可视化的生物，所以我们可以看到信息的光学显示。孩子们喜欢触屏，这并非偶然。构思图形界面的先驱者们受到了认知心理学以及关于大脑如何处理沟通研究的启发。对话式的用户界面是为了复制人类喜爱的交流方式，但最终需要额外的认知努力。从本质上讲，我们将一些简单的东西替换为更复杂的选择。

当然，有些概念是我们只能用语言表达的（“向我展示通往博物馆的所有方法，让我走2000，但不需要超过35分钟”），但是大多数任务可以使用gui更高效、更直观地完成，而不是使用对话式的UI来完成。

人类喜欢与人交谈

在业务交互中，针对人的维度是有意义的。如果有一件事是将销售和市场营销分裂的，那就是缺乏人性：在彩票号码、反馈表格、“不回复邮件”、“自动回复”和“联系我们”的表格后面所隐藏的是品牌。Facebook的目标是，他们的机器人应该通过所谓的图灵测试，这意味着你无法判断你是在和机器人还是人类对话。但是机器人和人类是不一样的。它永远不会。对话所包含的不仅仅是文本。人类可以理解字里行间的寓意，利用语境信息，理解深层次含义，比如讽刺。但是，机器人很快就会忘记它们在说什么，这意味着它有点像和一个短期记忆或几乎没有记忆的人交谈。

正如HubSpot团队所指出的：

机器人提供了一种可扩展的方式，可以与买家进行一对一的互动。然而，当他们没能提供一种高效、令人愉快的体验时，他们就会失败，因为人们习惯于在消息应用中与他人进行复杂的、多层次的对话。

人们不容易上当受骗，同时，假装机器人是人类，肯定会减少回报（更不用说你对用户撒谎的情况了）。而且，即使是那些稀有的机器人是由最先进的NLP驱动、擅长处理并生产内容，相比之下也会相形见绌。

这是另一件事。对话式的交互界面是为了复制人类喜欢与他人进行交流的方式——并应用于与其他人类的交流之中。但这是人类更喜欢与机器互动的方式吗？不一定。在一天结束的时候，没有多少机智的妙语或类似于人类习惯可以将机器人从失败的对话中拯救出来。

我们目前会朝什么方向发展？

在某种程度上，那些早期采用者并不是完全错误的。人们在家里要求谷歌播放他们最喜欢的歌曲，从Domino的机器人上订购披萨，并从丝芙兰那里得到一些化妆提示。但就消费者的反应和开发者的参与度而言，聊天机器人并没有达到2015或2016年左右所宣扬的宣传效果。甚至连接近都达不到。

计算机的功能没有问题。搜索数据，分析数据，分析观点，压缩信息。计算机不擅长理解人类的情感。NLP的状态意味着他们仍然没有得到我们所想要的东西，更没有将我们的感受考虑进去。这就是为什么我们仍然无法想象有效的客户支持、销售或营销，而不需要人类基本接触，即移情和情商的情景是什么样子的。

目前，机器人可以继续帮助我们处理自动化、重复、低层次的任务和查询工作；同时，在一个更大、更复杂的系统中承担销售成本的作用。由于我们期待太多，要求过急，对他们以及我们都造成了伤害。但这并不是故事的全部。是的，我们的行业严重高估了聊天机器人的初始影响效应。

正如比尔盖茨曾经说过的：

我们总是高估接下来两年将要发生的变化，同时低估接下来10年将要发生的变化。

不要让自己陷入一种不作为的境地。

炒作已经结束。这是一件好事。现在，我们可以开始检查中间的灰色区域，而不是那些过度膨胀、疯狂的黑白极端区域。我相信我们正处于爆炸性增长的开端。这种反高潮的感觉对于转换技术来说是完全正常的。消息传递将继续吸引用户。聊天机器人不会消失。NLP和人工智能每天都在变得越来越复杂。开发人员、应用程序和平台将持续试验，并大量投资于会话式营销。我迫不及待地想看看接下来会发生什么。

（选自：medium 编译：网易智能参与：Sarah）

网易智能

聚焦AI 读懂下一个大时代

长按扫码关注我们