前沿 | 人工智能的下一个巨大挑战:理解语言的细微差别

2018 年 9 月 24 日 MOOC

 | 全文共2861字,建议阅读时4分钟 |


本文由微信公众号 「AI前线」原创,(ID:ai-front)

作者:James Yang

译者: Sambodhi Liu


导读: 人类语言非常博大精妙,经常同一句话在不同的语境下,就有不同的含义,连人类有时候都不能辨别其中细微的差别,机器能吗?而这,就是人工智能的下一个巨大挑战:理解语言的细微差别。

 

语言是人类独有的能力,是我们智慧的体现。但是通过人工智能(我们为机器提供语言能力的 NLP)为我们如何使用语言打开了一个新的可能性领域。


今天,你可以走进昏暗的起居室,让 Alexa 把智能灯的亮度调到 75%。或者,你可以让 Alexa 告诉你世界另一端的天气状况。在 Google 最近的 Duplex 演示中展示了该行业最近的进展情况,AI 智能体进行商务呼叫或者预定约会。曾经存在于科幻小说里的幻想在今天变成了现实,但为了能够保持真正让人满意的人机关系,机器必须能够进行更为直观、更有语境和更加自然的对话——这仍然是一个挑战。自我参加工作以来,一直研究 NLP 技术。NLP 这个研究领域,和人工智能本身一样古老,而我们仍然处在这个旅程的起步阶段。


语言是共享信息并与我们周围的人联系的机制,但是机器需要理解语言的复杂之处,以及我们作为人类,如何交流才能使用语言。在情感分析、问答系统和联合多任务学习方面的进步,是人工智能得以能够真正理解人类和我们沟通的方式。


情感分析


语言从本质上来说就很难。语言在不断进化,非常微妙,一般人想熟练掌握语言,没有几年的功夫是不可能的。通过情感分析,我们可以使用人工智能来理解关于特定陈述的某些事情,如品牌介绍、电影评论是正面的、负面的还是中立的。但我们也可以弄清楚讲者的态度和意图(是否生气了?快乐吗?感到惊讶吗?要准备买吗?)。从客户服务到在线社区审核,再到算法交易,通过及时分析成千上万的推文或数百条产品评论,了解公众对一个品牌的看法,对企业来说,是非常有价值的。


情感分析已经存在了一段时间,但它并不总是非常准确。然而,随着 NLP 技术的进步,这种情况正在发生改变。在我担任 Salesforce 的首席科学家时,我们的 Einstein AI 服务就能够让品牌厂商从聊天中实时分析电子邮件、社交媒体和文本中的情绪,以便提供更好的客户体验。例如,准确的情感分析允许服务代理了解哪些不满意的客户需要优先提供服务,或者向哪些客户提供促销优惠信息。它还可以用来识别产品缺陷,衡量产品总体满意度,甚至还可以通过社交媒体渠道监控公众对品牌的看法。其他科技公司也提供了类似的服务。


我们还需要能够理解上下文的能力。假设你有一个香皂公司,有人在推特上说:“这种香皂真的很适合婴儿呢。”这条推文,可以认为是对儿童香皂的积极认可,但也有可能是反话,暗示这种香皂对孩子来说是可怕的。因此,这句话到底是什么意思要结合上下文来看,这还是一条非常简单的陈述句!要教会人工智能来解析句子所有的可能含义,并理解某个人在特定语境中想要表达的真实含义,是 NLP 研究中的重大挑战之一。它既需要标记数据来改进模型训练,也需要能够学习上下文并同时在不同任务之间共享知识的新模型。


问答系统


随着 NLP 越来越能够更好地解析文本的含义,借由这点,管理我们日常生活的数字助理的将会更加智能。Siri 和 Google Assistant 等应用现在已经能够很好地回答常见问题了,并能够执行相当简单的命令。但在理想情况下,我们应该可以向计算机提出任意问题,并能够得到很好的答案。


要想让计算机能够提供更好的答案,其中一个方法是确保计算机能够理解问题。如果你问:“When will my plane arrive?”你问的是航班呢,还是从 Amazon 订购的木工刨子呢?(译注:plane 有飞机和刨子的含义)计算机要如何确定你到底是问什么呢?只有通过更深入地理解语义,以及更加智能地使用上下文数据,计算机才能越来越善于猜测我们表达的意思。有了 NLP,我们才能弄清楚如何学习这些上下文层,这样,人工智能就可以同时处理所有的上下文,而不会错过重要的信息。


例如,动态共注意网络(dynamic coattention networks,DCN。详见《State of the art deep learning model for question answering》,http://u6.gg/ejFYu )可以根据所提问的各种问题对单个文档进行不同的解释,比如“Which team represented the NFC in Super Bowl 50?”或者“Who scored the touchdown in the fourth quarter?”,通过这种条件解释,它就可以迭代地假设多个答案,以便得到最好的、最准确的结果。


联合多任务学习


科研界擅长的是构建能够很好地完成单一任务的人工智能模型。但更直观、会话式和上下文相关的界面将需要一个能够不断学习的人工智能模型——将新任务与旧任务集成在一起,并在此过程中学习执行更为复杂的任务。人工智能在通常情况下都是如此,但在语言方面尤为如此,这是因为语言的灵活性所要求的。


问题“Who are my customers?”提出了一个足够简单的任务:创建一个客户列表。但问题是“Who are my best customers in the Pacific Northwest for a particular product?”现在,我们增加了一层复杂性,需要一些综合任务来回答合格的问题,比如,如何定义“best”?每个客户都住在哪里?让客户对某种产品感到兴趣都有哪些因素?通过向查询添加一个项目,问题的复杂性就会显著增加了。


Saleforce Research 最近创建了“自然语言十项全能(Natural Language Decathlon)”,这是一个挑战,利用问答功能在单一模型中解决了 NLP 最棘手的 10 项任务:问答系统、机器翻译、摘要、自然语言推理、情感分析、语义角色标注、关系提取、目标导向对话、数据库查询生成和代词解析。使用多任务问答模型,将每个任务作为问答的一种形式,单个模型联合共同学习和处理不同的任务,无需任何特定的参数或模块。这不仅意味着数据科学家无需为每项任务构建、训练和优化单个模型。但这也意味着模型将具备零样本学习(zero-shot learning)能力,也就是说,模型可以解决它从未见过或经过专门训练的任务。


随着研究人员不断改进这样的模型,我们将看到人工智能界面在承担个能为复杂的任务时,会变得更加智能。


尽管在 NLP 领域中,我们摸爬滚打了很久,但仍然处于起步阶段。不过,公众希望随着 NLP 的进步,人工智能能够得以改变我们与机器交互的一切方式。


原文链接:

https://hbr.org/2018/07/ais-next-great-challenge-understanding-the-nuances-of-language


本文由「AI前线」授权转载。AI前线面向AI爱好者、开发者和科学家,提供最新最全AI领域技术资讯、一线业界实践案例、搜罗整理业界技术分享干货、最新AI论文解读。每周一节技术分享公开课,助力你全面拥抱人工智能技术。欢迎扫码关注!


喜欢我们就多一次点赞多一次分享吧~


有缘的人终会相聚,慕客君想了想,要是不分享出来,怕我们会擦肩而过~

《预约、体验——新维空间站》

《【会员招募】“新维空间站”1年100场活动等你来加入》

有缘的人总会相聚——MOOC公号招募长期合作者


产权及免责声明 本文系“MOOC”公号转载、编辑的文章,编辑后增加的插图均来自于互联网,对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用,文章版权及插图属于原作者。如果分享内容侵犯您的版权或者非授权发布,请及时与我们联系,我们会及时内审核处理。


了解在线教育,
把握MOOC国际发展前沿,请关注:
微信公号:openonline
公号昵称:MOOC

   


登录查看更多
3

相关内容

狭义的情感分析(sentiment analysis)是指利用计算机实现对文本数据的观点、情感、态度、情绪等的分析挖掘。广义的情感分析则包括对图像视频、语音、文本等多模态信息的情感计算。简单地讲,情感分析研究的目标是建立一个有效的分析方法、模型和系统,对输入信息中某个对象分析其持有的情感信息,例如观点倾向、态度、主观观点或喜怒哀乐等情绪表达。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
专知会员服务
123+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【中科大徐童】多模态语义理解与关联
专知会员服务
82+阅读 · 2019年12月7日
什么是自然语言理解(NLU)?及2019最新进展
产品100干货速递
17+阅读 · 2019年7月18日
NLP 与 NLU:从语言理解到语言处理
AI研习社
15+阅读 · 2019年5月29日
对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠
微软研究院AI头条
7+阅读 · 2019年5月17日
语言处理想突破,三座大山必须过
THU数据派
6+阅读 · 2018年9月12日
【前沿】AI文案通过图灵测试!一秒生成2万条广告神器问世
人工智能的阴暗面
计算机与网络安全
6+阅读 · 2018年1月8日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
4+阅读 · 2019年9月5日
Arxiv
7+阅读 · 2018年4月24日
Arxiv
27+阅读 · 2018年4月12日
Arxiv
10+阅读 · 2018年3月22日
VIP会员
相关资讯
什么是自然语言理解(NLU)?及2019最新进展
产品100干货速递
17+阅读 · 2019年7月18日
NLP 与 NLU:从语言理解到语言处理
AI研习社
15+阅读 · 2019年5月29日
对话黄学东:语音语言技术是镶在 AI 皇冠上的明珠
微软研究院AI头条
7+阅读 · 2019年5月17日
语言处理想突破,三座大山必须过
THU数据派
6+阅读 · 2018年9月12日
【前沿】AI文案通过图灵测试!一秒生成2万条广告神器问世
人工智能的阴暗面
计算机与网络安全
6+阅读 · 2018年1月8日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
相关论文
Top
微信扫码咨询专知VIP会员