本文作者为华盛顿大学方昊,他为 AI 科技评论撰写了关于 NAACL 的独家稿件。
AI 科技评论按,本文作者为华盛顿大学方昊,他为 AI 科技评论撰写了关于 NAACL 的独家稿件。
第 16 届 NAACL(NAACL 2018)于当地时间 6 月 1 日至 6 月 6 日在美国路易斯安那州新奥尔良市举行。NAACL 是自然语言处理领域非常受关注的顶级会议之一,据统计,今年共接收 207 篇长论文(32% 接收率)、125 篇短论文(29% 接收率),美国是接收论文的主要来源国,中国紧随其后。值得一提的是,NAACL 在今年第一次推出了 Industry Track 吸引来自工业界的研究工作。
在6 月 2 日——6 月 4 日的主会上,迎来五位主讲嘉宾,其中 3 位嘉宾在 Research Track 环节,2 位嘉宾在 Industry Track 环节。
6 月 2 日上午,迎来第一位主讲嘉宾——宾夕法尼亚大学的 Charles Yang 教授。他的演讲主题是《Why 72?》。
这次的演讲是关于他在研究儿童学习语言的过程中发现的规律,他们尝试在机器上使用这些规律。他们做了一系列关于儿童数数的研究,发现对于说英语的儿童,总是无法从 1 完整地数到 72,但一旦他们能完整地数到 72,那就能成功地数到 100。换句话说,没有儿童在从 72 数到 100 之间会失败。他通过一系列的研究和观察发现了一些可解释的规律,并且尝试将这些规律应用在机器学习上。
他在演讲最后提出两点结论:第一,儿童可以从很少的数据中学习到语言,所以机器也应该可以;有时候更多的数据并不一定会有帮助。第二,研究语言能力获取的过程会帮助非监督自然语言处理系统的发展。
关于演讲内容的详细 PPT,大家可以点击如下网址:
http://www.ling.upenn.edu/~ycharles/naacl2018.pdf
下午是来自华盛顿大学的 Mari Ostendorf 教授的主题演讲。她演讲的主要内容是关于她带领的华盛顿大学队伍在 2017 年亚马逊 Alexa Prize 获胜系统 Sounding Board 的工作。
演讲的第一部分是 Sounding Board 的系统描述,她提到搭建社交对话系统的两个主要理念:以用户为中心,以内容为导向。她表示,Sounding Board 可以被看成是一个接入大规模网络内容的对话式的入口。
演讲的第二部分主要讨论了搭建社交对话系统的难点和挑战:
第一,自然语言处理技术处理语音识别系统输出的问题;第二,用户有非常大的多样性,包括他们的交互方式、个性、对新闻和内容的兴趣;第三,互联网提供了很多有用的数据,但也是一把双刃剑,网上充斥着很多不适合讨论的内容,所以需要开发非常好的内容理解和过滤系统;第四,和用户进行深度讨论非常困难,需要有针对用户语言和网上内容的更加强大的理解系统。
在演讲的最后,Mari 讨论了学术界和工业界合作的一些经验。首先,学术界和工业界的合作提供了让在校学生和教授能够接触到大规模用户的机会,这能影响到学术界的研究方向和解决方法,也会让学生有更好的全局观念。其次,与工业界的合作也能够给学生提供资金支持,而学生和教授也能直接提供工业界新产品或者功能的反馈。她表示,也有很多方面需要进一步改进,比如如何在不影响用户隐私的情况下获得数据,如何提供更加丰富的语音界面,以及怎样达成更加长期和稳定的合作。
演讲内容 PPT 详见如下链接:
https://sounding-board.github.io/index_files/Ostendorf_naacl2018.pdf
Kevin Knight 在主会次日上午带来主题演讲。他被 AMiner 评为机器翻译界十大领军人物之一,在卡内基梅隆大学计算机科学系获得博士学位,目前是南加州大学信息科学研究所的一名教授,也是机器翻译界公认的领袖,统计机器翻译的主要倡导者之一。
这个演讲是关于他最近在自然语言解密和自然语言生成方面的工作。
在自然语言解密方面,他谈到他们使用统计模型帮助历史学家翻译一些古老文献,以及帮助拍摄关于解密黄道十二宫杀手信件的纪录片的经历。
接下来他分享了他们关于自然语言生成,特别是使用循环神经网络在生成诗歌方面的工作。他讨论了如何使用循环神经网络控制诗歌的话题和韵律的一些实验结果。他表示,在自然语言生成领域,学术界暂时还没有一个广泛接受的衡量标准。但他同时强调,即使有一些研究领域暂时还没有一个良好定义的衡量标准,大家也应该继续在这个领域投入研究。他举了机器翻译领域的例子,早在 BLEU 被提出前很多年,就已经有非常多的高质量的机器翻译的工作发表,所以大家不要被衡量指标限制了研究的多样性。
另一个有趣的消息是,他也在演讲中提到他于 2018 年 6 月 1 日正式加入滴滴出行,将在洛杉矶开设一个自然语言处理实验室。
下午,亚马逊的 Daniel Marcu 带来主题演讲,他目前在亚马逊管理一个机器学习/自然语言处理团队。
他分享了他在过去一段时间将前沿研究转化到成功的创业公司上的经验,也谈到分析数据和衡量指标的重要性。他指出有些研究太过注重提高在一些已有衡量指标上的分数,但是忽略了实际应用场景的用户因素。
演讲的最后,他强调博士工作一方面要在一个非常专注的领域做出贡献,但同时也不要忘记纵观全局。
主会第三日上午,迎来最后一位演讲嘉宾——谷歌 AI 的 Dilek Hakkani-Tür。
演讲伊始,她回顾了端到端的对话系统研究,并指出任务导向的对话系统和闲聊系统近期有汇聚到同一个方向的趋势。之后,她提到可以将对话看成一个合作式的用户和机器之间的游戏。同时,她再次强调了 Mari 在演讲中提到的结合语音和自然语言处理研究对基于语音对话系统的重要性,并且讨论了视觉信息在对话系统中的应用。
演讲最后,她描述了谷歌近期关于训练对话系统的框架 :首先通过模拟用户来引导初始化模型训练,然后通过众包 (crowdsourcing) 平台来改善系统,最后在和实际用户的交流中迭代改善系统。
主会第三日下午是杰出论文演讲。今年 NAACL 共选出 4 篇杰出论文,值得一提的是,华盛顿大学参与完成其中 3 篇,杰出论文名单如下:
Deep Contextualized Word Representations
地址:https://arxiv.org/abs/1802.05365
Learning to Map Context-Dependent Sentences to Executable Formal Queries
地址:https://arxiv.org/abs/1804.06868
Neural Text Generation in Stories using Entity Representations as Context
地址:
https://jiyfeng.github.io/publication/papers/clark2018neural.pdf
Recurrent Neural Networks as Weighted Language Recognizers
地址:https://arxiv.org/abs/1711.05408
关于这四篇论文的简介,可参见AI 科技评论此前文章:自然语言处理顶会 NAACL 2018 最佳论文、时间检验论文揭晓
最佳论文(Deep Contextualized Word Representations)也在杰出论文之列,这篇论文由来自 AI2(艾伦人工智能研究院)和华盛顿大学的团队共同完成。在这篇关于 ELMo 的工作中,他们描述了如何通过 LSTM 语言模型获得编码了语境的词向量,并表示这样得到的词向量可以应用在各个自然语言处理系统上,获得显著的性能提升。
这篇论文的模型和代码已经在 AllenNLP(基于 PyTorch)和 TensorFlow 中实现。更多细节可以参考他们的网站:https://allennlp.org/elmo
在此次会议上,可以看到学术界和工业界的合作越来越多,工业界也越来越关注在学术会议上发表论文。会上除了有来自各所高校的教授和学生,也有很多来自工业界的研究员,大家互相交流经验。这也是 NAACL 尝试开设 Industry Track 的原因之一。
另外,会议上有来自腾讯、阿里巴巴、京东等公司的论文,可以看到中国公司的曝光率越来越高。
整体来说可以感觉到学术界和工业界在 NLP 领域现在都处于比较好的状态,从而也促进了越来越多高质量的论文和工作。