2018年自然语言处理值得关注的研究、论文和代码

2019 年 1 月 13 日 云栖社区

摘要:NLP 与情感分析、增强学习、深度学习的交叉领域,全年干货大合集。


2018年对于自然语言处理(NPL)是很有意义的一年,见证了许多新的研究方向和尖端成果。Elvis Saravia 是计算语言学专家,也是2019 计算语言学会年度大会北美分部的项目委员之一。他总结了2018年 NLP 的重要进展,包括增强学习、情感分析和深度学习等领域。


查看文章中的链接,可获得每一项研究的详细信息、论文或者代码。


综合领域


  • Facebook 研究员们发明了一种机器翻译的新方法,只需要使用单一语言语料库,这对于缺乏资料的语言非常有用。

    https://www.forbes.com/sites/samshead/2018/08/31/facebook-develops-new-ai-technique-for-language-translation/


  • Young 和同事更新了他们近期发表的论文《基于深度学习的自然语言处理的最新趋势》,增加了 NLP 文献中最新的 SQuAD 结果。

    https://arxiv.org/abs/1708.02709


  • Bloomberg 研究员 Yi Yang 发表了 RNN 卷积筛选建模的最新论文及代码,称体现了语言中的长期依存性和组合性。

    https://arxiv.org/abs/1808.09315


  • 百度发布了 Deep Voice 3,是一项基于注意、完全卷积的文字语音转换神经系统,比目前的循环系统在神经语音合成方面快几个量级。

    https://arxiv.org/pdf/1710.07654.pdf


  • Pair2vec 是一种学习文字嵌入对的新方法,能体现隐含关系的背景知识。

    https://arxiv.org/abs/1810.08854


  • 百度发布了名为同声翻译与预测及可控延迟(STACL)的机器翻译算法,能够同时进行多个翻译。在同声传译时,这项技术不需要等发言者暂停发言,而可以预测发言者的下一个词语。

    https://siliconangle.com/2018/10/23/baidu-created-worlds-first-simultaneous-translation-system/


  • Deep INFOMAX 是一种学习无监督表征的方法,将输入和高层特征矢量之间的共同信息最大化。

    https://arxiv.org/abs/1808.06670



  • 蒙特利尔大学的 AI 研究团队 MILA 发表了多个超赞的研究成果,记录了自然语言生成(NLG)任务中 GAN 的限制。

    https://arxiv.org/pdf/1811.02549.pdf


  • 聊天机器人是 NLP 的一个重要研究领域,创业公司 lang.ai 如何使用无监督 AI 来解决打造聊天机器人的重要挑战之一:理解用户到底想要什么。

    https://building.lang.ai/sorry-i-didnt-get-that-how-to-understand-what-your-users-want-a90c7ca18a8f


  • 这个模型提供了一种新方法进行文字生成,可以实现更强的解读性和控制性。

    https://arxiv.org/abs/1808.10122


  • 谷歌 AI 发表了论文,探索语言建模的极限。

    https://arxiv.org/pdf/1602.02410.pdf


  • 亚马逊研究员提出了一种语言建模方法,这种新的训练策略的重要性在于,在现实中,要获得大量的训练数据来建立一种新能力经常是不现实的。https://developer.amazon.com/blogs/alexa/post/f2c93a90-5539-4386-aefb-2342f9b1cc4c/new-approach-to-language-modeling-reduces-speech-recognition-errors-by-up-to-15


增强学习


许多研究员认为增强学习是机器学习的最前端。 我们来看看这个领域内,2018年都有哪些重大进展。


  • David Ha 的“世界模型”,目标是研究个体能否在其自身的梦境中学习,需要利用增强学习来学习一项规则,依靠世界模型中抽取的特征来解决制定的任务。

    https://worldmodels.github.io/


  • OpenAI 开发了一个类似人类的机器人手,通过增强学习算法获得操纵物体的灵活性。

    https://blog.openai.com/learning-dexterity/


  • DeepMind 在《自然》杂志发布了一篇论文,讨论虚拟环境中,人工个体的网格表征怎样通过矢量导航找到解决。

    https://deepmind.com/blog/grid-cells/


  • TextWorld 是以文字游戏为灵感的学习环境,用于训练增强学习代理。

    https://www.microsoft.com/en-us/research/blog/textworld-a-learning-environment-for-training-reinforcement-learning-agents-inspired-by-text-based-games/



  • Google研究员开发了一项名为 MnasNet 的技术,是一种自动化神经网络架构搜索方法,用于通过增强学习设计移动化机器学习模型。

    https://ai.googleblog.com/2018/08/mnasnet-towards-automating-design-of.html


  • OpenAI Five 利用增强学习,能在复杂游戏 Dota 2 中打败业余水准的人类选手。

    https://blog.openai.com/openai-five/


  • DeepMind 开发了名为 PopArt 的技术,利用增强学习在多任务环境中具有高精确度。

    https://deepmind.com/blog/preserving-outputs-precisely-while-adaptively-rescaling-targets/


  • 三星的 CozNet 是一种增强学习算法,在两项知名的NPL比赛中展现了顶尖表现。

    https://news.samsung.com/global/samsung-electronics-wins-at-two-top-global-ai-machine-reading-comprehension-challenges


  • Arel 使用对抗奖励学习来讲故事,解决故事评估维度的局限。

    https://github.com/eric-xw/AREL


  • Metacar 是为无人驾驶汽车而设计的增强学习环境,在以 Tensorflow.js 打造的浏览器上使用。

    https://www.metacar-project.com/


  • OpenAI 发布的 Gym Retro 平台提供 1000多个游戏,进行增强学习研究。

    https://blog.openai.com/gym-retro/


情感分析


机器学习系统需要更深的理解能力,才能与人类在情感层面互动。


  • 这篇新论文提出了“层级化CVAE用于精准的仇恨言论分类”,能够理解40多个群体和13中不同类别的仇恨言论。

    https://arxiv.org/pdf/1809.00088.pdf


  • 这篇论文讨论如何使用简单的支持向量机变量获得最佳结果,并指出模型方面需要注意的几点。目前大部分情感分析都是基于神经方法,研究时需要注意模型和特征的选择。

    https://yq.aliyun.com/articles/%5Blink%5D


  • 这篇论文定量分析了推特表情肤色修改器的使用效果。

    https://arxiv.org/abs/1803.10738



  • 这篇论文讨论如何使用深度卷积神经网络检测讽刺。另外,这项新研究使用眼动追踪、NLP和深度学习算法检测讽刺。

    https://medium.com/dair-ai/detecting-sarcasm-with-deep-convolutional-neural-networks-4a0657f79e80


  • 研究员开发了一项成为“情感聊天机器”的方法,这个聊天机器人不仅能给出符合事实与逻辑的答案,还能在聊天中加入悲伤、厌烦等情绪。

    https://arxiv.org/pdf/1704.01074.pdf


  • Lei Zhang 等研究员发表了一篇论文,综合概括了深度学习方法如何用于情感分析。

    https://arxiv.org/abs/1801.07883


  • 这个双向异步框架可以在聊天中生成有意义的情感回复。

    https://arxiv.org/abs/1806.07000


  • 这项研究使用计算机视觉方法,研究语境中的情感识别。

    http://openaccess.thecvf.com/content_cvpr_2017/papers/Kosti_Emotion_Recognition_in_CVPR_2017_paper.pdf


  • 这篇在2018 NAACL 大会上发表的论文,提出了一种方法可以使用简单的递归神经网络模拟情感流。

    https://arxiv.org/abs/1805.09746



深度学习


  • DeepMind 与哈佛大学教师 Wouter Kool 合作发表了论文,研究人类如何使用大脑来做决定,以及这些研究结果能如何启发人工智能的研究。

    https://www.nature.com/articles/s41562-018-0401-9


  • 这篇论文引入了“群组归一化”的概念,可以有效替代批归一化,被认为是深度学习的一项重要技术。

    https://arxiv.org/abs/1803.08494


  • Sperichal CNN 是一种打造卷积神经网络的新方法。

    https://arxiv.org/abs/1801.10130


  • BAIR 发布了一篇文章,讨论目前循环神经网络和前馈神经网络在解决各种问题时的优缺点。

    https://bair.berkeley.edu/blog/2018/08/06/recurrent/


  • Facebook 的 AI 研究小组开发了一项新技术,能将 AI 模型运行效率提升16%。这能提高 AI 模型的训练速度,并简化模型的量化和运行。

    https://code.fb.com/ai-research/floating-point-math/


  • 这篇《自然》杂志论文,介绍了一种可以预测地震后余震位置的深度学习方法。

    https://www.nature.com/articles/s41586-018-0438-y


  • DeepMind 研究员开发了一种新方法,利用神经算数逻辑单元(NALU)改善神经网络,追踪时间、用数字图片运行算数、数图片中的物体个数等等。

    https://arxiv.org/abs/1808.00508


  • DARTS 是一种架构搜索算法,可以设计高性能的图像分类卷积架构。

    https://github.com/quark0/darts


  • 这篇论文《实证验证序列建模中的通用卷积网络和神经网络》,讨论了序列建模中 CNN 和 RNN 的区别。

  • 图形神经网络如何帮助推断潜在关系结构、模拟多代理和物理动态。

    https://arxiv.org/abs/1803.01271


  • 谷歌 AI 研究团队发布了一篇论文,提出了一种改进版的 RNN,能够提高自动数据解读的精确度。

    https://ai.googleblog.com/2018/07/improving-connectomics-by-order-of.html


  • Distill 发布了新研究,可以在一个数据源的语境下分析另一个数据。

    https://distill.pub/2018/feature-wise-transformations/



  • 如果没有任何数据、也没有任何人类知识工程,有可能习得精准的认知模型吗?这项研究会告诉你答案。

    https://arxiv.org/pdf/1806.08065.pdf


  • 这篇论文详细描述了针对深度神经网络的批归一化研究。

    https://arxiv.org/abs/1805.11604


  • 这篇论文回顾了神经网络中,如何更好地进行批训练。

    https://arxiv.org/abs/1804.07612


  • 这篇论文讨论如何正确评估深度半监督学习算法。

    https://arxiv.org/abs/1804.09170


本文由阿里云云栖社区组织翻译。
文章原标题《NLP Highlights of 2018》,译者:炫,审校:袁虎。



end

赠书啦!1月上旬值得一读的10本技术图书!福利见文末!

Mars——基于矩阵的统一分布式计算框架

12亿行代码,阿里巴巴这一年的技术报告和梦想报告

性能诊断利器 JProfiler 快速入门和实践

更多精彩

登录查看更多
6

相关内容

专知会员服务
103+阅读 · 2020年3月12日
专知会员服务
199+阅读 · 2020年3月6日
17篇知识图谱Knowledge Graphs论文 @AAAI2020
专知会员服务
171+阅读 · 2020年2月13日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
2018年有意思的几篇GAN论文
专知
21+阅读 · 2019年1月5日
2018年度NLP领域最令人兴奋的10项新研究
AI前线
16+阅读 · 2018年12月29日
近期值得关注的8款AI开源项目 | 本周Github精选
PaperWeekly
4+阅读 · 2018年8月3日
论文荐读 | NLP之Attention从入门到精通
人工智能前沿讲习班
5+阅读 · 2018年5月14日
十大深度学习热门论文(2018年版)
论智
4+阅读 · 2018年4月24日
近期AI领域8篇精选论文(附论文、代码)
数据派THU
4+阅读 · 2018年3月24日
ICLR 2018 有什么值得关注的亮点?
计算机视觉战队
3+阅读 · 2017年12月5日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
9+阅读 · 2019年11月6日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
12+阅读 · 2019年2月26日
Arxiv
6+阅读 · 2018年2月24日
VIP会员
相关VIP内容
专知会员服务
103+阅读 · 2020年3月12日
专知会员服务
199+阅读 · 2020年3月6日
17篇知识图谱Knowledge Graphs论文 @AAAI2020
专知会员服务
171+阅读 · 2020年2月13日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
相关资讯
2018年有意思的几篇GAN论文
专知
21+阅读 · 2019年1月5日
2018年度NLP领域最令人兴奋的10项新研究
AI前线
16+阅读 · 2018年12月29日
近期值得关注的8款AI开源项目 | 本周Github精选
PaperWeekly
4+阅读 · 2018年8月3日
论文荐读 | NLP之Attention从入门到精通
人工智能前沿讲习班
5+阅读 · 2018年5月14日
十大深度学习热门论文(2018年版)
论智
4+阅读 · 2018年4月24日
近期AI领域8篇精选论文(附论文、代码)
数据派THU
4+阅读 · 2018年3月24日
ICLR 2018 有什么值得关注的亮点?
计算机视觉战队
3+阅读 · 2017年12月5日
相关论文
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
9+阅读 · 2019年11月6日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
12+阅读 · 2019年2月26日
Arxiv
6+阅读 · 2018年2月24日
Top
微信扫码咨询专知VIP会员