盘点NLP最新进展：多语种40+任务最优结果任你查

会员服务 ·

盘点NLP最新进展：多语种40+任务最优结果任你查

2019 年 2 月 14 日 新智元

新智元报道

来源：nlpprogress.com

编辑：大明

【新智元导读】本文是一个自然语言处理资源索引，涵盖了目前NLP领域常用任务的最佳实验结果和数据集资源，可以作为进一步从事NLP研究的基础。读者也可以自行在Github页面上添加新的结果，本文中大部分为英文NLP资源，还有少数汉语、印地语和越南语资源。

本文实际上是一个索引，旨在记录自然语言处理（NLP）领域的新进展，并概述最常见的NLP任务及其相应数据集的新技术。

这篇索引旨在涵盖主要的传统和核心NLP任务，如语义依赖性解析和词性标注等，以及最近不断取得新突破的任务，比如阅读理解和自然语言推理。本文主要目标是为感兴趣的读者提供关于NLP基准数据集的快速概览，以及最新技术的进展，这些数据集和新进展可以作为进一步NLP研究的基础。

因此，本文有意将这些NLP领域的新研究进展做一个简单汇总，便于研究人员集中查阅参考。

读者也可以通过浏览器访问nlpprogress.com 或nlpsota.com来阅读本文。

简易使用指南

实验结果

本文首选在已发表的论文中的实验结果，但对少数影响力很大的预印本论文也可能入选。

数据集

本文中收录的数据集，除了利用该数据集的论文之外，还应经过至少一篇已发表的其他论文的评估。

代码

我们建议添加指向实现的链接（如果可用）。如果代码不存在，您可以向表中添加代码列（见下文）。在Code列，建议使用官方实现。如果有非官方实现，请使用链接（见下文）。如果没有可用的实现，可以将单元格留空。

向本索引中添加新结果

如果要添加新结果，只需单击文件右上角的小编辑按钮以执行相应任务（如下图所示）。

读者可以在Markdown中编辑文件。只需以相同的格式将一行添加到相应的表中即可。确保表格中数据排序正确（将最佳结果位于顶部）。完成更改后，单击页面顶部的“预览更改”选项卡，确保表格看起来还不错。如果一切看起来都OK，请转到页面底部确认更改。

此处需要为建议更改添加名称，可以选择添加说明文字，可以选择“创建新分支并启动拉取请求”，然后单击“提交更改”。

具体索引内容和研究领域如下，绝大部分为英语，有少量资源为汉语、印地语和越南语。

英语

自动语音识别
CCG超级标准
常识
选区解析
共同决议
依赖解析
对话
域适应
实体链接
语法纠错
信息提取
语言建模
词汇规范化
机器翻译
多任务学习
多模态
命名实体识别
自然语言推理
词性标注
问答
关系预测
关系提取
语义文本相似度
语义解析
语义角色标记
情绪分析
浅语法
简单化
状态检测
概要
分类学习
时间处理
文字分类
词义消歧

中文

实体链接
中文词汇分割

印地语

分块
词性标注
机器翻译

越南语

依赖解析
机器翻译
命名实体识别
词性标注
分词

最后以”中文-词汇分割”子类目为例，简单说明这个索引资源的呈现方式。

点击相应链接进入，首先是中文词汇分割这个任务的简要介绍。

下面列出了不同作者建立的基于不同搜索方式的单词分割模型，以及相应模型的发表时间。

接下来是评估指标，此类中为F1分数。下面以表格形式给出每种模型在不同数据集上获得的最佳F1分数。每个分数对应的研究论文链接和部分Github资源地址。

可以看到，表中中文词汇分割模型的最优F1分数均超过了96分，感兴趣的读者可以点击查看论文或Github资源。

更多阅读：

原文链接：

http://nlpprogress.com/

【加入社群】

新智元AI技术+产业社群招募中，欢迎对AI技术+产业落地感兴趣的同学，加小助手微信号：aiera2015_2 入群;通过审核后我们将邀请进群，加入社群后务必修改群备注（姓名 - 公司 - 职位;专业群审核较严，敬请谅解）。

登录查看更多

相关内容

NLP

关注 52

NLP:自然语言处理

最新《深度多任务学习》综述论文，22页pdf109篇文献概述MTL最新进展

专知会员服务

119+阅读 · 2020年6月13日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知会员服务

25+阅读 · 2020年4月20日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

机器翻译深度学习最新综述

专知会员服务

99+阅读 · 2020年2月20日

BERT进展2019四篇必读论文

专知会员服务

70+阅读 · 2020年1月2日

自动机器学习：最新进展综述

专知会员服务

123+阅读 · 2019年10月13日

计算机视觉最佳实践、代码示例和相关文档

专知会员服务

20+阅读 · 2019年10月9日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

Bert最新进展，继续在NLP各领域开花结果！

机器学习算法与Python学习

20+阅读 · 2019年6月11日

34篇最新论文带你快速跟进NLP领域技术（附下载）

数据派THU

23+阅读 · 2019年5月28日

AI所有领域最优论文+代码查找神器：966个ML任务、8500+论文任你选

机器之心

4+阅读 · 2019年2月2日

学界 | 2018 年度 ML、NLP 会议论文大盘点：周明、张潼、孙茂松数据亮眼

中国人工智能学会

3+阅读 · 2019年1月11日

2018年度NLP领域最令人兴奋的10项新研究

AI前线

16+阅读 · 2018年12月29日

不只有BERT！盘点2018年NLP令人激动的10大想法

黑龙江大学自然语言处理实验室

4+阅读 · 2018年12月24日

一个跟踪NLP各项技术进展的网站以及上次抽奖结果

AINLP

8+阅读 · 2018年11月13日

这份NLP研究进展汇总请收好，GitHub连续3天最火的都是它

量子位

6+阅读 · 2018年6月27日

深度学习在 NLP 上的七大应用

AI前线

3+阅读 · 2017年10月11日

Guess who? Multilingual approach for the automated generation of author-stylized poetry

Arxiv

4+阅读 · 2018年9月17日

Unsupervised Multilingual Word Embeddings

Arxiv

4+阅读 · 2018年9月6日

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Knowledge-enriched Two-layered Attention Network for Sentiment Analysis

Arxiv

4+阅读 · 2018年6月16日

Recursive Neural Network Based Preordering for English-to-Japanese Machine Translation

Arxiv

7+阅读 · 2018年5月25日

Chinese NER Using Lattice LSTM

Arxiv

14+阅读 · 2018年5月15日

Approaching Neural Grammatical Error Correction as a Low-Resource Machine Translation Task

Arxiv

3+阅读 · 2018年4月16日

Stacked Cross Attention for Image-Text Matching

Arxiv

3+阅读 · 2018年3月21日

Towards Neural Phrase-based Machine Translation

Arxiv

4+阅读 · 2018年1月29日

Improving Word Vector with Prior Knowledge in Semantic Dictionary

Arxiv

6+阅读 · 2018年1月27日

VIP会员