【解读】2017年ML/NLP论文发表情况(第八期免费赠书活动来啦!)

2018 年 1 月 3 日 量化投资与机器学习 编辑部

编辑部

微信公众号

关键字全网搜索最新排名

『量化投资』:排名第一

『量       化』:排名第一

『机器学习』:排名第三


我们会再接再厉

成为全网优质的科技文公众号


对于NLP和ML研究来说,这是非常高产的一年。这两个领域都在不断发展,会议的出版量达到了创纪录的数量。这篇文章的统计来源有个人作者和组织。涵盖以下:ACL,EMNLP,NAACL,EACL,COLING,TACL,CL,CoNLL,* Sem + SemEval,NIPS,ICML,ICLR。与去年相比,加入了ICLR,在过去的两年里,ICLR的发展非常迅速。

 

通过从会议网站和ACL选集中抓取出版物信息,自动进行分析。作者姓名通常列在程序中,易于提取,但组织名称比较麻烦,需要直接从PDF中提取。但是已经创建了许多规则来映射替代名称和拼写错误。

 

venues

首先,让我们看看2012 - 2017年之间不同的出版社。NIPS显然正走向榜单,今年出版了677份出版物。其他大多数venues也在迅速发展,2017年是ICML、ICLR、EMNLP、EACL和CoNLL历史上最大的一年。相比之下,TACL和CL似乎每年都要保持一定数量的出版物。在2017年,NAACL和COLING明显下降,但我们可以期待2018年两者的重返。


Authors

2017年最多产的作家是IrynaGurevych(TU Darmstadt),共有18篇论文。Lawrence Carin(Duke University)拥有16个出版物,在NIPS上有10篇令人印象深刻的论文。 紧随其后的是YueZhang(Singapore),Yoshua Bengio (Montreal)和Hinrich Schütze(Munich)。



从2012 - 2017年的统计数据来看,Chris Dyer(DeepMind)位居榜首,其次是Iryna Gurevych(TU Darmstadt)和Noah A. Smith(Washington)。Lawrence Carin (Duke), Zoubin Ghahramani (Cambridge) and Pradeep K. Ravikumar (CMU)主要出版在一般的MLvenues,而其他则在NLP和ML之间保持平衡。


年度出版物的分类表明,Chris Dyer已经把出版物数量降低到今年更易处理的水平,Iryna Gurevych正在朝着一个向上的轨迹发展,令人印象深刻。




First Authors

现在让我们看看第一个作者,因为这些人通常是执行代码并运行实验的人。 Ivan Vulić (Cambridge), Ryan Cotterell (Johns Hopkins) 和 Zeyuan Allen-Zhu (Microsoft Research)在2017年都出版了6本第一作者的出版物。其次是Henning Wachsmuth (Weimar), Tsendsuren Munkhdalai (Microsoft Maluuba), Jiwei Li (Stanford) and Simon S. Du (CMU)


Organisations

从2017年看不同组织的出版模式,卡耐基梅隆(Carnegie Mellon)有126本出版物,其次是Google,微软和斯坦福。 与NLP相比,ML领域包括MIT,Columbia,Oxford,Harvard,Toronto,Princeton和Zürich。 相比之下,更多关注NLPvenues的大学和组织包括爱丁堡,IBM,北京,华盛顿,约翰霍普金斯,宾夕法尼亚,中科院,达姆施塔特和卡塔尔。



从2012 - 2017整个世家段来看,CMU再次领先微软、谷歌和斯坦福大学。


从时间序列看,CMU,斯坦福大学,麻省理工学院和伯克利大学在出版物方面正处于上升阶段。 相比之下,行业领导者谷歌,微软和IBM略有减少他们的出版数量。


主题聚类

最后,对所有来自9个或更多出版物的作者的论文做了LDA,并用tsne对结果进行了可视化。 中间是一般机器学习,神经网络和对抗性学习。 顶端群集涵盖强化学习和不同的学习政策。 左侧的集群包含NLP应用程序,语言建模,分析和机器翻译。 底部的聚类包括信息建模和特征空间。



期待2018年所有令人兴奋的研究!


http://www.marekrei.com/blog/ml-nlp-publications-in-2017/


赠书活动

量化投资与机器学习公众号联合博文视点Broadview送出5本机器学习Python实践


本书系统地讲解了机器学习的基本知识,以及在实际项目中使用机器学习的基本步骤和方法;详细地介绍了在进行数据处理、分析时怎样选择合适的算法,以及建立模型并优化等方法,通过不同的例子展示了机器学习在具体项目中的应用和实践经验,是一本非常好的机器学习入门和实践的书籍。不同于很多讲解机器学习的书籍,本书以实践为导向,使用 scikit-learn 作为编程框架,强调简单、快速地建立模型,解决实际项目问题。读者通过对本书的学习,可以迅速上手实践机器学习,并利用机器学习解决实际问题。本书非常适合于项目经理、有意从事机器学习开发的程序员,以及高校相关专业在的读学生阅读。

截止 2018.01.06 12:00


大家在本篇推文【写留言】处发表留言,获得点赞数前五的读者,即可免费获赠此书。届时,工作人员会联系五位读者,寄出此书。


登录查看更多
5

相关内容

斯坦福大学经典《自然语言处理cs224n》2020课件合集
专知会员服务
94+阅读 · 2020年5月25日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
161+阅读 · 2020年3月18日
专知会员服务
53+阅读 · 2019年12月22日
【CCL 2019】ATT-第19期:生成对抗网络 (邱锡鹏)
专知会员服务
48+阅读 · 2019年11月12日
金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
【重磅】61篇NIPS2019深度强化学习论文及部分解读
机器学习算法与Python学习
10+阅读 · 2019年9月14日
免费自然语言处理(NLP)课程及教材分享
深度学习与NLP
29+阅读 · 2019年1月18日
AAAI 2018学术见闻——NLP篇
哈工大SCIR
5+阅读 · 2018年3月26日
2017年度NLP领域论文TOP10(附链接)
数据派THU
6+阅读 · 2018年2月11日
2017年,50个令人屏息的科技瞬间丨数据工匠简报
Datartisan数据工匠
5+阅读 · 2018年1月8日
知识图谱火了,但你知道它的发展历史吗?|赠书5本
人工智能学家
6+阅读 · 2018年1月5日
福利!一篇关于深度学习与NLP的深度好文!
全球人工智能
8+阅读 · 2017年12月12日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
Arxiv
5+阅读 · 2018年6月12日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
6+阅读 · 2018年2月26日
Arxiv
5+阅读 · 2018年1月16日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
【重磅】61篇NIPS2019深度强化学习论文及部分解读
机器学习算法与Python学习
10+阅读 · 2019年9月14日
免费自然语言处理(NLP)课程及教材分享
深度学习与NLP
29+阅读 · 2019年1月18日
AAAI 2018学术见闻——NLP篇
哈工大SCIR
5+阅读 · 2018年3月26日
2017年度NLP领域论文TOP10(附链接)
数据派THU
6+阅读 · 2018年2月11日
2017年,50个令人屏息的科技瞬间丨数据工匠简报
Datartisan数据工匠
5+阅读 · 2018年1月8日
知识图谱火了,但你知道它的发展历史吗?|赠书5本
人工智能学家
6+阅读 · 2018年1月5日
福利!一篇关于深度学习与NLP的深度好文!
全球人工智能
8+阅读 · 2017年12月12日
相关论文
Top
微信扫码咨询专知VIP会员