深度学习技术,在自然语言处理方面的七大应用(paper)

2017 年 10 月 27 日 MOOC 北辰

| 全文共7110字,建议阅读时长8分钟 |


转载公众号:机械鸡

 微信号:jixieji2017

作者: 北辰


自然语言处理(natural language processing,NLP)正在逐步从统计学方法转向神经网络方法。


尽管自然语言领域还存在许多极具挑战性的问题,但是深度学习方法的应用,却为某些特定的语言问题提供了最先进的解决思路。


深度学习模型的表现不仅仅局限于热门的基础问题。事实上,一个简单独立的深度学习模型就可以学习单词的意义和执行语言任务,避免了一系列的专业操作和人工流程。


在这篇文章中,您会发现七大自然语言处理应用,它们都已经应用深度学习在自然语言处理领域取得了一定的成果。


现在,就让我们正式开始。



目录Overview


这篇文章中,我们将讨论以下七种自然语言处理的常见应用:


1. 文本分类

2. 语言建模

3. 语音识别

4. 说明生成

5. 机器翻译

6. 文档总结

7. 问题回答


我将更多着重讨论您可能感兴趣的终端用户问题,而避开深度学习表现优异的学术或语言学的子问题,如词性标签、分块、命名实体识别等等。


每个任务都提供了任务描述,若干应用,以及含有详细方法和结果的论文。大多数的参考资料来自Goldberg2015年杰出的论文《NLP深度学习入门》(https://arxiv.org/abs/1510.00726)。


1. 文本分类Text Classification


文本分类是指给定一个文本,预测其所属的预定类别。


“文本分类的目的是对文档的主题或主旨进行分类。”


- p575, Foundations of Statistical Natural Language Processing(http://amzn.to/2ePBz9t), 1999


一种流行文本分类应用是情感分析(https://en.wikipedia.org/wiki/Sentiment_analysis),其中的常用类别标签表示源文本的情绪色调,例如“积极”或“消极”。

其他3类文本分类的应用:


  • 垃圾邮件过滤,依照文本分类电子邮件的垃圾邮件。

  • 语言识别,对源文本的语言进行分类。

  • 题材分类,分类虚构故事的体裁。

此外,还可以按需要给文本分配多个类别标签(即所谓的多标签分类)。 例如为tweet分配多个主题标签。


更多关于文本分类的信息,请参阅:


  • 文本分类的学术论文 (http://www.scholarpedia.org/article/Text_categorization)

  • 文本分类的维基百科(https://en.wikipedia.org/wiki/Document_classification)


3篇深度学习应用于文本分类的论文:


  • 烂番茄影评的情感分析

  • Deep Unordered Composition Rivals Syntactic Methods for Text Classification(https://cs.umd.edu/~miyyer/pubs/2015_acl_dan.pdf),2015

  • 亚马逊产品评论、IMDB影评和新闻文章主题分类的情感分析

  • Effective Use of Word Order for Text Categorization with Convolutional Neural Networks (https://arxiv.org/abs/1412.1058), 2015

  • 影评的情感分析,将句子分为主观或客观,分类问题类型,产品评论情绪等

  • Convolutional Neural Networks for Sentence Classification (https://arxiv.org/abs/1408.5882), 2014.


2. 语言建模Language Modeling


语言建模真的是一个很有趣的自然语言问题的子任务,特别是在其他一些任务的基础上调节语言模型。


“问题是预测出给定单词的下一个单词。 该任务是语音或光学字符识别的基础,也用于拼写校正,手写识别和统计学的机器翻译。”


- p575, Foundations of Statistical Natural Language Processing (http://amzn.to/2ePBz9t), 1999.


除了关于学术研究的兴趣,语言模型还是许多应用深度学习的自然语言处理架构的关键组成部分。


语言模型可以学习词与词之间的概率关系,然后生成与源文本统计上一致的词汇新序列。


语言模型可以用于文本或语音生成,应用如下:

  • 生成新的文章标题。

  • 生成新的句子,段落或文档。

  • 生成后续句子建议。

更多有关语言建模信息,请参阅:

  • 语言模型的维基百科 (https://en.wikipedia.org/wiki/Language_model)

  • 循环神经网络的语言模型应用The Unreasonable Effectiveness of Recurrent Neural Networks (http://karpathy.github.io/2015/05/21/rnn-effectiveness/), 2015

  • 基于模型生成的文本到语音合成 (https://github.com/oxford-cs-deepnlp-2017/lectures/blob/master/Lecture 10 - Text to Speech.pdf), 第10讲, 牛津,2017


1篇深度学习应用于语言建模的论文:


英语文本、书籍和新闻文章的语言模型。

A Neural Probabilistic Language Model (http://www.jmlr.org/papers/v3/bengio03a.html), 2003


3. 语音识别Speech Recognition


语音识别是解决如何理解人类所说的问题。


“语音识别的任务是将包含口语在内的自然语言的声学信号转换成符合说话者预期的相应的单词序列。”


- p458, Deep Learning (http://amzn.to/2uE7WvS), 2016.


给定依据文本生成的音频数据,模型必须能生成人类可读的文本。鉴于过程的自动性,这个任务也可称为自动语音识别(Automatic Speech Recognition, ASR)。


语言模型用于创建以音频数据为基础的的输出文本,应用包括:

  • 生成演讲文本。

  • 为电影或电视节目创建字幕。

  • 开车时向收音机发出命令。

更多有关语音识别信息,请参阅:

语音识别的维基百科 (https://en.wikipedia.org/wiki/Speech_recognition)


3篇深度学习应用于语音识别的论文:


  • 循环神经网络标记未分段序列数据

  • Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks (http://www.cs.toronto.edu/~graves/icml_2006.pdf), 2006

  • 循环神经网络标实现语音识别

  • Speech Recognition with Deep Recurrent Neural Networks (https://arxiv.org/abs/1303.5778), 2013

  • 探索卷积神经网在语音识别的应用

  • Exploring convolutional neural network structures and optimization techniques for speech recognition (https://www.microsoft.com/en-us/research/publication/exploring-convolutional-neural-network-structures-and-optimization-techniques-for-speech-recognition/), 2014


4. 说明生成Caption Generation


说明生成是解决如何描述图像内容的问题,依照诸如照片等的数字图像生成和图像内容相关的文本描述。


说明生成的语言模型用于根据图像生成标题,一些具体的应用包括:


  • 描述场景的内容。

  • 创建照片的标题。

  • 描述视频。

这项技术不仅仅可以造福听力障碍者,还可以为网站中的图像和视频数据生成人类可读的文本用于搜索。


3篇深度学习应用于说明生成的论文:


  • 说明生成—图像描述

  • Show, Attend and Tell: Neural Image Caption Generation with Visual Attention (https://arxiv.org/abs/1502.03044), 2016

  • 说明生成—图像描述

  • Show and tell: A neural image caption generator (https://arxiv.org/abs/1411.4555), 2015

  • 说明生成—描述视频

  • Sequence to Sequence – Video to Text (https://arxiv.org/abs/1505.00487)


5. 机器翻译Machine Translation


机器翻译是指将一种语言的源文本转换为另一种语言。


“机器翻译,从一种语言到另一种语言的文本或语音的自动翻译,是NLP最重要的应用之一。”


- p463, Foundations of Statistical Natural Language Processing(http://amzn.to/2ePBz9t), 1999.


鉴于加入了深层神经网络,该任务现在也被称为神经机器翻译(neural machine translation)。


“在机器翻译任务中,输入是由某种语言的符号序列组成,而计算机程序必须将输入转换成其他语言的符号序列。 机器翻译经常应用于自然语言,例如从英语翻译成法语。 近来,深度学习开始对该任务产生重要影响。”


- p98, Deep Learning (http://amzn.to/2uE7WvS), 2016


机器翻译的语言模型用于依据源文本,输出第二语言的目标文本。常见应用如下:

  • 将文本从法语翻译成英文。

  • 将西班牙语音频转换为德语文本。

  • 将英文文本翻译成意大利语。

更多有关机器翻译的信息,请参阅:

机器翻译的维基百科 (https://en.wikipedia.org/wiki/Neural_machine_translation)


3篇深度学习应用于机器翻译的论文:


  • 英语翻法语—LSTM

  • Sequence to Sequence Learning with Neural Networks (https://arxiv.org/abs/1409.3215), 2014

  • 英语翻法语—神经机器翻译

  • Neural Machine Translation by Jointly Learning to Align and Translate (https://arxiv.org/abs/1409.0473), 2014

  • 英语翻法语—循环神经网络

  • Joint Language and Translation Modeling with Recurrent Neural Networks (https://www.microsoft.com/en-us/research/publication/joint-language-and-translation-modeling-with-recurrent-neural-networks/), 2013


6. 文档总结Document Summarization


文档总结是指根据文本创建对应简短描述的任务。其语言模型用来输出基于完整文档的总结。


相关应用如下:

  • 创建文档标题。

  • 生成文档摘要。

更多有关文档总结的信息,请参阅:

  • 自动化总结的维基百科 (https://en.wikipedia.org/wiki/Automatic_summarization)

  • Quora:深度学习能(成功)应用于自动文档总结吗?  (https://www.quora.com/Has-Deep-Learning-been-applied-to-automatic-text-summarization-successfully)


3篇深度学习应用于文档总结的论文:


  • 神经模型进行简要总结

  • A Neural Attention Model for Abstractive Summarization (https://arxiv.org/abs/1509.00685), 2015

  • 循环神经网络进行摘要总结

  • Abstractive Text Summarization Using Sequence-to-Sequence RNNs and Beyond (https://arxiv.org/abs/1602.06023),2016

  • 通过提取句子和词汇进行神经总结

  • Neural Summarization by Extracting Sentences and Word (https://arxiv.org/abs/1603.07252), 2016


7. 问题回答Question Answering


问题回答是指给出一个主题(如文本文档)回答有关该主题的具体问题。


“问答系统,它通过返回相应的短语(例如位置,人物或日期)来尝试回答以问题形式提出的用户查询。 例如,问题为什么杀死肯尼迪总统? 可能得到名词短语奥斯瓦尔德作答案”


- p377, Foundations of Statistical Natural Language Processing(http://amzn.to/2ePBz9t), 1999.


常见应用如下:

  • 回答有关维基百科文章的问题。

  • 回答有关新闻文章的问题。

  • 回答关于医疗记录的问题。

更多信息参见:

问题回答的维基百科 (https://en.wikipedia.org/wiki/Question_answering)


3篇深度学习应用于问题回答的论文:


  • 关于新闻的问答

  • Teaching Machines to Read and Comprehend (http://papers.nips.cc/paper/5945-teaching-machines-to-read-and-comprehend), 2015

  • 回答关于freebase文章的一般知识问题

  • Question Answering over Freebase with Multi-Column Convolutional Neural Networks (http://www.aclweb.org/anthology/P15-1026), 2015

  • 根据特定文件进行仿真陈述

  • Deep Learning for Answer Sentence Selection (https://arxiv.org/abs/1412.1632), 2015

扩展阅读Further Reading


如果您想更进一步,下面提供了更多有关NLP深度学习的资源。

  • 《NLP深度学习 入门》(https://arxiv.org/abs/1510.00726), 2015

  • 《NLP深度学习从零开始》 (https://arxiv.org/abs/1103.0398), 2011

  • 牛津课程—NLP的深度学习实操概览 (https://github.com/oxford-cs-deepnlp-2017/lectures/blob/master/Lecture 2b - Overview of the Practicals.pdf)

  • Quora:有哪些(成功)应用深度学习或神经网络的NLP问题? (https://www.quora.com/What-NLP-problems-has-deep-learning-or-neural-networks-been-applied-to-successfully)

  • Quora:深度学习能像在视觉和语音领域一样,在自然语言处理方面有巨大的突破? (https://www.quora.com/Can-deep-learning-make-similar-breakthroughs-in-natural-language-processing-as-it-did-in-vision-speech)


有缘的人终会相聚,慕客君想了想,要是不分享出来,怕我们会擦肩而过~

预约、体验——新维空间站

《【会员招募】“新维空间站”1年100场活动等你来加入》

有缘的人总会相聚——MOOC公号招募长期合作者

《【调查问卷】“屏幕时代,视觉面积与学习效率的关系“——你看对了吗?》


产权及免责声明 本文系“MOOC”公号转载、编辑的文章,编辑后增加的插图均来自于互联网,对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用,文章版权及插图属于原作者。如果分享内容侵犯您的版权或者非授权发布,请及时与我们联系,我们会及时内审核处理。


了解在线教育,
把握MOOC国际发展前沿,请关注:
微信公号:openonline
公号昵称:MOOC

 

登录查看更多
3

相关内容

文本分类(Text Classification)任务是根据给定文档的内容或主题,自动分配预先定义的类别标签。
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
专知会员服务
103+阅读 · 2020年3月12日
专知会员服务
199+阅读 · 2020年3月6日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
163+阅读 · 2020年2月27日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
了解情感分析中的NLP技术么?
七月在线实验室
9+阅读 · 2019年4月12日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
2017深度学习NLP进展与趋势
全球人工智能
5+阅读 · 2017年12月19日
NLP的这一年:深度学习或成主角
论智
3+阅读 · 2017年12月14日
本周不容错过的的9篇NLP论文 | PaperDaily #21
PaperWeekly
22+阅读 · 2017年12月1日
深度学习在 NLP 上的七大应用
AI前线
3+阅读 · 2017年10月11日
自然语言处理数据集免费资源开放(附学习资料)
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年4月3日
Arxiv
3+阅读 · 2018年3月28日
Arxiv
6+阅读 · 2018年1月11日
VIP会员
相关资讯
了解情感分析中的NLP技术么?
七月在线实验室
9+阅读 · 2019年4月12日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
2017深度学习NLP进展与趋势
全球人工智能
5+阅读 · 2017年12月19日
NLP的这一年:深度学习或成主角
论智
3+阅读 · 2017年12月14日
本周不容错过的的9篇NLP论文 | PaperDaily #21
PaperWeekly
22+阅读 · 2017年12月1日
深度学习在 NLP 上的七大应用
AI前线
3+阅读 · 2017年10月11日
自然语言处理数据集免费资源开放(附学习资料)
Top
微信扫码咨询专知VIP会员