【团队新作】让机器"好好说话": 自然语言处理新进展

2018 年 2 月 1 日 机器学习研究会
今日聚焦

自然语言处理技术经历了从过去的基于规则和统计到如今大范围地使用深度学习技术。日前,自动化所自然语言处理组基于动态融合、人脑成分语义表征、强化学习多语注意力机制词汇表示信息抽取方面取得了一些新进展。

自然语言处理(NLP)被誉为人工智能皇冠上的明珠,是计算机科学领域与人工智能领域中的一个重要方向,在应用方面有着广阔的空间。自然语言理解和自然语言生成是十分困难的。造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的歧义性或多义性(ambiguity)。那么,如何有效的学习词汇表示和抽取信息和关系就显得尤为重要。

 

日前,自动化所自然语言处理组多模态词汇表示模型、大规模关系抽取、时间检测事件识别方面取得了一些新进展。

1.基于动态融合方法的多模态词汇表示模型

相比基于文本的模型,多模态模型可以学习到更好的词汇表示。之前的多模态词汇表示模型平等地对待不同模态的信息。但是,不同模态的信息对于不同类型的词汇的贡献程度是不同的。比如对于抽象词如“快乐”,文本模态对词义的贡献要大于感知觉模态的贡献;而对于具象词如“桌子”,文本和感知觉模态都会极大地影响词汇的含义。这启发团队成员建立可以根据不同类型的词汇对不同模态的信息加以区分的多模态词汇表示模型。因此,团队成员(王少楠、张家俊、宗成庆)提出了三种动态融合机制,可以分别针对模态、词类和词汇对不同模态赋予不同的权重。由于标准答案并不为人所知,因此,团队成员提出可以通过间接利用相关或相似词对作为弱监督信号,让模态在学习词汇是否是相关词汇的过程中自动学习不同模态的权重。



转自:中国科学院自动化研究所


完整内容请点击“阅读原文”

登录查看更多
3

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
深度学习可解释性研究进展
专知会员服务
100+阅读 · 2020年6月26日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
87+阅读 · 2020年5月2日
【北航】面向自然语言处理的预训练技术研究综述
专知会员服务
113+阅读 · 2020年4月23日
专知会员服务
201+阅读 · 2020年3月6日
零样本图像分类综述 : 十年进展
专知会员服务
128+阅读 · 2019年11月16日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
231+阅读 · 2019年10月12日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
80+阅读 · 2019年10月12日
【紫冬讲堂】自动化所宗成庆:NLP的过去与现在
中国科学院自动化研究所
4+阅读 · 2019年5月14日
官方 | 从机器翻译到阅读理解,一文盘点PaddlePaddle九大NLP模型
机器学习算法与Python学习
9+阅读 · 2019年4月13日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero
中国科学院自动化研究所
17+阅读 · 2018年1月31日
独家 | 一文读懂自然语言处理NLP(附学习资料)
数据派THU
9+阅读 · 2017年10月11日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
VIP会员
相关VIP内容
深度学习可解释性研究进展
专知会员服务
100+阅读 · 2020年6月26日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
87+阅读 · 2020年5月2日
【北航】面向自然语言处理的预训练技术研究综述
专知会员服务
113+阅读 · 2020年4月23日
专知会员服务
201+阅读 · 2020年3月6日
零样本图像分类综述 : 十年进展
专知会员服务
128+阅读 · 2019年11月16日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
231+阅读 · 2019年10月12日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
80+阅读 · 2019年10月12日
Top
微信扫码咨询专知VIP会员