项目名称: 向量组合学习框架下基于依存混合树的中文语义解析研究

项目编号: No.61472191

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 周俊生

作者单位: 南京师范大学

项目金额: 78万元

中文摘要: 语义解析的目标是将自然语言形式的句子转换成一种完全形式化的意义表示,从而使得自然语言句子能被计算机自动理解和执行。本项目面向实现中文GIS自然语言接口的实际应用需求,针对现有的判别式语义解析模型中特征工程方法的不足,探索在深度学习的向量组合学习框架下基于特征向量的自动学习实现语义解析的新途径。为此,首先需要设计一种新的树型构造机制,使之既能灵活地桥接自然语言句子与形式化语义表示之间的对应性,又能反映句子的句法结构;然后视之为隐变量,使用一种基于向量组合计算和结构化预测的联合学习方法,通过综合利用隐变量中的句法结构信息和分布式的词、短语向量中语义信息,实现更有效的语义解析方法。主要研究内容包括:大规模中文语义解析语料库建设、作为隐变量的树型构造机制的设计、中文词向量学习模型的选择与设计、向量组合学习框架下多层神经网络的建模、相应的推导和学习算法的设计,以及在中文GIS系统中的实际测试与应用。

中文关键词: 语义解析;自然语言接口;深度学习;递归神经网络;依存混合树

英文摘要: Semantic parsing is the task of mapping a natural language sentence into a complete, formal meaning representation in a meaning representation language, which is a formal unambiguous language that allows for automated inference and processing. Considering the drawbacks of feature engineering methods in the discriminative models and the actual needs of implementing the natural language interfaces for the GIS systems, this project explores a new way of semantic parsing based on automatic feature learning under a new compositional vector framework in deep learning. To this end, we first need to design a new construction mechanism that can not only bridge the gap between the natural language sentence and the corresponding formal meaning representation, but also capture the syntactic information of the sentence. Then, by viewing the proposed construction mechanism as a latent variable, we exploit a deep learning model that jointly learn compositional vector representation and structural prediction to implement an effective semantic parsing system. The main research contents of this project are: the construction of a large-scale corpus for semantic parsing, the design of a new construction mechanism, the selection and design of neural network models for word vector learning, modeling the compositional vector learning using the multi-layer neural network and the design of the corresponding inference and learning algorithms, and the final application and testing of the proposed semantic parsing models and algorithms in actual GIS systems.

英文关键词: Semantic parsing;natural language interface;deep learning;recusive neural network;dependency-based hybrid tree

成为VIP会员查看完整内容
3

相关内容

专知会员服务
84+阅读 · 2021年9月4日
专知会员服务
34+阅读 · 2021年6月16日
专知会员服务
60+阅读 · 2021年2月22日
【经典书】计算语言学:模型、资源的应用程序,198页pdf
专知会员服务
30+阅读 · 2020年11月19日
论文浅尝 | GraphIE:基于图的信息抽取框架
开放知识图谱
17+阅读 · 2019年6月2日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
NLP预训练模型大集合!
全球人工智能
31+阅读 · 2018年12月29日
100+中文词向量,总有一款适合你
专知
12+阅读 · 2018年5月13日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Identity-aware Graph Neural Networks
Arxiv
14+阅读 · 2021年1月25日
小贴士
相关资讯
论文浅尝 | GraphIE:基于图的信息抽取框架
开放知识图谱
17+阅读 · 2019年6月2日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
NLP预训练模型大集合!
全球人工智能
31+阅读 · 2018年12月29日
100+中文词向量,总有一款适合你
专知
12+阅读 · 2018年5月13日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
相关基金
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员