项目名称: 基于翻译学习和核方法的中文模糊限制信息检测研究

项目编号: No.61272375

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 周惠巍

作者单位: 大连理工大学

项目金额: 80万元

中文摘要: 作为信息抽取的一个重要环节,模糊限制信息检测旨在区分不确定信息与事实信息,避免将模糊限制信息作为事实信息用于信息抽取。近年来,英文模糊限制信息的检测已取得了阶段性研究成果,中文模糊限制语广泛用于中文各个领域,开展中文模糊限制信息检测的研究对于中文事实信息抽取具有重要意义。本项目首先针对生物医学文献,基于英文标注数据,采用翻译学习方法,训练中文模糊限制性句子识别模型,实现跨语言学习;然后采用迁移学习方法,将从中文生物医学文献学习获得的模糊限制性句子识别知识迁移至向其他领域,实现跨领域模糊限制性句子识别;设计并构建中文模糊限制信息语料库;抽取平面特征和句法、语义的结构化特征,使用多项式核和卷积树核的复合核,建立模糊限制信息范围检测模型。跨语言、跨领域的模糊限制性句子识别研究,将为自然语言处理中知识的迁移、推广提供理论基础和方法支撑;研究中文模糊限制信息检测将提高中文信息抽取的真实性和准确性。

中文关键词: 中文模糊限制信息检测;迁移学习;深度学习;核方法;表示学习

英文摘要: As an essential important step of information extraction, hedge detection is used to distinguish factual and uncertain information to avoid extracting speculative information as factual information. In recent years, extensive research has been done on automatic hedge detection from English texts. Meanwhile, hedges are widely used in Chinese texts of various fields, and the research on hedge detection from Chinese tests is, therefore, of essential importance in Chinese information extraction. In this work, translated learning methods are exploited for cross-language learning to identify Chinese hedge sentences based on English training data in the biomedical domain, transfer learning methods are exploited to transfer the knowledge extracted from Chinese biomedical domain to the other domain to solve cross-domain hedged sentences identification, Chinese hedge corpora are designed and constructed, and flat features and structured features of syntactic and semantic information are extracted to train a hedge scope detection model by the convolution tree kernel which consists of a polynomial kernel and a convolution tree kernel. In a word, the research of cross-language and cross-domain hedged sentences identification will provide both a theoretical foundation and specific methods for knowledge transferring and spread

英文关键词: Chinese hedge detection;transfer learning;deep learning;kernel methods;representation learning

成为VIP会员查看完整内容
2

相关内容

【AI+军事】附PPT 《前瞻性分析:获得决策优势的方法》
专知会员服务
81+阅读 · 2022年4月17日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
【文本分类大综述:从浅层到深度学习,35页pdf】
专知会员服务
183+阅读 · 2020年8月6日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习
NeurIPS 2021 | 物体检测与分割的零标签视觉学习
微软研究院AI头条
0+阅读 · 2021年12月1日
IJCAI'21 | 理解GNN的"弱点"
图与推荐
0+阅读 · 2021年11月26日
KDD 2019论文解读:异构信息网络上的对抗生成学习
云栖社区
22+阅读 · 2019年8月21日
论文浅尝 | 多内容实体和关系联合抽取的对抗训练
开放知识图谱
42+阅读 · 2018年12月4日
CNN与RNN中文文本分类-基于TensorFlow 实现
七月在线实验室
13+阅读 · 2018年10月30日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
【学习】 用IDCNN和CRF做端到端的中文实体识别(附代码)
机器学习研究会
68+阅读 · 2017年9月20日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Age Optimal Sampling Under Unknown Delay Statistics
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
12+阅读 · 2021年10月22日
Arxiv
10+阅读 · 2018年2月17日
小贴士
相关VIP内容
【AI+军事】附PPT 《前瞻性分析:获得决策优势的方法》
专知会员服务
81+阅读 · 2022年4月17日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习
专知会员服务
48+阅读 · 2021年12月20日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
【文本分类大综述:从浅层到深度学习,35页pdf】
专知会员服务
183+阅读 · 2020年8月6日
基于改进卷积神经网络的短文本分类模型
专知会员服务
25+阅读 · 2020年7月22日
【ACL2020】基于图神经网络的文本分类新方法
专知会员服务
68+阅读 · 2020年7月12日
相关资讯
论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习
NeurIPS 2021 | 物体检测与分割的零标签视觉学习
微软研究院AI头条
0+阅读 · 2021年12月1日
IJCAI'21 | 理解GNN的"弱点"
图与推荐
0+阅读 · 2021年11月26日
KDD 2019论文解读:异构信息网络上的对抗生成学习
云栖社区
22+阅读 · 2019年8月21日
论文浅尝 | 多内容实体和关系联合抽取的对抗训练
开放知识图谱
42+阅读 · 2018年12月4日
CNN与RNN中文文本分类-基于TensorFlow 实现
七月在线实验室
13+阅读 · 2018年10月30日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
【学习】 用IDCNN和CRF做端到端的中文实体识别(附代码)
机器学习研究会
68+阅读 · 2017年9月20日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员