项目名称: 面向科技监测的实体识别与关系抽取研究

项目编号: No.71403257

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 管理科学

项目作者: 石崇德

作者单位: 中国科学技术信息研究所

项目金额: 22万元

中文摘要: 本项目主要面向科技监测这一实际应用,基于数据挖掘和自然语言处理技术,研究不同类型科技文献中的科技实体识别和实体关系抽取理论和关键技术,并实现一个高性能、高适应性的科技实体识别和实体关系抽取系统。本项目通过多特征融合训练进行科技领域关键实体的识别;联系深层语法理论,基于中心语驱动语法(HPSG)的多层次句法语义信息选择语义关系树,并通过树核函数计算子树相似度,实现基于支持向量机的关系抽取算法;以自举(bootstrapping)算法为基础,通过在小规模标注语料训练生成原始抽取模型,进一步对大规模未标注语料进行标注,自动分析和归纳新的关系抽取模板、总结相应的特征,迭代生成准确率更高、覆盖面更广的抽取模型。本项目的研究成果能够为科技监测中大规模文本信息挖掘奠定基础。

中文关键词: 科技监测;实体识别;关系抽取;术语识别;深度神经网络

英文摘要: This project is based on data mining and natural language processing to do research on theory and algorithms of sci-tech entity recognition and relation extraction in sci-tech trends analysis. We propose a unified learning algorithm to incorporate differe

英文关键词: scientific and technical infomation monitoring;entity recognition;relation extraction;terminology extraction;deep neural network

成为VIP会员查看完整内容
3

相关内容

关系抽取指的是检测和识别文本中实体之间的语义关系,并将表示同一语义关系的提及(mention)链接起来的任务。关系提取任务需要在一组工件(通常来自文本或XML文档)中对语义关系提及进行检测和分类。该任务与信息抽取(IE)的任务非常相似,但是IE还需要删除重复关系(消除歧义),并且通常指的是提取许多不同的关系。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
68+阅读 · 2021年8月20日
专知会员服务
34+阅读 · 2021年8月19日
北航《深度学习事件抽取》文献综述和当前趋势
专知会员服务
83+阅读 · 2021年7月6日
专知会员服务
79+阅读 · 2021年5月27日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
67+阅读 · 2021年2月7日
专知会员服务
111+阅读 · 2021年1月8日
专知会员服务
193+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
论文浅尝 | 面向开放域的无监督实体对齐
开放知识图谱
1+阅读 · 2021年8月24日
远程监督在关系抽取中的应用
深度学习自然语言处理
12+阅读 · 2020年10月26日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
26+阅读 · 2020年3月1日
知识图谱从哪里来:实体关系抽取的现状与未来
AI科技评论
13+阅读 · 2019年11月17日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
5+阅读 · 2008年12月31日
Arxiv
1+阅读 · 2022年4月20日
Arxiv
14+阅读 · 2018年5月15日
小贴士
相关VIP内容
专知会员服务
68+阅读 · 2021年8月20日
专知会员服务
34+阅读 · 2021年8月19日
北航《深度学习事件抽取》文献综述和当前趋势
专知会员服务
83+阅读 · 2021年7月6日
专知会员服务
79+阅读 · 2021年5月27日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
67+阅读 · 2021年2月7日
专知会员服务
111+阅读 · 2021年1月8日
专知会员服务
193+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
相关资讯
论文浅尝 | 面向开放域的无监督实体对齐
开放知识图谱
1+阅读 · 2021年8月24日
远程监督在关系抽取中的应用
深度学习自然语言处理
12+阅读 · 2020年10月26日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
26+阅读 · 2020年3月1日
知识图谱从哪里来:实体关系抽取的现状与未来
AI科技评论
13+阅读 · 2019年11月17日
技术动态 | 跨句多元关系抽取
开放知识图谱
50+阅读 · 2019年10月24日
ACL 2019 | 面向远程监督关系抽取的模式诊断技术
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
5+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员