项目名称: 基于短文本的知识库自动更新关键技术研究

项目编号: No.61472040

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 宋丹丹

作者单位: 北京理工大学

项目金额: 84万元

中文摘要: 知识库对于知识的整理和利用具有重要意义,但传统的知识库更新由于依靠人工编辑导致内容滞后问题严重,使得知识库的自动更新成为研究热点。近年来快速增长的短文本数据因其具有海量性、实时性、信息特有性等优点成为知识库更新的一个重要数据来源。但是,由于短文本内容少、噪声多、表述多样、语法不规范,给自动更新过程带来很大挑战。 本项目研究基于短文本的知识库自动更新关键技术,具体包括:针对海量实时短文本的索引需求,构建引入密度的改进依存文法模型,提出面向实体信息的短文本可索引内容识别方法;研究稀疏特征空间上的可用特征扩展方法,通过引入时空信息进行有效特征扩展;基于有限标注数据,提出融合分类与排序目标的训练和分析方法,进行实体-短文本相关性分析;提出语义规则模板自学习算法,研究短文本中实体信息的自适应抽取。从而实现基于海量、实时、多样的短文本进行知识库自动更新的目标。

中文关键词: 知识库;短文本;知识挖掘;文本挖掘

英文摘要: Knowledge base is essential for knowledge management and utilization. But traditional knowledge bases are maintained manually by volunteer editors, which make them hard to keep up-to-date. Consequenctly, automatic update of knowledge bases becomes a hot research topic. In recent years, short texts are increasing rapidly, and as their information is massive, real-time, and specific, short texts become an important information source to update knowledge bases. However, short texts contains few contents and much noise, with various expressions and irregular grammars, thus bring big challenges for automatic updating process. In this project, we will research on key technologies for automatic updating of knowledge bases based on short texts. Firstly, facing the challenges in data storage and indexing, we will construct a tailored dependency grammar model with densities, and research on the identification for indexable contents of short texts. Secondly, we will propose a feature extension method for entities and short texts with temporal and spatial information incorporated, to solve the sparse problem of the feature space. Thirdly, with limited annotation data, we will give out a correlation discrimination method of entity and short text pairs combining classification and ranking targets. Finally, we will provide a semantic rule template self-learning method to adaptively extract entity information from short texts. In this way, we can realize the goal of automatic updating knowledge bases from short texts.

英文关键词: Knowledge Base;Short Texts;Knowledge Mining;Text Mining

成为VIP会员查看完整内容
0

相关内容

知识库(Knowledge Base)是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算 机存储器中 存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定 理和运算法则以及常识性知识等。
军事知识图谱构建技术
专知会员服务
122+阅读 · 2022年4月8日
知识图谱嵌入技术研究综述
专知会员服务
133+阅读 · 2022年2月5日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
36+阅读 · 2020年12月14日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
专知会员服务
193+阅读 · 2020年10月14日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
知识图谱更新技术研究及其应用,复旦大学硕士论文
专知会员服务
103+阅读 · 2019年11月4日
深度学习下的京东搜索召回技术
专知
1+阅读 · 2022年3月11日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
122+阅读 · 2022年4月8日
知识图谱嵌入技术研究综述
专知会员服务
133+阅读 · 2022年2月5日
专知会员服务
69+阅读 · 2021年5月21日
专知会员服务
36+阅读 · 2020年12月14日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
44+阅读 · 2020年12月9日
专知会员服务
193+阅读 · 2020年10月14日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
知识图谱更新技术研究及其应用,复旦大学硕士论文
专知会员服务
103+阅读 · 2019年11月4日
相关资讯
深度学习下的京东搜索召回技术
专知
1+阅读 · 2022年3月11日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
38+阅读 · 2019年8月18日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员