项目名称: 基于本体的专利自动标引研究

项目编号: No.61271304

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 无线电电子学、电信技术

项目作者: 吕学强

作者单位: 北京信息科技大学

项目金额: 75万元

中文摘要: 在信息爆炸的今天,专利文献以几何级数量暴增,社会面临着海量信息检索困难、人工深度标引专利文献的成本日益增高等问题。本项目提出一种基于领域本体的专利自动标引方法。通过对专利术语挖掘、领域本体库构建、专利文本表示和标引词发现等关键技术的研究,重点解决专利自动标引中领域本体库构建、自动标引两大问题。本项目从专利查询日志用户检索信息和专利文本内容结构特征等方面入手,提出了基于查询特征的术语发现方法、基于领域耦合度的术语挖掘方法、基于结构-语域网和概念-词结构的专利文本表示模型。通过挖掘领域概念构建专利本体库,基于本体库实现概念相似度度量,达到专利自动标引的目的,进一步提高了标引词对专利文本描述的完备性、准确性。通过本项目的研究,可构建基于专利的本体库,实现内容更完整、语义更全面的专利文本表示,提高专利自动标引效率,为新一代专利信息检索提供标引理论、方法和资源的支持,促进国民经济和社会发展。

中文关键词: 专利文本;专利术语;专利本体;专利知识;专利标引

英文摘要: With the explosion of information nowadays, the patent documents boosted in a geometric level, which has caused a seires of problems, such as the difficulty of massive information retrieval, the increasing cost of artificial deep indexing of patent documents, etc.Thus this project proposes an automatic indexing method of patent based on domain ontology. According to the research of the mining of patent terms, the construction of the Domain Ontology Base, the presentation of patent text and the discovery of indexing words, this project focus on the construction of the domain ontology base and automatic indexing. From the user retrieval information in the patent logs and the structural features of patent text, this project proposes a terminology discovery method based on query feature, a term mining method based on domain coupling, and a patent text representation model based on structure-register nets and concept-word space. Constructing patent ontology by mining the domain concept, then achieving the measure of conceptual similarity, this method would further improve the integrality and accuracy of the description of patent by indexing word. By the research of the project, patent-based ontology can be constructed to make the patent text more comprehensive in semantics and more affluent in essence, so that more

英文关键词: Patent text;Patent term;Patent ontology;Patent knowledge;Patent indexing

成为VIP会员查看完整内容
1

相关内容

面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
专知会员服务
56+阅读 · 2021年8月12日
专知会员服务
23+阅读 · 2021年6月19日
专知会员服务
36+阅读 · 2020年12月14日
专知会员服务
33+阅读 · 2020年9月25日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
86+阅读 · 2020年5月2日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
云孚知识图谱YFKG:可自动扩充的知识图谱
哈工大SCIR
4+阅读 · 2021年4月23日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
人工智能学家
17+阅读 · 2017年11月11日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
小贴士
相关VIP内容
面向语义搜索的自然语言处理
专知会员服务
59+阅读 · 2021年12月18日
专知会员服务
56+阅读 · 2021年8月12日
专知会员服务
23+阅读 · 2021年6月19日
专知会员服务
36+阅读 · 2020年12月14日
专知会员服务
33+阅读 · 2020年9月25日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
86+阅读 · 2020年5月2日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
相关资讯
云孚知识图谱YFKG:可自动扩充的知识图谱
哈工大SCIR
4+阅读 · 2021年4月23日
知识图谱的自动构建
DataFunTalk
55+阅读 · 2019年12月9日
论文浅尝 | 基于知识库的自然语言理解 04#
开放知识图谱
14+阅读 · 2019年3月14日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
人工智能学家
17+阅读 · 2017年11月11日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员