项目名称: 面向网页检索应用的汉语语义概念图表示方法研究

项目编号: No.60873135

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 金属学与金属工艺

项目作者: 陆汝占

作者单位: 上海交通大学

项目金额: 30万元

中文摘要: 本项目研究汉语概念语义计算,并将其用于网络信息检索分类,允许用户以自然语言表达其检索需求,能够自由、宽松地表达用户的真实意愿,吻合人脑思维与语言相紧密联系的认知方式,完全改变传统检索模型的局限性。在标引查询需求和文档时,根据汉语概念直接耦合的特点,在文档中提取概念,通过概念复合运算,建立概念与概念间的关系,构成有理据的概念网络,使关键词不再是离散无序不相关的碎片,从而能更好地体现文档所包含的语义信息。用户需求与文档之间的匹配就因此转化为概念网的整体匹配。预期可大大提高网络文本检索的准确率,降低用户找到自己所需信息的时间。 项目开发的二次检索技术可用于新一代网络搜索引擎及新一代数字图书馆,有望推进该领域的产业发展。兼有语言处理能力的搜索引擎技术一旦研究成功,有望开发成为国际上新一代搜索引擎,不仅受到国际大公司的青睐,更重要的是有望由此形成一个新的产业。

中文关键词: 汉语语义计算;概念复合;信息检索

英文摘要: This project studies Chinese conceptual semantic computation and employs it in information retrieval on internet, allowing users to express retrieval demand in natural language, which presents users’real need in free and easy way. This approach is consistent with the cognitive way that human brain and language are closely related, thus conquer the limitation of traditional information retrieval model. While indexing queries and documents, concepts are extracted from documents based on the characteristic that Chinese concepts couple directly. After that, the relations among concepts are constructed by conceptual compound computation, constituting a reasonable conceptual network, so that keywords are not discrete and unrelated segments any more, which can express semantic information of document better. Matching queries with documents is thus transformed into matching conceptual network. It is expected that the approach can improve precision of information retrieval and reduce the time of finding users’needed information. The second-retrieval technology of this project can be applied to new generation search engine and digital library and helps boost the development. It is hopeful that the search engine technology with natural language processing capability will become the new generation search engine, which can not only be given more attention by international companies, but also be hoped to become a new industry.

英文关键词: Chinese semantic computation;conceptual compound computation;information retrieval

成为VIP会员查看完整内容
0

相关内容

【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
面向知识图谱的知识推理综述
专知会员服务
144+阅读 · 2021年11月1日
面向数据可视化的自然语言接口: 综述论文
专知会员服务
18+阅读 · 2021年9月12日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
59+阅读 · 2021年5月28日
专知会员服务
189+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
KoPL: 面向知识的推理问答编程语言
学术头条
1+阅读 · 2021年11月10日
【数字孪生】数字孪生技术从概念到应用
产业智能官
85+阅读 · 2020年2月16日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
论文浅尝 | 基于知识库的自然语言理解 03#
开放知识图谱
14+阅读 · 2019年2月26日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
25+阅读 · 2018年8月19日
小贴士
相关VIP内容
【WWW2022】TaxoEnrich:通过结构语义表示的自监督分类法补全
面向语义搜索的自然语言处理
专知会员服务
58+阅读 · 2021年12月18日
面向知识图谱的知识推理综述
专知会员服务
144+阅读 · 2021年11月1日
面向数据可视化的自然语言接口: 综述论文
专知会员服务
18+阅读 · 2021年9月12日
专知会员服务
15+阅读 · 2021年8月13日
专知会员服务
59+阅读 · 2021年5月28日
专知会员服务
189+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
相关资讯
相关基金
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员