项目名称: 基于Wiki的垂直搜索语义技术研究
项目编号: No.61202169
项目类型: 青年科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 赵德新
作者单位: 天津理工大学
项目金额: 22万元
中文摘要: 目前的Web搜索技术只是部分地解决海量信息资源的发现问题,信息的查全率和精确度仍然不能满足用户的需求。本项目针对当前的万维网环境下垂直搜索引擎的特点,利用维基百科丰富的语义资源,将传统信息检索技术与语义Web技术相结合,优化信息检索过程。具体内容包括:提出知识单元的语义表示方法,挖掘Wiki丰富的结构化语义关系,构建概念间的语义关联矩阵;给出主题爬虫的网页主题相关性度量方法,构建动态主题语义词典,提出垂直搜索引擎的查询自动分类算法;针对具有语义数据格式的文档索引,对语义信息进行不同粒度的解析,建立语义三层索引模型;提出语义搜索模型及其结构框架,对描述逻辑进行模糊扩展,以增加本体描述语言的模糊概念表达能力,探讨基于模糊Tableaux的可满足性推理算法。本项目的研究对探索实现智能搜索引擎具有重要的实际应用价值。
中文关键词: 信息检索;维基百科;搜索引擎;语义Web;
英文摘要: The current Web search technology is partially solved the discovery problem of vast information resources, and the recall and precision of information can not meet the needs of users. According to the feature of vertical search engine in the Web environme
英文关键词: information retrieval;wikipedia;search engine;semantic Web;