项目名称: 非合作环境下结构化数据的深层关键词搜索
项目编号: No.61363010
项目类型: 地区科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 刘喜平
作者单位: 江西财经大学
项目金额: 45万元
中文摘要: 当前存在大量非合作环境下的结构化数据,如Deep Web数据,而关键词搜索是一种简单、有效的查询方式,如何将关键词搜索与非合作环境下的结构化数据结合起来具有重要研究意义,本项目对这一问题展开研究。具体内容包括:查询理解,根据关键词查询推导用户的查询意图;查询处理,基于非合作数据源的查询接口产生查询结果;查询结果扩展,自动地对查询进行改写以丰富查询结果。考虑到数据源非合作性的特点,提出一种新的手段来有效地利用查询日志和点击数据,即建立查询包含图。基于查询包含图,提出了查询理解和查询结果扩展的新技术。针对关键词查询模糊而随意的特点,并考虑到非合作数据源查询接口仅能提供有限的查询能力,提出了一个完整的查询处理框架和具体的查询处理技术,该框架基于查询接口,但是不受限于查询接口,有效地处理了关键词查询和查询接口的失配问题。我们提出的技术可以对非合作环境下结构化数据提供高质量、深层次的关键词查询结果。
中文关键词: 结构化数据;关键词搜索;非合作环境;查询模型;查询理解
英文摘要: Keyword search is a simple yet effective paradiam for accessing data. As a great number of structured data has accumulated in uncooperative environments such as Deep Web, an important problem arises as how to effectively query these structured data using
英文关键词: Structured Data;Keyword Search;Uncooperative Environment;Query Model;Query Understanding