项目名称: 查询语义分析驱动的多层次交互式查询意图识别技术研究
项目编号: No.61402304
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 宋巍
作者单位: 首都师范大学
项目金额: 26万元
中文摘要: 查询意图是指用户在构建查询时希望搜索系统能够返回的信息。准确识别查询意图是搜索引擎克服信息过载问题的关键。由于数据稀疏和用户隐私等问题,试图完全自动地预测查询意图面临着较大困难与风险。本课题尝试采用人机协同方式,研究查询语义分析驱动的多层次、交互式查询意图识别技术。具体研究内容包括:1)利用语义组合构建查询全局语义表示,克服由于数据稀疏和搜索结果质量不高导致的难查询语义表达问题,支持查询语义分析。2)基于查询歧义分析,自动判断查询意图层次,从语义层次到属性层次逐层确定查询意图,与用户搜索过程自然结合。3)基于查询语义意图归纳,挖掘并清晰表达潜在的查询意图,减轻用户认知负担,促进交互。4)以查询意图识别结果为基础,提出了基于语义意图的相关反馈模型改善文档相关性排序,以及基于属性意图的多维度信息摘要直接满足用户信息需求。课题目标是实现高性能的交互式搜索系统,解决因查询意图模糊导致的检索难题。
中文关键词: 查询意图;篇章分析;信息检索;用户建模;个性化
英文摘要: Query intent refers to the information that users expect the search system to return in respond to their queries. Accurately identifying user intent is the key for search engine to overcome the information overload problem. Due to the data sparseness and
英文关键词: Query Intent;Discourse Analysis;Information Retrieval;User Profiling;Personalization