项目名称: 信息搜索服务中一种新型多样性测度模型及多样性信息提取方法的研究
项目编号: No.71372044
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 管理科学
项目作者: 卫强
作者单位: 清华大学
项目金额: 60万元
中文摘要: 随着大数据时代的不断临近,信息搜索服务所提供的搜索结果也呈现信息过载的特征。同时,随着信息搜索用户的深度应用,且浏览时间和空间的约束,如何在有限的第一页搜索结果中呈现给用户更具多样性的信息,逐渐成为了一个影响搜索体验和信息搜索服务质量的重要因素。信息多样性包括信息覆盖和信息冗余两个方面,而已有的研究更多着眼在信息内容覆盖而忽略了信息结构覆盖这一重要测度,且目前已有方法也存在结果不够理想和效率不高等缺陷。因此,本项目计划从以下几个方面入手进行研究:(1)设计考虑信息结构的信息覆盖度和信息冗余度的多样性测度模型;(2)应用多样性测度对多样性信息提取方法进行评估和比较;(3)设计一种高效的启发式多样性信息提取方法:(4)通过大规模搜索数据实验验证测度模型和提取方法的有效性。通过本项目所提出的测度模型和提取方法能更好地适应大数据环境下的深度多样性信息搜索服务的要求。
中文关键词: 信息提取;代表性;竞争性;个性化;信息结构
英文摘要: As the Big-Data era comes, the search results presented by state-of-art information search service appear the characteristic of information overload. Simultaneously, with the deepening application of users and limitations of browsing duration and space, h
英文关键词: Information Retrieval;Representativeness;Competitiveness;Personalization;Information Structure