项目名称: 基于参数估计理论的信息检索风险研究
项目编号: No.61402324
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 张鹏
作者单位: 天津大学
项目金额: 24万元
中文摘要: 风险最小化框架和收益-风险框架对信息检索模型的设计产生了广泛和持续的影响,但是对这两种框架下两类风险间的关联性目前仍缺乏形式化分析,例如对两类风险之间何时存在矛盾以及能否同时规避等问题尚未利用解析方法进行深入研究。若两类风险存在矛盾,设计检索模型时常会陷入减小某类风险的同时却加大另一类风险的两难困境,这将阻碍信息检索模型的实质性进展。针对上述问题,本项目将基于参数估计理论(如偏差-方差理论),形式化分析检索模型中相关性估计的两类风险之间的关联性,并研究相关性估计的风险下界,寻找进一步发展信息检索模型的突破口。同时,我们也将运用偏差-方差理论设计检索性能的整体评价指标,使其能够兼顾基于性能均值的传统指标和基于性能方差的风险指标。通过理论分析和实证评价,发展针对不同查询或不同用户的自适应相关性估计方法,并进一步地将这种方法应用于改善信息检索模型(如查询扩展模型和个性化检索模型)的整体性能风险。
中文关键词: 信息检索;检索风险;评价指标;自适应检索模型;
英文摘要: In information retrieval (IR) field, two risk frameworks, namely risk minimization framework and reward-risk framework, have continuously influenced the design and analysis of many major IR models. These two risk frameworks have modelled the risk in the p
英文关键词: Information Retrieval;Retrieval Risk;Evaluation Metric;Adaptive Retrieval Model;