项目名称: 基于稀疏隐语义分析与众包的查询意图发现与推荐算法研究
项目编号: No.61402403
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 张寅
作者单位: 浙江大学
项目金额: 26万元
中文摘要: 准确地理解用户查询对于提高各类搜索引擎的服务质量至关重要。本项目以查询-点击日志、搜索结果内容以及开放知识库为主要研究对象,采用多层堆叠的稀疏隐语义分析模型以及众包作为主要技术手段,按照查询意图表示、查询意图发现、查询意图推荐的研究步骤开展研究。具体内容包括:基于多层堆叠的结构化稀疏隐语义分析模型的查询意图发现方法,自动从数据中学习得出合适的隐查询意图数目;基于泛化主动学习框架的结合众包-隐语义分析的查询意图发现方法,建模众包工人的工作质量,挑选对算法最有贡献的工人-任务配对进行众包;以及基于效用的多样化查询意图筛选与推荐方法。本项目旨在有机地结合众包与稀疏隐语义分析算法,同时发挥人脑与机器的长处,以从查询-点击日志为主的大规模异构数据中高质量地发现用户查询对应的多种隐查询意图,并选择最具效用的若干隐查询意图推荐给用户。
中文关键词: 查询意图发现;稀疏隐语义分析;众包;推荐算法;
英文摘要: Accurate query understanding is substantially important for improving service quality in all kinds of search engines. In this proposal, we specifically analyze large-scale query logs, search result contents and open knowledge bases to represent, discover
英文关键词: Query Intent Discovery;Sparse Latent Semantic Analysis;Crowdsourcing;Recommendation Algorithm;