导读
本篇「优青论坛」文章回顾了近期点击模型领域中用于改善搜索排名的建模研究工作,并提出了一种新的基于卷积神经网络整合结果内容特征与用户行为特征的点击模型构建方法。「优青」作者为刘奕群。
刘奕群,清华大学计算机系副教授。2016 年 NSFC“优秀青年科学基金”获得者。优青作者详细介绍参见后文。
现代搜索引擎可以记录用户交互行为,并使用这些记录提高搜索质量。用户点击行为数据已被成功用于提高广告投放、搜索结果排序、查询推荐等方面。虽然点击行为日志可以提供用户点击偏好的隐式反馈,但由于存在点击噪声和行为偏差,进行准确的相关性估计仍很困难。
大量已有研究工作表明,用户点击行为受到诸多偏置性因素的影响,例如位置(用户的注意力随着从上而下浏览信息而衰减)、展现形式(不同展现方式的结果对用户的吸引力不同)、 信任(网站的声誉影响用户的判断等)。为了解决这些问题,研究人员提出了若干行为模型(通常称为点击模型)来描述用户实际浏览行为,并获取结果相关性的无偏差估计。
本文回顾了近期点击模型领域中用于改善搜索排名的建模研究工作,并提出了一种新的基于卷积神经网络整合结果内容特征与用户行为特征的点击模型构建方法。与传统的点击模型相比,本文构建的模型不仅将用户行为假设作为输入信号,还使用搜索引擎结果页面的内容和上下文信息。此外,该模型使用传统点击模型中的参数来限制模型隐藏层中的一些输出的意义。实验结果表明,该模型可比现有传统点击模型取得更好的改善效果。
FCS「优青论坛」由主编李未院士,执行主编熊璋教授和周志华教授发起,以综述论文的形式,集中展现「NSFC 优秀青年基金」获得者对所研究领域的分析和见解,介绍最新的研究进展和成果。
文 章 精 要
如需阅读本期推荐文章的全文,请点左下角的「阅读原文」链接。
作者介绍
刘奕群,清华大学计算机系副教授,兼任中国人工智能学会理事、中国中文信息学会理事、信息检索与内容安全专委会副主任等职务。主要研究领域集中在信息检索与互联网搜索技术。据Google Scholar统计,论文被引用2400余次。申请专利24项并授权13项。获得ACM SIGIR2015 最佳论文提名奖,指导学生获得 SIGIR2017 最佳学生论文奖。他与研究团队在TREC、NTCIR等多个国际知名著名评测中多次获得第一名。受邀担任 SIGIR 2017短文主席、SIGIR2018程序委员会主席、NTCIR-13程序委员会主席。担任国际学术期刊Foundations and Trends in Information Retrieval 主编,Frontiers of Computer Science青年AE。以第一完成人获得2015年北京市科学技术一等奖和2010年钱伟长中文信息处理科学技术奖—汉王青年创新一等奖。2016年获得国家自然基金委优秀青年科学基金资助;2017年作为负责人获得自然基金重点项目资助。
Frontiers of Computer Science
Frontiers of Computer Science 是由教育部主管、高等教育出版社和德国 Springer 公司共同出版的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”。
长按二维码关注Frontiers of Computer Science公众号