文末赠书 | 搜索引擎中的实体推荐技术研究

2022 年 7 月 29 日 机器学习与推荐算法
嘿,记得给“机器学习与推荐算法”添加星标



搜索引擎是人们获取信息的重要工具。近几年,人们获取信息的需求不断提升,促使搜索引擎不断发展和进化,从被动地为用户提供查询结果,转变为主动地为用户提供直接答案并推荐相关信息。其中, 实体推荐是推荐粒度最细且信息量最丰富的一种信息推荐形式,备受学术界重视,也深受用户欢迎。

《搜索引擎中的实体推荐关键技术研究》围绕实体推荐,针对实体推荐算法的改进和推荐理由的生成这两方面的关键技术进行研究,并得出研究结论。 本书适合计算机领域的研究生以及从业人员阅读,可以帮助读者较全面地了解实体推荐算法。




搜索引擎是获取信息的重要工具。近年来,为了更好地满足用户的信息获取需求,搜索引擎从最初只能被动地根据查询返回相关网页,逐步改进到能够主动地根据查询提供相关信息推荐。

实体推荐,即以实体为粒度进行信息推荐,是搜索引擎中推荐粒度最细且信息量最丰富的一种信息推荐形式。 实体推荐旨在为用户提供与其查询存在直接或间接关系的实体列表,能够帮助用户拓展知识面,因而越来越受到用户的欢迎。因此,实体推荐不仅成为现代搜索引擎必不可少的功能之一,也正成为学术界重视的研究课题。

搜索引擎实体推荐系统不仅需要为用户提供与其查询相关的实体推荐结果,还需要对实体推荐结果进行恰当且合理的解释,以帮助用户更好地理解推荐结果。相应地,搜索引擎中的实体推荐研究主要包含以下两个方面:


  • 实体推荐算法,其目标是获取与查询相关的实体集合并对其进行排序;
  • 实体推荐的可解释性,其目标是为实体推荐结果生成推荐理由,以提升推荐结果的可信度。

为此,《搜索引擎中的实体推荐关键技术研究》一书作者研究了实体推荐算法的改进以及推荐理由的生成两个方面的关键技术,具体包括: 适用于搜索引擎的大规模实体推荐算法,以及基于上下文优化实体推荐算法的具体策略;实体对推荐理由的识别,以及实体推荐理由的生成。其中的主要研究内容包括以下几个方面:

1. 基于排序学习与信息新颖性增强的实体推荐
构建适用于搜索引擎的大规模实体推荐系统主要面临以下四个挑战:查询与实体规模庞大,查询的领域无关性,用户实体点击数据极其稀疏以及很难为用户推荐具有信息新颖性的实体。针对上述挑战,作者提出了一种基于排序学习框架的实体推荐算法,并围绕信息新颖性设计了相关特征与优化目标。一方面可以灵活地对召回与排序进行分阶段优化,另一方面可以直接基于查询并面向信息新颖性构建多种粒度的排序特征,进而针对不同用户偏好以及任何类型的查询,为用户提供个性化且兼具信息新颖性的实体推荐结果,从而显著提升实体推荐效果以及用户参与度。

2. 基于深度多任务学习的上下文相关实体推荐
针对目前实体推荐方法普遍存在的忽略上下文信息的问题以及上下文相关实体点击数据的数据稀疏问题,作者提出了一种基于深度多任务学习的上下文相关实体推荐模型。此模型一方面可以借助于上下文相关文档排序这一辅助任务中的大规模多任务交叉数据,另一方面可以基于多任务学习来实现知识迁移,进而有效缓解数据稀疏问题并提升实体推荐结果的相关性,从而显著提升推荐效果。

3. 基于卷积神经网络的实体对推荐理由识别
当推荐实体与查询实体(实体对)之间存在确定的实体关系时,将能够翔实地描述该实体对之间的关系的句子作为推荐理由(简称为实体对推荐理由)展现给用户,可以帮助用户理解两个实体间的关系,从而提升推荐结果的可信度。目前的实体对推荐理由识别方法严重依赖于人工标注的数据集以及人工设计的排序特征,从而导致识别出的实体对推荐理由的质量较低。针对上述问题,作者提出了一种基于卷积神经网络的实体对推荐理由识别方法。一方面可以借助于搜索引擎点击日志自动构建大规模训练数据,另一方面可以通过卷积神经网络自动学习排序特征,进而显著提升排序效果和实体对推荐理由的质量。

4. 基于机器翻译模型的实体推荐理由生成
当推荐实体与查询之间不存在可归类的关系时,将能够刻画推荐实体特点的简短描述作为推荐理由(简称为实体推荐理由)展现给用户,可以帮助用户理清当前实体与查询间的关联,从而提升推荐结果的可信度。然而,前人在实体推荐理由生成研究上鲜有涉猎。为此,作者提出了基于机器翻译模型的实体推荐理由生成方法,尤其是提出了一种由实体信息指导的基于序列到序列学习的实体推荐理由生成模型。一方面可以有效识别并保留源句子中的重要信息,另一方面可以指引模型生成与实体相关的结果,从而生成质量更高的实体推荐理由。

上述研究成果已在百度搜索引擎中大规模应用,产生了重要的应用价值。同时该研究成果 荣获2017年中国电子学会科技进步一等奖




作者介绍

黄际洲 博士
正高级工程师,百度人工智能技术委员会主席,百度地图首席研发架构师。多年来一直从事自然语言处理、知识图谱、数据挖掘等人工智能相关技术研发及大规模产业化工作,先后担任百度阿拉丁、图片搜索、搜索推荐、信息流推荐、百度地图等产品的研发架构师。已发表学术论文30余篇,获得已授权专利110余项。曾荣获中国电子学会科技进步一等奖、CCF优秀博士学位论文奖。
导师信息
王海峰 教授
百度首席技术官,深度学习技术及应用国家工程研究中心主任,哈尔滨工业大学兼职教授。他是自然语言处理领域最重要的国际学术组织ACL的首位华人主席、ACL亚太分会创始主席、ACL Fellow,还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士等。获国家技术发明二等奖、国家科技进步二等奖、中国专利金奖、光华工程科技奖、首届全国创新争先奖、首个吴文俊人工智能杰出贡献奖等。已发表学术论文200余篇,获得已授权专利170余项。





CCF从2006年起设立优秀博士学位论文奖,每年从国内高校计算机学科博士毕业生中,评选不超过10名CCF优秀博士学位论文获得者(简称CCF优博),截至 2021 年已有 145 位青年学者获得该奖。CCF优博的研究领域涵盖体系结构、操作系统、数据库、人工智能、量子计算等领域的前沿问题。他们走上工作岗位以后均做出了显著的科技或产业贡献,有的获国家科技大奖,有的获评国际高被引学者,有的研发出高端产品,大都成为计算机领域国内国际知名学者、一方学术带头人或有影响力的企业家。


为了更好地展示我国计算机学科博士生教育取得的成效,推广博士生科研成果,加强高端学术交流,CCF PRESS 将以“CCF优秀博士学位论文丛书”的形式,陆续选择2006年至今及以后的部分优秀博士论文全文出版,并以此庆祝中国计算机学会建会60周年。


福利时间
本次联合【机械工业出版社】为大家送出5本搜索引擎中的实体推荐关键技术研究》!参与方法:
1.  转发本文案 朋友圈
2. 点亮 本文 在看
3. 公众号 后台回复"赠书",参与抽奖!
(长按图片直达公号后台)
8月2日晚8点结束并开奖。中奖读者将被免费寄送 !!!

登录查看更多
1

相关内容

微信搜一搜中的智能问答技术
专知会员服务
37+阅读 · 2022年6月18日
对话推荐算法研究综述
专知会员服务
37+阅读 · 2022年4月4日
专知会员服务
126+阅读 · 2021年6月12日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
45+阅读 · 2020年12月9日
应用知识图谱的推荐方法与系统
专知会员服务
116+阅读 · 2020年11月23日
基于旅游知识图谱的可解释景点推荐
专知会员服务
92+阅读 · 2020年9月4日
个性化推荐系统技术进展
专知会员服务
66+阅读 · 2020年8月15日
文末赠书 | 冷启动推荐算法理论与实践总结
机器学习与推荐算法
1+阅读 · 2022年8月20日
文末赠书 | 推荐算法的三大研究热点
机器学习与推荐算法
0+阅读 · 2022年7月22日
赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐
哈工大SCIR
0+阅读 · 2022年3月11日
文末赠书 | 实用推荐系统: 寻找有用的用户行为
机器学习与推荐算法
1+阅读 · 2021年11月12日
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
推荐系统概述
Python开发者
11+阅读 · 2018年9月27日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2022年11月26日
Arxiv
0+阅读 · 2022年11月26日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
13+阅读 · 2018年1月20日
VIP会员
相关VIP内容
微信搜一搜中的智能问答技术
专知会员服务
37+阅读 · 2022年6月18日
对话推荐算法研究综述
专知会员服务
37+阅读 · 2022年4月4日
专知会员服务
126+阅读 · 2021年6月12日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
45+阅读 · 2020年12月9日
应用知识图谱的推荐方法与系统
专知会员服务
116+阅读 · 2020年11月23日
基于旅游知识图谱的可解释景点推荐
专知会员服务
92+阅读 · 2020年9月4日
个性化推荐系统技术进展
专知会员服务
66+阅读 · 2020年8月15日
相关资讯
文末赠书 | 冷启动推荐算法理论与实践总结
机器学习与推荐算法
1+阅读 · 2022年8月20日
文末赠书 | 推荐算法的三大研究热点
机器学习与推荐算法
0+阅读 · 2022年7月22日
赛尔原创@EMNLP 2021 | 多语言和跨语言对话推荐
哈工大SCIR
0+阅读 · 2022年3月11日
文末赠书 | 实用推荐系统: 寻找有用的用户行为
机器学习与推荐算法
1+阅读 · 2021年11月12日
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
推荐系统概述
Python开发者
11+阅读 · 2018年9月27日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
相关论文
Arxiv
0+阅读 · 2022年11月26日
Arxiv
0+阅读 · 2022年11月26日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
13+阅读 · 2018年1月20日
Top
微信扫码咨询专知VIP会员