目前信息流推荐中使用的内容理解技术,主要有两部分构成:1. 门户时代和搜索时代遗留的技术积累:分类、关键词以及知识图谱相关技术;2. 深度学习带来的技术福利:embedding。但是分类对于兴趣点刻画太粗,实体又容易引起推荐多样性问题,而 embedding 技术又面临难以解释的问题。这次主要介绍在信息流推荐中,腾讯是如何做内容理解克服上述问题的。主要包括:

  • 项目背景
  • 兴趣图谱
  • 内容理解
  • 线上效果

概念体现了世界的知识,促进了人类的认知过程。从web文档中挖掘概念并构建相应的分类法是文本理解中的核心研究问题,并支持许多下游任务,如查询分析、知识库构建、推荐和搜索。然而,我们认为之前的大多数研究都是从Wikipedia或静态web页面中提取了正式的和过于一般化的概念,而这些概念并不代表用户的观点。本文描述了我们在腾讯QQ浏览器中实现和部署概念的经验。它通过挖掘大量的用户查询和交互式搜索单击日志,在符合用户兴趣的适当粒度上发现以用户为中心的概念。所提取的概念具有适当的粒度,与用户语言风格一致,并且是动态更新的。我们进一步介绍了使用以用户为中心的概念标记文档的技术,并构建了主题-概念-实例分类,这有助于改进腾讯QQ浏览器中的搜索和新闻提要推荐。我们进行了广泛的离线评估,以证明我们的方法可以提取出比其他几种现有方法更高质量的概念。我们的系统已经部署在腾讯QQ浏览器中。基于大量真实用户的在线A/B测试结果表明,将以用户为中心的概念引入腾讯QQ浏览器推荐框架后,feed用户的印象效率提高了6.01%。

成为VIP会员查看完整内容
39

相关内容

中国最大的互联网综合服务提供公司,主营以腾讯网、QQ、微信、腾讯微博、《英雄联盟》等为代表的互联网产品与网络游戏。主要依靠在线游戏、移动及电信增值服务、网络广告和电子商务交易创收。目前,QQ月活跃用户数7.8亿,移动及电信增值服务付费用户数超过3000万,腾讯微博注册用户数4.6亿。 2011年1月,腾讯推出手机应用「微信」进军移动互联网,并于2012年9月获得2亿用户,2013年1月15号用户数突破3亿。作为中国服务用户最多的互联网企业,实力强大的腾讯因对中小创业公司造成的竞争压力而常受诟病。

2004年6月,公司以「0700」为代码正式登陆香港股市。
【SIGIR2020-微软】知识图谱上的增强推荐推理
专知会员服务
74+阅读 · 2020年5月30日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
102+阅读 · 2019年1月9日
论文浅尝 | 知识图谱相关实体搜索
开放知识图谱
14+阅读 · 2018年12月18日
腾讯数平精准推荐 | OCR技术之检测篇
机器学习研究会
13+阅读 · 2018年3月17日
知识图谱之语义网络篇
炼数成金订阅号
7+阅读 · 2017年8月16日
Arxiv
5+阅读 · 2019年10月31日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
7+阅读 · 2018年4月24日
VIP会员
相关VIP内容
【SIGIR2020-微软】知识图谱上的增强推荐推理
专知会员服务
74+阅读 · 2020年5月30日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
微信扫码咨询专知VIP会员