中国常春藤联盟院校都参与,腾讯广告算法大赛30万大奖出炉!

2018 年 8 月 4 日 新智元





  新智元报道  

作者:克雷格


【新智元导读7月30日,2018腾讯广告算法大赛决赛结果出炉:来自吉林大学、哈工大和北邮同学组建的“葛文强”队夺得大赛冠军,赢得30万元奖金!这次大赛赛题是Lookalike技术,目的是帮助广告主触达最大化相似人群量级,从而高效促进营销目标转化。主办方介绍,本届参赛选手73%是学生团队,C9院校参赛人数都超过了一百,竞争非常激烈。




Lookalike,相似人群拓展的利器技术,现在被腾讯广告大赛玩出新水平。


7月30日,第二届腾讯广告算法大赛决赛举办,十支队伍从超过2万名选手中杀出重围,进入决赛现场。


决赛队伍经过高手过招、现场答辩之后,最终诞生出今年的冠军“葛文强”队,获得30万奖金等奖励。


除了冠军选手外,腾讯公司副总裁、技术管理委员会主任王巨宏表示,本届大赛参赛选手73%是学生团队,C9院校都参加了算法大赛


参赛选手云集的一个重要原因是腾讯海量资源开放。腾讯社交广告总经理罗征透露,这次大赛目的是提供一个平台,让学生群体可以去体验腾讯做的算法应用,去感受工业界需要解决哪些问题,同时也会为用户和客户带来更多价值,把全链条的技术到应用展示给大家。


有了腾讯的这些资源加持,今年的参赛者竞争非常激烈。


“熬”战20天拿下30万奖金,冠军地位险些被超惊出一身冷汗


本次获得冠军的“葛文强”队,三名成员分别来自吉林大学、北京邮电大学和哈尔滨工业大学,并在初赛阶段获得第一名。


“葛文强”队成员告诉新智元,他们三人在组队后,看了无数论文,并且有至少20天是每晚至少一人通宵盯数据,最后终于以初赛第一的成绩进入复赛。


复赛之后的前两周一切很顺利,把持周冠军的宝座。


但突然有一天,“葛文强”发现自己的分数马上要被超了,队员当时有点慌。


稳住之后,“葛文强”把之前做过的一些模型,再通过一些精细化的处理,把第一保持到了最后。



本次大赛中,“葛文强”使用了两个模型。


增强树模型。核心是特征工程,特征工程分为六大块,包括基础特征编码、单特征转化率、双交叉转化率、三交叉转化率、多值变长特征降维、ID特征的(lda, nmf, svd) embedding向量。其中用户特征与广告特征的交叉转换率的特征重要性最高。在转化率的统计上面采用5折交叉统计配合贝叶斯平滑的方案。


神经网络ctr模型。核心是利用网络结构来代替手工特征交叉, 为此“葛文强”以一个DNN神经网络为基础,融合了代表二阶交叉的FM部分、FFM部分、无限交叉的mvm部分、基于游走的图embedding等结构,形成了一个复杂网络。并且在此基础上加了注意力模型,取得了很好的效果。


此外,“葛文强”队还赢得“人气战队奖”。


第二、三名分别是“三只小蜜蜂”、“SML_21”战队,将10万元及5万元奖励收入囊中。“神魔咧”、“just-fighting”团队则抱走了另外两座“人气战队奖”。



C9院校每所参与人数均过百,腾讯开放资源让选手体验挑战工业界难题


腾讯社交广告总经理罗征表示,早期学计算机算法,课本上的数据是“模拟的”数据,即所谓做算法多是涉及证明。现在做算法在课本上的技巧可以应用大量的数据集,但是也存在与工业界应用的距离。


因此腾讯举办广告算法大赛的目的是提供一个平台,让学生群体都可以去体验腾讯如何做算法应用,感受工业界需要解决哪些问题。


腾讯社交广告总经理罗征


罗征透露,这次大赛目的是通过使用脱敏数据,将全链条技术到应用展示给大家。


腾讯社交广告基于成熟的算法技术能力,运用Lookalike技术,能在保证精准的前提下,帮助广告主触达最大化相似人群量级,让品牌找到更多“对的人”,从而高效促进营销目标转化。


罗征说,Lookalike在广告主应用中非常广泛,并且对他们的效果影响非常大。今年将Lookalike作为赛题,除了有趣、好玩外,一个重要的原则是算法对广告主有很大的影响力。


AI技术在全链条的应用,Lookalike只是其中一块。算法的应用还可以体现在优化人力配置上,比如广告效果优化和广告审核这类目前投入非常多人力的地方,机器出错率比人类要低。


腾讯CDG人力资源中心负责人、腾讯集团组织发展部总经理艾兰表示,算法不仅有商业价值,还有包括公益在内更多应用价值。


腾讯CDG人力资源中心负责人、腾讯集团组织发展部总经理艾兰


腾讯公司副总裁、技术管理委员会主任王巨宏认为,算法决定了前台许多东西,这样的比赛让大家看到华丽的外表其实是由算法决定,算法带来的不仅有商业价值,还有更多其他价值。互联网巨头的一个重要优势就是广告,将来谁能在广告上做的好,就是要看算法。腾讯在产学研合作中有两块:一是做学术基础研究,腾讯也希望有同学在这条路上深耕;二是对想做产业的同学来说,腾讯欢迎大家一起,让更多的人体会到产品的价值。


腾讯公司副总裁、技术管理委员会主任王巨宏


王巨宏还透露了一组数字:参赛的73%是学生团队,今年C9院校参与人数均超过100。王巨宏也欢迎参赛的学生参与到产业界中来,成为腾讯同事或者合作伙伴。


“未来,希望通过腾讯链接的服务,让更多的人体会到产品的价值,让大众享受到广告带来的快乐和幸福。”


详解腾讯广告另一大利器:大规模推荐技术


互联网广告是大规模AI技术应用最重要的场景之一,不论谷歌、Facebook还是BAT,都在广告业务中投入了大量的研究资源和人力,因为广告场景的很多技术创新都能直接转换为商业收入。


腾讯社交广告在Lookalike等大规模推荐技术方面,进行了多年积累与探索,结合产品、运营推广,共同驱动社交广告业务高速增长。


腾讯社交广告专家架构师李长城介绍,TSA的推荐引擎采用了业界主流的向量检索方法(YouTube 2016年发表)。虽然在电商等结构化场景,有一些新的方案提出并取得了不错的效果,在社交广告这种非结构化场景,结合对向量检索中具体问题的优化,该方案仍然获得最好的效果。


腾讯社交广告专家架构师李长城


向量检索主要由两部分组成:一是向量内积DNN,通过DNN学习用户/广告 embedding向量,两者的内积表示感兴趣程度;二是近似最近邻(ANN)检索,通过ANN算法大幅缩短检索时间,召回近似top N感兴趣候选。向量检索能够以较低的性能开销获得近似全库遍历的检索效果。实际应用中,也存在很多问题需要优化改进。


李长城介绍了腾讯社交广告在推荐优化中的几项工作,包括ANN算法选取及细节改进(HNSW优化聚类分层及邻居计算),ANN通过数学变换支持内积度量,建模先验概率提升效果(内积不是距离度量,近邻检索算法不能直接使用,通常会归一化为cos,导致了相应的效果损失),以及共用lookup embedding建立双塔间的潜在特征关联,缓解向量内积DNN不能直接使用user-ad组合特征的问题。


除了模型算法,李长城也概述了TSA在NLP基础技术、大规模机器学习平台,超大规模稀疏DNN训练等方面的建设与创新。


腾讯社交广告是国内流量最大、场景最丰富、覆盖人群最为广泛的互联网广告平台。在超大规模数据的支撑下,多种主流AI技术协同优化,共同驱动广告业务高速发展,以及业界前沿技术的应用与创新。


AI实时判断用户推荐广告,腾讯推机器学习平台TI-ML降低技术门槛


传统的广告判断是以天为单位来做判断,也可以勉强做到小时级,但是终究比实时上效果要差。


在注意力经济下,用户的广告判断对实时判断的要求越来越高,需要在用户点进来的时候就判断哪一条广告适合用户看,人类操作无法适应这种实时性要求。罗征说,目前腾讯的微信、QQ、新闻等产品广告中,已经实现了实时判断,用户访问到腾讯的产品时就会实时推荐。


算法越来越多的改变广告的推荐形式和目标。华扬联众数字实验室总工程师张炎也在决赛演讲中介绍了应用数据模型和关联分析如何连接用户、媒体和广告。


张炎说,华扬联众采用Scoring 算法,将用户分类,为计算广告做人群精准定位,并且用实时决策引擎提供数学模型。


华扬联众数字实验室总工程师张炎


以汽车公司SUV营销为例,前期通过选择广告投放媒体,媒体准备网页内容,UT部署脚本监控用户流量,Centrixlink使用账户信息在设备上提供初始标签。后期持续发掘最优的广告位置和用户特征,利用Lookalike对用户进行评分,找到类似人群,实现精准投放。


另外,AI在广告审核中也发挥重要作用。比如广告创意中的素材有版权归属问题,A广告不能拿了B广告的创意进行抄袭,这种情况下,机器学习做自动化搜索配对,就能够识别广告抄袭行为,保护原创版权。


AI虽然能给企业特别是传统企业带来效率提升,但AI建模是一项技术门槛高,只有少数人掌握的技能。腾讯云AI基础产品中心产品经理郭律表示,优质的机器学习平台能够帮助企业降低获得AI能力的门槛,提高建模效率。并以腾讯智能钛机器学习生态服务平台(TI-ML)为例进行了深度解读。


腾讯云AI基础产品中心产品经理郭律


TI-ML是基于腾讯云强大计算能力的一站式机器学习生态服务平台,能够对各种数据源、组件、算法、模型和评估模块进行组合,使得算法工程师和数据科学家在其之上能够方便地进行模型训练、评估和预测。



智能钛机器学习具有可视化操作界面的 TI-ONE 和具有命令行操作界面的 TI-Accelerator(TI-A),能够满足用户不同的使用习惯。在部署方面,除公有云方式外,TI 也支持私有化部署。


AI除了服务企业与开发者外,还被应用到公益领域。


泛化智能CEO&创始人王汉阳在决赛现场展示了利用计算机视觉来发现华北豹的案例。



华北豹是唯一一种只生活在中国的大型猫科动物。2005年,北京门头沟最后一次出现华北豹的身影,现在北京已经没有适合华北豹的生活环境了。


红外相机常用来发现华北豹等物种,它的红外探头通过温度来感应动物,但问题在于受外界温度变化影响,不能精准拍摄目标野生动物,会拍很多没有用的照片。


泛化智能通过利用计算机视觉来识别动物,把之前动物保护组织猫盟一周的时间缩短到1小时,能达到98%的准确率。目前,猫盟在华北发现超过29只华北豹。


至此,2018腾讯广告算法大赛正式落下帷幕,腾讯社交广告将持续探索前沿科技,不断触摸算法科技的未来,期待明年的算法大赛。




新智元AI WORLD 2018大会【早鸟票】

开售!


新智元将于9月20日在北京国家会议中心举办AI WORLD 2018 大会,邀请机器学习教父、CMU教授 Tom Mitchell,迈克思·泰格马克,周志华,陶大程,陈怡然等AI领袖一起关注机器智能与人类命运。


大会官网:

http://www.aiworld2018.com/ 


即日起到8月19日,新智元限量发售若干早鸟票,与全球AI领袖近距离交流,见证全球人工智能产业跨越发展。



  • 活动行购票链接:

    http://www.huodongxing.com/event/6449053775000

  • 活动行购票二维码: 

登录查看更多
0

相关内容

商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【快讯】KDD2020论文出炉,216篇上榜, 你的paper中了吗?
专知会员服务
50+阅读 · 2020年5月16日
近期必读的6篇顶会WWW2020【推荐系统】相关论文-Part3
专知会员服务
57+阅读 · 2020年4月14日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
111+阅读 · 2020年4月12日
2019腾讯广告算法大赛方案分享(冠军)
大数据技术
12+阅读 · 2019年8月26日
秒杀99%大学生!中国最牛高校学霸PK,简历吓坏网友...
人工智能机器人联盟
7+阅读 · 2017年11月12日
中国高校人工智能专业TOP10榜单及行业薪酬大曝光
人工智能机器人联盟
4+阅读 · 2017年9月17日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
19+阅读 · 2018年5月17日
Arxiv
5+阅读 · 2017年12月14日
Arxiv
4+阅读 · 2016年12月29日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关论文
Area Attention
Arxiv
5+阅读 · 2019年2月5日
The Evolved Transformer
Arxiv
5+阅读 · 2019年1月30日
Arxiv
19+阅读 · 2018年5月17日
Arxiv
5+阅读 · 2017年12月14日
Arxiv
4+阅读 · 2016年12月29日
Arxiv
5+阅读 · 2015年9月14日
Top
微信扫码咨询专知VIP会员