第2届易观算法大赛完美收官,凭什么他蝉联两届算法冠军?

2018 年 11 月 1 日 Analysys易观


10月26日-27日,以“数造未来 精益成长”为主题的2018易观A10峰会在北京海航大厦如期举行。50+位嘉宾大咖齐聚大会现场,共同探讨和分享在数据驱动下的企业精益成长之道。

 

厚积薄发,荣耀时刻

 

本届算法大赛共有700支队伍参加,经过数轮激烈角逐后,来自广州的李本旺团队“housepower”以绝对优势夺得漏斗计算规则赛题开源组冠军,而性别年龄预测赛题开源组冠军由林望黎团队斩获。两组冠军分别揽获5万元现金奖励,成为本次大赛的最终赢家。另有技术专场meetup,来自俄罗斯的ClickHouse技术团队和数据爱好者们汇聚一堂,共同探讨了数据算法的应用发展。

 

彩蛋——拿奖拿到手软秘籍

 

赛后,小编有幸采访到漏斗冠军李本旺,上届OLAP算法大赛他凭借其优异表现成为大赛最大黑马,今年再次夺冠。为何他能连续两次斩获冠军头衔?下面就让我们一起来了解一下。(以下为采访实录)



Q1:首先恭喜你们获得本次算法大赛的冠军,能否简单介绍下你们团队?


李本旺我们团队三人,大家都是大数据和AI的爱好者。他们的实力都很棒。


其中宋强是我同学,他毕业于中科院自动化研究所,对推荐系统和图像识别领域尤为擅长,获得过国际多媒体workshop图像识别比赛冠军,国际计算机视觉workshop比赛亚军,我们还一起拿过天池云上智能识别比赛亚军。而张健, 目前是ClickHouse社区比较活跃的贡献者, 对ClickHouse比较熟悉。关于我本人,目前在一家游戏直播公司做高级数据工程师(搬砖)。

 

Q2:是什么原因让你决定再次来参加易观算法大赛呢?


李本旺:我对ClickHouse数据库非常感兴趣,但去年的ClickHouse meetup没能参加,有点遗憾。得知这个比赛第二天就有meetup,也想见见几位朋友,而且今年的复杂漏斗也是可以基于ClickHouse做定向优化并解决,所以便决定报名参赛。

 

Q3:能否简要描述下你们团队在比赛时所采用的解题思路及算法亮点?


李本旺:关于解题的方法依旧是基于ClickHouse设计了UDAF函数,和去年思路相差不大。但今年漏斗计算较为复杂。在算法处理过程中,我们选择自定义压缩、自动化调参、提前聚合,充分发挥单节点性能,以及通用规则拦截器等方式。简言之,就是我们特别注重算法细节优化,我们把能想到的细节,每一处都进行了“死磕”。


另外,我们做了一套自动化测试框架,能够自动完成一些参数的评测并选出最佳参数,节省了很多时间。当然,在比赛中我们也有不足之处。我们的算法实现并不是最优秀的,赛后我们和商业组冠军讨论了算法实现上的相关细节,发现我们还有很大的提升空间。

 

Q4:你认为这次团队夺冠的重要因素是什么?如何评价自己和队友的表现?


李本旺:除了技术上的实力,我认为团队合作更为重要。很感谢我的队友们,我们配合得非常默契,我主要负责算法的技术选型、总体架构以及核心代码的实现,张健负责自定义压缩的细节优化,而宋强负责算法性能调优。正是因为队友们的密切配合,才有了最终夺冠的好成绩。

 

Q5:连续两届获得算法大赛冠军,能和大家分享下你的感受吗?


李本旺:在心态上我会更趋于平淡,希望通过易观算法大赛,让更多人了解并使用ClickHouse这个高性能OLAP数据库。

 

Q6:ClickHouse这款神级开源软件,目前在中国发展应用如何?


李本旺:ClickHouse在过去一年发展迅速,目前中国用户已成为除俄罗斯本土以外发展最快的用户群。国内的阿里、腾讯、新浪、头条、快手等代表性公司都对ClickHouse这个数据库有所研究。令人非常关注的是,未来在实时分析领域,ClickHouse数据库绝对会成为首选的技术选型。

 

至此,第2届易观算法大赛正式落幕,同时也要感谢Ucloud强大的技术支持。算法大赛是国内(外)科技人才沟通接触的桥梁,不断为行业注入新鲜活力。未来易观将继续坚持以海量场景为基础,探索前沿数据科技,不断推动大数据分析发展。这一次,我们不说再见,只为下一次更好的相聚。同时易观也期待更多高校学子和数据爱好者的加入!

 

点击文末“阅读原文”  即刻体验新方舟!


 “阅读原文”,即刻体验新方舟!

登录查看更多
0

相关内容

在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法
元学习与图神经网络逻辑推导,55页ppt
专知会员服务
128+阅读 · 2020年4月25日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
69+阅读 · 2019年11月4日
2019腾讯广告算法大赛方案分享(冠军)
大数据技术
12+阅读 · 2019年8月26日
机会 | 带学《机器学习》西瓜书+带打NLP算法大赛
机器学习算法与Python学习
6+阅读 · 2018年8月26日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Arxiv
21+阅读 · 2019年3月25日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Angular-Based Word Meta-Embedding Learning
Arxiv
3+阅读 · 2018年8月13日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关论文
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Arxiv
21+阅读 · 2019年3月25日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Angular-Based Word Meta-Embedding Learning
Arxiv
3+阅读 · 2018年8月13日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Arxiv
5+阅读 · 2017年12月14日
Top
微信扫码咨询专知VIP会员