北大博士在阿里:因为期待,你需要更出色!

2017 年 9 月 21 日 机器学习研究会

阿里妹导读:施晓罡,花名星罡。阿里巴巴算法工程师,2016届阿里星。今天阿里妹为大家采访了这位阿里星同学,来看看作为一名阿里星,从校园到企业,从学术界到工业界,都经历了什么!

 


2016年,星罡在北京大学毕业并获得了博士学位,研究课题为《动态数据流上的实时迭代计算》。


博士期间,他是一位名副其实的学霸,作为一名学生,在学术上取得了令人瞩目的成绩,曾在包括SIGMOD和TODS在内的顶级国际期刊和会议上发表多篇学术论文,并获得校长奖学金、五四奖学金等诸多荣誉和奖励,其中校长奖学金是北大的最高奖学金。

 

2016年毕业加入阿里之后,参与了实时计算系统Blink的开发工作,负责计算状态的存储、备份和恢复等功能的研发。在2016年双11期间,Blink为搜索、推荐和广告等关键业务提供了稳定、高效和可靠的服务。Blink相关工作同时也在开源社区取得了较大影响。通过将部分工作贡献给社区,他已经在今年4月成为Apache顶级项目Flink的Committer。


谈渊源:源自游戏,钟情算法

    

提问:大概从什么时候开始接触到计算机编程方面的东西?又是因为什么喜欢上了计算机?


星罡:第一次接触是小学,那个时候有一个很流行的东西叫裕兴学习机,里面可以学一些简单的dos、命令等编程的东西。我印象最深的是学习机里面有一个实现超级马里奥的程序,然后我就照着那个教程把马里奥绘出来,虽然也不懂代码的翻译,就照着教程把代码一行行敲进去,这样我就可以控制马里奥到处移动。


这应该是我人生写的第一个程序,虽然很简单,但是写完之后很开心。从那个时候开始一直到上高中我对计算机的理解基本上就等于游戏,因为我特别爱玩游戏,就喜欢上了编程。

    

提问:那计算机有这么多领域,为什么后来选择了算法呢?


星罡:选算法有很多偶然的原因,最早我在实验室的主要工作是在分布式环境下的数据存储和查询。那个时候互联网技术随着web2.0的发展,用户产生的数据有了一个指数级的增加,所以数据的存储和查询是一个很大的问题。但到了后来计算机的技术的发展使得很多这方面的问题被解决了,同时大家对于数据价值的追求越来越高,非常渴望从数据之中寻找到那些潜在的联系,并运用到实际应用中。


所以我在读博的时候有一个很重要的研究课题,就是如何从搜集到的大数据中高效的提取数据价值,如何高效的运行丰富复杂的数据挖掘算法和计算机算法。这个问题非常有挑战,因为我既需要对算法非常了解,还需要能提供一个支持这些算法的平台。所以我就特别希望能够深入了解这些算法,考虑如何把这些算法通过一个真实的系统让大数据运行起来。

    

提问:在校期间取得了哪些学术上的成绩,哪些对你来说意义非凡?


星罡:博士期间我的课题是《实时数据流上的迭代计算》,这个问题主要是想解决在实时动态的数据流上怎么去高效的编写和运行基于迭代的数据挖掘算法,主要的工作是两块,一个是如何提供一个声明语言,就是一种很简单的高级语言,能够允许用户简单的编写他们的迭代程序。



另外的一个工作就是考虑在分布式环境下在实时数据流上怎么样去跑这些迭代的程序。这些工作在当时非常有创新性,也非常有意思,在SIGMOD和TODS这些国际的顶级会议和期刊上也发表了一些相关的paper。另外,这些成果也帮助我也获得了学校的校长奖学金(北大校长奖学金为北大最高规格的奖学金,每年全校仅有100个名额)。

    

谈选择:研究与应用并重


提问:那么在毕业前都有哪些选择?为什么最终选择了阿里?


星罡:找工作的时候我面了不少公司,也拿了挺多的offer,我当时希望找一个能够继续我博士期间研究方向并在实际中能够发挥作用的工作,所以最早我犹豫要不要去微软或者IBM这些公司的研究院,但是接触之后感觉那边的工作可能更偏向于学术研究,在实际应用里并没有想象中那么大。之后我面了很多互联网公司,滴滴、hulu、阿里等等,比较了业务情况、技术氛围等等,发现阿里这边的工作和我研究方向非常匹配。


另外阿里的数据场景非常吸引人,因为阿里的流量非常庞大,另外我觉得阿里在业务上已经非常成功了,有足够的资源在技术上做探索,通过技术创新来获得优势。通过和面世官的交流,我知道实时计算是阿里技术发展的一个重要方向,希望通过实时计算在搜集和广告这些关键业务中,提高用户体验获得更高的收益。所以在阿里我的研究和我的技术可能有更大的发挥空间,所以就果断的过来了。

   

提问:那么加入阿里的初心是什么呢?想达成什么?


星罡:上大学的时候我开始接触阿里,那个时候经常会上淘宝买东西,感觉淘宝上的宝贝非常多,存量也非常大,那时候我就特别好奇淘宝的系统是怎么去搞定这么庞大的数据量和访问量的。后来随着我研究的深入和对阿里的接触,我更希望在阿里自己能够搭建一个在世界上有影响力的实时计算平台,自己也能够成为一个理论和实践兼具,成为领域内的专家。

 

谈工作:伴随初心,在压力中成长

  

提问:从学生到工作的转变,这个过程中有没有遇到过什么问题或者不适应的地方? 


星罡:之前在读博士的时候一般我们的工作都自己安排,自己去寻找一些有意思的课题,然后追逐最前沿的科研问题。但是工作之后大部分的工作通常是由业务提出需求,所以在开始的时候总感觉自己的价值没有发挥出来,然后日常的工作节奏也不一样,因为以前读博士的时候可能更关注于自己,每天的时间也由自己安排。



但是现在可能会经常需要和其他团队交流,每天的时间也比较碎片,利用率不会很高。所以刚开始的时候很难适应这样的节奏,也很难适应这样的工作环境,开始的时候工作效率会比较低,需要一个转化的过程。

 

提问:在工作中,阿里星的光环对你来说意味着什么?


星罡:作为阿里星,会受到来自不同方面的瞩目,可能有更大的舞台或者更灵活的空间给你,也有更多机会和那些大牛去探讨问题,但是可能对我来说意味着一个非常大的压力,因为阿里星其实公司和同事对你有期待,所以说你需要更出色,在工作中要更加努力,然后在个人发展中需要从更多的角度去思考一些问题,尽自己所能帮助团队提高。

 

提问:到阿里之后做的这些事情你觉得做得最好的是什么?


星罡:在阿里我主要还是做实时计算系统相关的事情,我们基于Apache开源社区的一个计算系统Flink搭建自己的计算系统,名字叫Blink,我主要负责计算状态state相关的工作,我对state接口做了大量的改动,丰富了很多类型,并且优化了状态备份的实现,还提供了很多工具来提高用户程序开发的效率以及用户程序的性能。



转自:阿里技术


阅读全文请点击“阅读原文”

登录查看更多
0

相关内容

阿里巴巴集团于1999年创立,阿里巴巴集团子公司及关联公司有:阿里巴巴网络有限公司、淘宝网、淘宝商城(天猫)、一淘、支付宝、阿里云计算、中国雅虎等。
还在修改博士论文?这份《博士论文写作技巧》为你指南
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
MATLAB玩转深度学习?新书「MATLAB Deep Learning」162页pdf
专知会员服务
98+阅读 · 2020年1月13日
【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答
专知会员服务
82+阅读 · 2019年12月14日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
阿里技术专家:优秀工程师是怎样炼成的?
51CTO博客
8+阅读 · 2019年6月15日
19年腾讯、阿里、网易等各大厂实习生薪资曝光!
互联网架构师
9+阅读 · 2019年5月5日
一个阿里技术大牛对人工智能方向的看法
网易智能菌
8+阅读 · 2019年4月24日
吃鸡手游竟然是Python写的?
机器学习算法与Python学习
6+阅读 · 2018年9月11日
想成为具有核心竞争力的 Python算法工程师?清华博士带你入门!
机器学习算法与Python学习
3+阅读 · 2018年1月9日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
Arxiv
35+阅读 · 2020年1月2日
Deep Randomized Ensembles for Metric Learning
Arxiv
5+阅读 · 2018年9月4日
Arxiv
8+阅读 · 2018年5月15日
VIP会员
相关资讯
阿里技术专家:优秀工程师是怎样炼成的?
51CTO博客
8+阅读 · 2019年6月15日
19年腾讯、阿里、网易等各大厂实习生薪资曝光!
互联网架构师
9+阅读 · 2019年5月5日
一个阿里技术大牛对人工智能方向的看法
网易智能菌
8+阅读 · 2019年4月24日
吃鸡手游竟然是Python写的?
机器学习算法与Python学习
6+阅读 · 2018年9月11日
想成为具有核心竞争力的 Python算法工程师?清华博士带你入门!
机器学习算法与Python学习
3+阅读 · 2018年1月9日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
Top
微信扫码咨询专知VIP会员