新智元报道
周四晚上9点半,王哲结束了每周固定的直播模型与应用组周会。
会上,来自不同组别的近百名同事围坐在一起讨论、碰撞。
期间,王哲似乎不是那个最爱发表意见的,他更愿意坐在一旁观察,思考技术的适用性,以及上下游同事遇到的问题。
这也是入职大厂一年多时间以来,王哲身上「最大的改变」—— 「刚毕业的时候,会关注于特别新潮、酷炫的技术,现在,我会更关注当前的业务场景是什么,有什么特定的问题,什么样的技术是适合我们业务的。」
走出会议室,王哲回到工位,继续翻读起最新的论文研究成果。
这个多年养成的习惯,并没有因为加入互联网公司,而发生太大的变化。
在他的身上,你似乎能感受到一种强烈的自驱力。
这背后,是对新技术的热衷和渴望,也是「给世界带来一点美好改变」的朴素愿景。
这个10月,我们和3位大厂的95后技术人聊了聊。
(注:三位95后技术受访者插画图,左:钟文;中:王哲;右:巩俊)
从天赋异禀的少年,到西二旗打工人中的一员,华丽的学术背景之外,这群因为「快Star」而闯进互联网世界大门的年轻人,也在重塑着我们对于技术本身的理解。
当爱好变成事业
如同大多数95后一样,钟文是从互联网土壤上成长起来的一代人。
因为受到工程师父亲的启蒙,他从小就展现出了对计算机的热爱。
在父亲的帮助下,还是小学生的他就搭建了属于自己的博客。每周在读完《三国演义》之类的历史书后,他都会在上面写下观后感。
除了写博客,他还会剪视频、搭建网站。当然了,电脑游戏也是少不了的。
比如曾经风靡全国的泡泡堂、梦幻西游等,都是他常玩的游戏,其中有不少现在已是时代的眼泪了。
这样一个小「极客」,高中毕业后考入了北邮的计算机系。
看到互联网的巨大能量,大学期间,钟文就明确了未来的就业方向。
他会经常约上伙伴,有针对性地搜索、参加一些机器学习算法比赛,尤其是推荐类算法的比赛,比如阿里的天池、国外Kaggle、智源研究院平台的比赛等。
在这期间,钟文对于技术的掌握越来越熟练。白天泡实验室,晚上打比赛,让他成为同学中的佼佼者。
到了毕业季,他就已经手握诸多互联网头部大厂的offer。
除了工资待遇,钟文更关注的是长远发展机会,他判断跟各行各业都能紧密结合的短视频就是当下的一个风口。
为此,他还向在快手工作的师兄师姐打听,得到了不错的评价后,钟文最终选择了快手,成为商业化部门的一名广告算法工程师。
(钟文参与的封闭项目办公场景。重点项目需要快速迭代,交付结果。3-6个月中在会议室里封闭攻坚,也是技术人的常态)
他的主要工作内容是优化广告排序,更高效地匹配用户的流量。同时,他也会负责一些商业化的业务模型,比如搜索广告,参与唤端、涨粉等业务优化。
近年来,带货逐渐在短视频平台上兴起。
优化广告的匹配效率过程中,将用户,推荐视频,广告内容进行合理的映射和链接是很有必要的。将这些整体构建在一张图中并进行学习,也就是我们常见的「图学习」。
要知道,视频中的商品,以及各种行为(用户的观看、点击、评论、收藏等)都可以作为信息和节点,将其关联性构建在一张图中。
在钟文主推的「图学习」项目首次落地的过程中,着实遇到了不少困难。
数据流的搭建、工程的开发、算法的开发,都需要经历一个从0到1的过程。
钟文介绍,在技术层面, 除了自己过往经验能派上用场的,也考验团队之间的协作与配合。
「过程里,我们需要和团队leader保持密切的沟通,并主动抛出解决问题的思路。比如说我们需要一些图像识别能力,团队内部可能无法解决,这个时候就需要协调其他团队的力量帮助我们」。
而这个项目也如期取得了成果:去年年底开始的项目,仅用3-5个月时间就比较顺利地落地,取得了较为明显的收益。
广告算法的优化,最终需要交给庞大的广告主客户去检验。
钟文举例,「比如说某一家广告主在投放过程中遇到了问题,对于我来说,虽然刚刚上手,也会在这些实际场景中去跟进问题。去弄清楚为什么投放效果不好,通过排查数据找到问题所在。」
现在,钟文在快手已经工作一年多,能够独立负责项目,也得到不错的发展机遇。
这个过程中,钟文说,「实现了自己的价值,也为公司创造了价值,我很享受这种正反馈的感觉」。
把技术用在「看得见」的地方
钟文的兴趣热爱,让他在职场上迸发出更大的光芒。
95后一代技术人,山东小伙子巩俊的职业生涯,同样始于对视频编码算法的情有独钟。
不论大学本科选专业,还是研究生阶段选研究方向,我大多是因为兴趣。只有做自己喜欢的事情,才会更有动力把它做得更好。
巩俊很喜欢单机游戏。游戏的世界架构以及剧情推进,对他有非凡的吸引力。
大学期间,由于不确定自己的兴趣究竟在哪里,巩俊参加了很多活动、竞赛甚至是培训。后来,他终于发现了自己对编程的兴趣,于是一头「扎」进去。
通过老师的介绍,他知道了视频编码这个方向,并且在读研期间专注于这个领域的研究。
(巩俊读研期间,实验室工作日常)
读研期间,巩俊参与了一项AVS3视频编码标准的项目。
当时,这个项目还处于起步阶段。整个团队花费了很长一段时间,去解决机器资源的问题。
因为在制定视频标准的过程中,需要在设定好的丰富数据集上不断去验证算法,因此实际需要很大的计算资源。
而实验室资源非常有限,巩俊和团队需要考虑如何解决。经过不懈努力,巩俊和团队在AVS3上实现一些编码算法,最终,他们的成果被标准组织接收。
这个项目,让巩俊收获了成长,还拿下了国家专利,为未来的职业发展奠定了基础。
入职快手以后,巩俊主动把自己的技术特长用在了真正「看得见」的地方。
对于每个视频平台来说,都希望用户刷到的视频能既流畅,又清晰。对于幕后技术人员来说,在有限的服务器资源下,「流畅」和「清晰」往往不可兼得。
目前巩俊在快手的工作,简单概括来说就是,探索如何最大程度提升清晰度,同时节约带宽和服务器资源。
对于简单的2D动画视频,在低码率和高码率时的观看体验其实差不多,因此可以将码率尽可能压低一些。
而对于复杂动作较多、码率下降对观感体验影响明显的视频,就需要给予更高的码率,保证用户的观看体验。
有时,当用户网络条件发生变化的时候,也可以通过动态调节码率做一些自动优化,比如档位间或者某一个档位内的优化,来保证播放体验。
(今年8月,快手正式发布视频云品牌StreamLake,宣布进军B端业务领域。图为巩俊参与的StreamLake OS产品全景图)
自己的工作,可以服务于亿万人的使用和体验,作为幕后技术人员的巩俊时常感到欣慰。
不单单是某个技术细节的迭代,巩俊认为,通过「快Star」项目加入快手以来,最为重要的一点是加深了对于视频编码转码整体架构的理解。
「包括哪些环节对于用户体验的影响是最大的,也可以从更全局的角度来看技术在整个架构中的价值。不在现有的业务场景之下,我们可能很难了解到这些。」
当被问及「在学校实验室和企业项目组搞研究有何不同」时,巩俊表示,在学校研究视频编码方案,是为了「让技术推动技术本身」,而在公司,则是为了「推动技术的落地」。
创新从不设限
务实、稳健,是快手这家公司技术人员身上很常见的品质。
95后的王哲同样如此,交谈中,他同时透露出远超同龄人的成熟谦逊。
这和他迥异的成长背景有关。王哲出生在四川大山里,父母倾尽全力带他走出贫困闭塞的家乡。
因此,他其实在北方长大,也获得了在城市里受教育的机会,并一路争气地念到了北大的研究生。
而一样出身环境大家族里弟弟妹妹们,往往面临着早早辍学步入社会谋生的境遇。
他会反复思考环境对于人的影响,以及教育的意义。
他不觉得自己有多特殊的天资,只是觉得幸运,因而更加勤勉精进的同时,希望自己能为他人带来一些好的改变。
(王哲家乡的山路)
王哲和同龄人也拥有很多共同的爱好和特点。比如热爱运动,他是院队的篮球队队长和主力后卫,到现在还会坚持每周打一次篮球。
走入职场后,他发现了职场和篮球场微妙的相似之处:大家都是在一个团队之中,为了达到一个共同的目标去努力。
每个人的能力不一样,该如何把球投进呢?他会时常进行这样的思考。
王哲非常喜欢一句话:「创新建立于经典之上」。
为了提高自己的创新能力,他不仅要理解业务的解决方案,还会紧追前沿的技术,比如计算机视觉、自然语言处理的最新进展。
王哲的本科学的是数学专业。在他看来,学数学出身的确让自己和其他同事有一些不同。
其中一个就是对逻辑的严格要求。比如在常人看来,有A就一定会得出B,但他就会反问:为什么有A就一定会得出B?能不能通过C得出B?或者他会干脆质疑问题本身的正确性,问为什么一定要得出B?
另一点就是对于概率的敏感度。在常人看来,某些事发生或不发生,是一个二元的视角。但在王哲看来,这是一个概率的问题:正在发生的事情只是大概率发生,并不是一定发生。
如果带着这种后验的视角去做工作,就会把更多的精力放在让这件事的成功概率变大上。工作后,他的这种感受越来越深刻。
在学生时代,王哲同样也有着丰富的比赛经历。他印象比较深刻的是在旷视科技参加的COCO比赛,这是在计算机视觉领域世界级的顶尖比赛。
王哲和同学一起花了两个月,研究当年最新的paper,并且都做了复现。针对这些paper,他们分析比较,并做了模型上的融合,得到了表现效果很好的模型。
除了模型,王哲还浏览了大量的badcase,并针对性的提出了一个策略,可以很好的弥补模型的不足。最终,他们的方案取得了第一名的成绩。
(COCO比赛王哲获得的证书)
回想起这次比赛经历,王哲感慨道:其实当时的过程和现在做的业务有点像——上了模型之后不能只看指标,因为指标是一个全局的效果,而case是非常具象化的东西。
入职四个月后,王哲在参与人脸风格化项目时,为了用模型生成动漫或皮克斯2D、3D风格化的人脸,公司以前需要请专业的画师为每个风格画几十万张图。
这种方法成本高,效率低,迭代周期需要半年。而王哲和同事们通过新的自研技术,让机器自动画图,使原始需求量从几十万张降到几百张,迭代周期也缩减到了1至2个月。
(机器自动生成的多种风格魔表)
当然,难题也是免不了的。比如,最开始做直播推荐的时候,王哲发现,在离线过程当中有一个非常好的模型,但是把它部署到服务端之后,线上的表现非常一般,甚至没有拿到收益,这就是常见的「离线和在线不一致」问题。
因此,王哲和团队通过比较系统的链路排查,发现模型在链路里面发挥的作用受限于后链路的一些策略,或者混排模型的影响,所以导致模型的作用变小。
发现这个瓶颈后,王哲开始改造线上链路,使模型发挥了更大的作用,最后拿到了比较大的线上收益。
在求职时,王哲其实手握多个offer。他在参加快手校招的open day时,对快手同事的高学历印象深刻——三分之一清北,三分之一海外名校,三分之一国内的计算机老牌名校。
从业务角度来看,快手正处于高速增长的阶段,拥有庞大的用户基础和数据量基础,能使算法发挥更大的作用。
最打动他的还是快手的价值观和理念,「通过科技提高每个人独特的幸福感」。
在王哲看来,快手不是一个单纯的商业公司,它下了很大力气做了实实在在的事,比如助力深山里的农民打开农产品销路,让偏远地区孩子的音乐梦想被看见,从而走向更广大的舞台。就像他一步步走出深山的经历一样。
他依稀记得,在读研时自己曾在一个生物医疗机构实习。第一次产品上线的寒冷冬天,在医院里,运维的同事把他们的产品在医生的识别系统上部署起来后,医生就不需要再去标记,只要片子一拍出来,诊断结果就立马出来了。
(机器学习自动勾勒脑中线产品,王哲跟团队提出的方法发表在医疗影像领域顶会MICCAI)
他第一次有了一种巨大的成就感:原来自己写的代码在场景里被部署起来后,会这么有用。
王哲跟他入职的这家公司可以说是一拍即合。入职两年后的今天,他更加坚定了自己当初的选择「是正确的」。
未来,他还希望能为偏远地区教育、医疗做些什么。
结合目前从事的直播场景创新方向,王哲也在思索,是否可以尝试将直播与普惠教育做一些结合,让「双师学堂」这类项目,不止惠及一小部分地区。
什么是「快Star」?
王哲、钟文、巩俊有一个共同的名字,叫「快Star」。
从华为的「天才少年计划」、阿里巴巴的「阿里星LAB」,再到腾讯的「技术大咖」、美团的「北斗计划」……近年来,互联网大厂的技术人才专项计划并不鲜见。
2019年开始,快手正式推出全球顶尖校园技术人才「快Star」项目,希望发掘出最优质技术人才,培养面向未来的技术领军人。
诚如快手技术有关负责人所言,平台的发展,离不开年轻一代的创新能力和对用户需求的深刻洞察。
通过「快Star」选拔、吸纳顶尖的高校人才,接受体系化的训练,让他们用技术去解决实际应用场景中的难题,为用户创造价值,是「快Star」的重要意义。
这群「快Star」们从走进公司的那一刻开始,就被期许成为更富有担当的管理型人才,而不仅仅只是优秀的算法工程师。
钟文不止一次谈到,通过「快Star」可以「接触到更多难而正确的项目」。在项目推进的过程里,也要面对跨部门、跨团队协作的复杂业务场景。
被问起在快手的整体感受时,王哲给出了两个关键词:一个是「机会」,一个是「开放」。
王哲称自己在这里一年的主要成长在于对业务的思考,日常会听各种大咖、业务分享,这对多维度了解快手的生态有不少帮助。「我愿意在这里一直投入,很重要的一点是,我觉得我跟公司在一起成长」。
保持思考的习惯,站在更全局的视角多思考一些「为什么」,大概是此类技术人才项目的深远价值所在。从通识意义上的优秀到成为一名「多边形战士」,责任感,也驱使着这群95后技术人们走向更长远的未来。
对于这些历经层层选拔、脱颖而出的年轻技术人而言,做好每一件平凡的小事,让技术进步真正惠及每一个普通人,或许是创新本身最重要的意义,也是「快Star」最闪耀的地方。
(应受访者要求,王哲、巩俊、钟文为化名)