在快手这家公司里,存在着一个相当「神秘」却低调的群体。
与大部分西二旗打工人相同,他们的一天从骑单车到公司开始,在饭堂就餐的时候,会和同事聊聊最近遇到的技术难题,更多的时候,他们会沉浸在自己手头的工作之中,忙着搞定一个又一个 bug,直到夜幕降临。
他们通常很年轻,拥有名校背景和硕士或博士学位,发过很多篇顶会顶刊,是每一年技术领域毕业生中最顶尖的一批人才。他们同时是最追求完美、最有执行力的人,其中很多人在入职快手一年左右就已经成为了项目负责人,带领团队取得一项又一项技术成果。
在这些人身上,我们总是不难发现「好学」、「负责」、「自律」等闪光点:刚刚回国四个月的顾梦琦,已经完成了从斯坦福博士生到快手人的身份转变,在短视频推荐领域方面交出了几份惊艳的工作成果;去年入职的王澍,也是在来到快手不久后就开始独立负责「小成本风格化」项目的工作;在清华园生活了近十年的谷明宇和张阳洋,在快手重新认知了理论到实践的落地,为「性能优化、效率提升」 的实现贡献着自己的深入思考;而不久前仅用一个多月完成 CLUE 登顶任务的蒋晓,正全身心投入到下一项语言模型预训练工作中……
时间回到十年前,他们或许也未能想到,自己的人生将和快手这家公司产生如此深刻的联系。
刚刚拿到斯坦福大学计算与数学工程博士学位的顾梦琦 ,即将启程回国工作。
在做出回国的决定之前,顾梦琦经历了一番内心的斗争。毕业前,她拿到了谷歌等硅谷大厂的 Offer,留在硅谷,是一条很多人走过且被验证过的路。而毕业即回国,却是一条不那么「确定」的路。
八年前,顾梦琦进入北京大学元培学院,成为一名数学专业的本科生。2017 年,抱着「看看世界」的想法,她只身前往斯坦福大学读博,并确定了自己的研究方向:因果推断和强化学习。
在斯坦福,顾梦琦遇到了对自己影响很深的导师——斯坦福商学院经济学教授、斯坦福 HAI 研究所副所长 Susan Athey。提起导师,她有一个深刻的印象:「她对自己要求很高,但她很喜欢自己在做的东西,再辛苦也不会觉得是一种负担。」
Susan Athey 和 2021 年诺贝尔经济学奖得主 Guido Imbens 是美国经济学界著名的伉俪教授,二人携手多年,对科研和家庭保持着始终如一的热情。这也让顾梦琦逐渐明确了自己的择业观:找到自己热爱的事情,为了自己认为有意义的事情努力。
四年的博士生涯很快就要结束了,良好的数学和计算机背景,以及手握 PNAS/WWW/CVPR 等顶刊和顶会,让她拥有很大的选择自由。华尔街的顶级量化基金开出了天价 Offer,曾实习的 Google Brain 强化学习组也主动伸出了橄榄枝,但她更希望回到中国工作,贴近中国的传统文化。特别是 2020 年初新冠疫情的爆发,更是加重了这种思绪。
「其实你可以先在硅谷生活几年,再回国工作。」几乎所有的前辈都会给出这样的建议。即使不去业界,在美国找到一份待遇好的教职也不失为好的选择 。不过顾梦琦有自己的想法:加入一个好的技术团队,一起去完成更多具备现实可感性的工作。
就在这时,一位北大学长将 2021 年的快 Star 校园招聘启事推到了她眼前。那支名为《看见》的快手宣传片,让顾梦琦一下子被充满温度的价值观打动。
投简历、线上面试的流程都很顺利。实际上,在快手的团队里,也有很多曾在谷歌、Facebook 等大厂工作过的同事。「国内的发展空间其实是更广阔的,存在着更多的可能性。」几次交流之后,他们的经历让顾梦琦更加明确了回国工作的决心。
2021 年 8 月,顾梦琦回到了阔别已久的祖国,9 月入职快手,成为了一名真正的快手人。
对于谷明宇和张阳洋来说,「快手」这个名字出现在视线里的时间并不算晚。
2016 年,快手将公司搬到了「宇宙中心」五道口。走出清华校门抬头看,清华科技园启迪科技大厦 D 座橙色的快手 logo 赫然在目。那一年快手的注册用户超过了 3 亿人,这家公司和它所代表的短视频行业,都处在高速发展期。
当时,谷明宇正在清华计算机系读博,那是他在清华园的第五个年头。
身处清华的学子很容易产生一种感觉:自己并不是「天才」,甚至平平无奇。对于谷明宇来说,这种感觉同样很强烈,或许因为如此,格外努力已经成了他的习惯,十年来从未松懈。
谷明宇博士期间的研究方向是视频编解码算法。除了发表在多家 IEEE 期刊的 7 篇一作、3 篇 2 作成果之外,他也积累了大量的实战经验。
「类似一种半工半读的状态,其实工作量不小。」拿着一张机票,背上几十米长的 HDMI 线和几十斤重的服务器,从北京飞到上海或者更远的瑞士、美国,同时应对各种「突发状况」,这些对当时的他来说已经习以为常。
谷明宇曾经算过,博二这一年中自己大概有三、四个月的时间都在路上。「忙起来的时候,可能连续两三个月都是从早上七点忙到深夜的状态,甚至会有连续几天的通宵。」也是在这种磨炼之下,他的抗压能力、应变能力飞速提升,蜕变出一种格外平和的心态。
来快手面试的时候,谷明宇被这家公司的风格所吸引。「我感觉到一种和清华很相似的氛围:稳健。」2020 年 7 月,谷明宇正式成为了快手音视频算法组的一员。
和谷明宇一样,张阳洋在清华度过了从本科到博士的近十年时光。
2012 年,张阳洋进入清华计算机系,有趣的是,十年前他的理想并不是计算机专业。「当时我最喜欢物理,迷恋它的优美和简洁。」但在计算机专业的学习过程中,张阳洋慢慢找到了这个领域的乐趣,他发现计算机其实可以比物理更加有趣,因为计算机是可以创造世界、改变世界的东西。
在本科毕业那年,他也开始思考出国的事情。「国内在师资、设备、经费等方面的实力都不逊于海外,生活上也更便利。」经历了半年的海外访学生活,他发现出国并不是唯一最佳选择。近年来,越来越多像张阳洋一般的清华学生会选择留在母校深造。
从此,清华 FIT 楼多了一个忙碌的身影。张阳洋是所在实验室最早做「网络安全」方向研究的博士生。国内的网络安全学科研究起步晚,但应用空间广阔。
在清华读书的日子,被张阳洋形容为「溺水式学习」。从经常登上热搜的清华大作业也可以得知:计算机系的大三学生都要经历一门必修课《计算机组成原理》,大作业是「奋战三星期,造台计算机」,而自动化系的大一学生要「手写雨课堂」……
或许沉浸其中,才能吸收更多知识。张阳洋说:「我本科时候的一个感受是,每天都在写作业。」
不管是在学校还是职场,peer pressure 是如影随形的,关键在于自己如何平衡。来到快手之后,他保持了这种强大的自驱力,即使是忙了一天,下班回家后,他也会静下心来阅读最新的论文,跟进前沿技术。
2021 年 11 月 4 日,中文语言理解领域的权威测评基准 CLUE 1.1 分类任务榜的排名发生了变动,来自快手搜索团队的预训练语言模型 PERKS 在 CLUE 1.1 分类任务中登顶。
「没想到这么快就成功了!」距离蒋晓接到这项任务,仅仅过了一个多月的时间。「原本的计划是半年内完成,算是提前完成任务。」
蒋晓算是「非典型理工男」,第一次见他的人会想到「阳光」、「乐观」、「健谈」几个标签。登顶 CLUE 的目标完成之后,他的内心澎湃了那么几天。
和其他快 Star 相比,这个来自吉林的男孩认识快手的时间或许要更早一些。家人们都会用快手,还有一位家人在快手上有自己的直播账号。但直到真正走进快手,他才惊喜地发现这家公司的技术实力远超自己的想象。
在北航读书的时候,蒋晓开始接触跨语言模型的预训练。「运气特别好,几篇论文分别投了 ACM MM、IJCAI、AAAI,百发百中,都是第一次投稿就能接收。」后来,他找到了去微软亚洲研究院的实习机会,在那里进一步接触了 XGLUE 数据集等研究工作。
接到任务之后的一个多月里,蒋晓和队友一起早出晚归,甚至好多次梦里都出现了和 CLUE 榜单有关的场景。
来自快手搜索团队的预训练语言模型 PERKS 在 CLUE 1.1 分类任务中登顶。
蒋晓表示,自己原本的性格中多了一点「急躁」,回顾自己一路走来的成绩,可以说离不开父母、老师、同事的影响,也离不开每一阶段所处环境的造就。「在快手的 leader 总是安慰我说:别着急,别急躁。」
除了行业领先的发展空间,快手内部会为快 Star 提供最顶级的培养机会,让他们深度参与更核心、更前沿、最具潜力的项目,也会为他们配备更好的导师资源。
成功固然是有运气和环境的因素,但决定事物走向的还是实力基础。登顶 CLUE 的任务圆满完成之后,蒋晓又等来了一个好消息:在前段时间揭榜的 AAAI 2022 中,又一篇论文被接收了,延续了百发百中的好运。
其实,在快 Star 这个群体中,实力的评判和工龄、职级等因素并不挂钩。
快手 Y-tech 硅谷实验室负责人王华彦第一次见到王澍,就给出了「靠谱」二字的高度评价。在北大读研的时候,王澍积攒了丰富的实习经验,并且在 GitHub、知乎等平台上维护自己的开源项目和专栏。从理论技术到落地实践,他都会有自己深刻的思考。
专业设计师可以创造出大量风格各异的照片特效,如何克服人工智能训练成本的挑战,缩短照片风格化特效的开发周期,将这些体验放到每一个用户手中,是 Y-tech 团队当时的攻关目标。
入职后几个月的一天,王澍决定毛遂自荐,成为「小成本风格化」项目的主要负责人。王华彦也给了这个年轻人充分的发挥空间,「华彦老师是大家都公认的人好、技术强,也很有同理心,没有人说过他一句不好。」
「小成本风格化」项目期间,除了沟通、对接、协调 Y-tech 在北京和硅谷两地的团队工作,王澍还贡献了自己的技术思考。他介绍说,这其中涉及到人像风格化业务的两个技术难点:从效果上,如何得到高质量的成对图片;从效率上,如何能够减少人工修图和筛图的次数。
结合自己以前的实践经验,王澍提出了两种解决方法:首先通过基于中间域的多域融合方法,借助中间域的思想先 finetune 到一个稳定高质量的风格化域(手绘),再 finetune 到最终想要的风格化域,结合 StyleGAN Blending 技术,团队解决了原始融合中存在的光照敏感、牙齿不清晰和风格退化快等问题。然后,通过多模型区域融合技术,利用人脸 parsing 网络得到人像的不同部位,通过动态调整高斯融合系数,从而可以融合不同模型的优点,有效的减少了筛图的次数。
王澍贡献的方法在小成本风格化项目的推进中起到了关键性的作用,最终团队将原始成对图片的数量级降低了几十倍,将筛图成本降低了上百倍,让更多用户、更快地尝试到不同艺术风格特效。
谷明宇则是在入职快手的第三个月,遇到了一个「紧急任务」。
对以视频为主要媒介的快手而言,保障用户的高质量体验的同时降低转码和带宽成本是一项长期挑战。因此,快手音视频算法组开展了短视频异步转码档位 Venus 和 Unicorn 的研发工作,核心参与的人就有谷明宇。
「Deadline 提前了,要在一周多的时间里完成。」算法迭代了好几版,但还没走到实验流程。得益于修炼多年的平稳心态,谷明宇和同事们有条不紊地完成了任务,最终按时上线。
Venus 和 Unicorn 转码档位通过引入基于深度学习的转码加速算法、基于人类视觉特征的主观优化算法以及基于视频时域相关性的块级滤波算法,对视频画质、文件大小、转码速度三个维度同时优化。在 QoE 持平的情况下,对比线上档位转码速度提升 40% 以上、总带宽降低 5.4%,实现了公司成本与用户体验双向受益。
除了写代码、关注前沿技术以外,谷明宇还有很多要忙的事情,包括带新人、做项目汇报等等。但他正在逐渐学会做平衡,这也是一个 tech lead 的成长必经之路。
面对未知的领域,顾梦琦通常会保持一种兴奋感,这种感觉或许会和焦虑同时出现,但正是驱动力的来源。
回国后的生活,和想象中一样美好。虽然才入职短短两个月,顾梦琦已经在因果推理、机器学习的落地方面做了很多成果。比如,在根据视频长度 Debias 的时长预估中,她引入了马尔可夫不等式帮助改善预估均值下界,有效提升了预估值的准确性,上线后推全显著提升了用户观看时长。正是这些不断的技术突破,在为快手的海量业务保驾护航。
和顾梦琦同期入职的张阳洋,选择先和 leader 进行了一次长谈。
「在学校做东西,看重探索性,或许不一定实用;如果来到企业的话,我想更了解一些能够为业务带来直接收益,能够服务于大多数人的技术。快手的 leader 是很懂技术的一批人,也愿意提供一个探索的空间。」
快手的业务涉及内容生产、内容理解、内容分发、内容消费和用户互动,尤其在内容理解和内容分发这两个环节,深度学习发挥着至关重要的角色。支持超大规模的深度学习训练的平台的必要性不言而喻。
他选择了「高性能网络」这个方向,想要试一试。永远对未来抱有无限期待,这是张阳洋的人生信条。
除了算力资源的提升之外,还要解决好分布式系统内部不能有效地利用额外的计算和带宽资源的问题。针对当前挑战,张阳洋提出了传输架构优化、传输协议优化两个传输优化方向。
他和同事一起,在机器学习分布式训练集群里面初步调优了 RDMA 拥塞控制算法 DCQCN,基本部署了 RDMA 细粒度网络监控,初步建立了 RDMA 的网络能力。从目前的超过 30 个机器集群的测试数据来看,机器学习业务一轮的数据传输时间实现了量级级别的降低,已取得一定的阶段性成果,后续还将基于更大规模的机器学习集群,进行系统级和算法级的联合优化。
快手处于一个高速发展阶段,在基础设施这方面还有很多空间,可以做出一些探索性的东西。「在合适的时间、合适的地点,做合适的事是至关重要的。」这是张阳洋的 leader 在之前的谈话中对他说的。
或许,让每一位快 Star 决定加入快手的理由不尽相同,但他们的选择都被证明是正确的。
有人选择快手,因为它是「最有温度、最值得信任的在线社区」,让更多普通人的生活熠熠闪光;有人选择快手,因为坚信「快手正处在一条充满希望的赛道」;有人选择快手,因为「想加入一个大体量的头部公司,和更顶尖的技术团队一起做对用户更有意义的事」;也有人选择快手,只是因为一次和技术 leader 默契、深度的交谈……
「快 Star」计划启动两年以来,已经有几十位顶尖技术人才加入快手。「很多同学来自清北,还有很多有海外经历。而且印象中只有我一个人是硕士学历,其他都是博士。」一位快 Star 回忆说,最初参加新人集训时,自己曾被组内的人才密度所震惊。
今天的快手比以往都更需要年轻、优秀的技术人才资源汇入。越来越多如同「快 Star」一般优秀的技术人才选择来到快手,在这块厚实的土壤上茁壮成长、挥洒汗水。快手成就了一批「快 Star」,未来,他们也将成就更好的快手。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com