业界 | 对话车品觉:顶级数据团队该像支配合默契的篮球队

2018 年 8 月 28 日 大数据文摘

大数据文摘出品

记者:魏子敏


什么样的数据团队才是顶级的?


我该何时、怎么样建设自己的数据团队? 


数据团队的价值如何衡量? 


针对这些业内普遍存在的数据团队建设问题,清华数据科学研究院联合《大数据文摘》,即将在9月份发布《顶级数据团队建设全景报告》(下称《报告》),针对“数据团队建设现状”和“数据团队建设要素”两大内容,致力于回答数据团队建设现状和数据团队发展问题,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。 


如果你也希望了解数据团队建设现状,点击文末 阅读原文 花五分钟为我们填写问卷,即可参与本次报告,并在其发布后获取报告电子版!

在报告发布倒计时一个月之际,我们就“数据团队建设”这个话题,采访到了红杉资本中国合伙人、前阿里巴巴集团副总裁/ 数据委员会会长车品觉。亲自领导阿里数据团队在大数据实践领域取得了一系列重要成果,也见证了不少创业企业的数据化进程,他对于数据驱动和数据团队有自己的定义。


车品觉简介

拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考及管理方式,对大数据未来趋势有独到见解;亲自领导阿里数据团队在大数据实践领域取得了一系列重要成果,包括为阿里建立集团各事业群的业务及决策分析框架,开发智能化的数据产品,成立了驱动集团数据化的运营团队,成功发起了公共与专有数据资产管理体系,还发布了数据安全规范等。2017年被国家信息中心选为中国十大最具影响力大数据企业家。代表作品《决战大数据》、《数据的本质》。

可以上下滑动哟~


以下是采访的内容


大数据文摘: 什么样的数据团队才称得上顶级?


车品觉: 我想先定义一下顶级。


一般人听到顶级一般会想,团队里有一个非常厉害的科学家,但是我定义的顶级是整个团队的配合天衣无缝,像一个篮球队。


数据团队是指数据部门的团队还是整家公司作为一个数据团队。如果是后者,必言产 品,有一个产品可以辅助公司每一个人的数据,这个时候就对数据核心团队的要求很高。不再是公司的中央数据部门解决公司数据问题,而是整个公司都在解决整个公司的数据,这是很不一样的,能够达到这个境界,不再单纯依靠某个部门解决数据问题,而是整个公司都在产生依靠数据,才能说是顶级数据团队。


数据科学家只是整个环节中的一环,厉害的数据科学家会帮公司想几年后的东西,而不是现在就产生结果。如果作为整个团队,那么肯定是有一些灵魂人物出现,这些人不一定是数据技能有多厉害,而是懂得翻译,从数据能力到业务创新,或者商业团队的意愿转达给技术团队,这种角色是最难的。


大数据文摘: 这样的人才我们应该给在业务团队培养还是在技术团队培养呢?


车品觉: 我想答案应该是,哪边有这样的人,我们就去培养。


因为这种人非常少,再加上如果讲顶级大数据团队,在数据上继续构建,还要多一个东西,还有其他领域的数据在自己领域的增值是什么?(其他场景的数据进到我的主场景的时候会产生什么价值),这是个跨界的东西。需要一个人指挥这个团队的前进方向。


我希望用一个公司的例子来解释这个问题。我不是夸阿里很厉害,但目前来讲,我见到的公司,还几乎没有一个公司像阿里一样,对自己的数据岗位有一个很清晰的描述,也即绩效考核。比如一个P8的数据开发的人需要做什么?职责是什么,怎么知道他做得好?


因此,要建设一个顶级数据团队,你要知道怎么盘点这个数据团队,盘点一个团队肯定分两种:为了业务盘点技术,还是为了技术盘点业务,这两种有什么不一样,这是很多公司不具备的,我觉得这才是宝贵的。我在阿里这么多年,这是我最引以为傲的,至于培养了多少人,这不是重要的。


阿里的考核指标如何,阿里会让P8自己描述,你需要做什么。阿里有个优点,团队多,所以经过很多P8的描述,你就可以发现一个共同点,做一个P8要有什么样的水平。还有一个关键点,晋升一个P7到P8,到底晋升的时候有没有一个严谨的晋升之道,这也是建立一个数据团队的必经之路。


作为总监,会有一个数据的价值观,我会问你为了别人做了什么,有没有贡献过数据给别的部门,或者上下游,举个例子。这样就可以发现,团队凝聚力就很高,这不仅仅是说你自己做了什么,而是为整个大的队伍做了什么。


大数据文摘: 数据团队的构成上,嵌入式和中央式的数据团队更看好哪一个?


车品觉: 我更看好这两者混合的数据团队,就好像打架,肯定有前锋,但是前锋和后方部队的工作不一样。你可以培养很懂数据的团队来产生价值,但是谁来培养培养数据呢?数据不是资产,是资源。要时刻问自己,你的资源够不够?如果现在够,还需要问一下,公司准备在两三年后做的事情,资源又够不够?


所以数据战略应该和业务战略是同步的,业务战略走多高,数据战略也应该走多高。而数据战略又分为数据能力的战略和数据资源的战略,我们现在很多人都提到一个问题,数据的发展会成为很多东西的壁垒。数据要越来越像一个战略,算法是技术,是一个效率问题,产品和业务场景是变现,我觉得这三个点要分开来讲。


大数据文摘: 数据应用落地需要数据、业务、工程三方合作,这三方(数据团队与IT团队和业务团队)应该如何有效协作?


车品觉: 这实际上是有一个上下游的关系,最难的点是,下游的人想做上游的事情,上游的人想干掉下游的人,就是在大部分的数据团队,大家都想一条线都做完,所以问题的关键在管理。但是当中需要想的是,为什么下游的人想做上游的事情。关键在晋升。一般业绩考核都是在前段,如果你的绩效没有鼓励供应枪炮的人也得到认可,那供应枪炮的人就会想,为什么我不自己去前线。


如果把这一点逐步平台化,这个问题会改善。我们有一次在阿里,打开了整个云,看数据的重复,发现非常多,每个人都在建自己的底层。从管理者的角度来说,怎么解决?把用得多的数据变成公共层,没有人可以copy出去。


借这次采访,我也希望让更多数据公司的管理者知道,数据不是自然变好的。比如说有一年,阿里曾经把公司的三大团队拉到一个酒店,描述自己在干嘛,发现都一样。阿里有几个大团队,我所在的部门、广告、推荐,让大家都画一下自己在做事情的图,发现做的都一样,数据很多重复,每一个都想干掉对方,都在建同样的架构。如果一个公司没有CTO,没有人对此负责人,会很乱。数据重复会导致算法重复,产品重复。我在阿里这些年也在努力做这样的事情,把18个产品变成6种,算法、数据集中起来变公用。先收,而不是扩,才能做出精锐的顶级团队。


大数据文摘: 如何看待数据驱动?


车品觉: 数据驱动的定义是,我在做一个决策的时候是不是数据支持的。


这里我想举三个例子。


如果给你看一份报告,让你对这个事情有了一定的认知,接下来做了一个正确的决定,算不算数据驱动?


在一个保险计算中,有没有风险工具在其中,直接把大数据算法能力放在风控领域中,算不算数据驱动?


有一个无人飞机,这个飞机的飞行是按照数据的,风向、天气变化数据,这算不算数据驱动?


这三个都是数据驱动,但是第一个不能看待feedback。数据的闭环有很多断点,第二个场景下,数据是可以回来的,但是也存在一些断点,也不完全是一个非常紧密的数据回流;第三个是一个base on feedback的数据驱动。


当然这三个都是数据驱动,但是一个比一个有更紧密的数据回流,而且改进的时间是一个比一个更短。首先公司要明白,刚刚说的三种数据驱动在一家公司会同时存在,它是基于管理层还是中层还是直接应用。管理层的问题是不可能完全数据化的,几乎没有数据,需要基于判断,基于不完美数据的判断,第二个闭环情况下,是可以在部分环节套进去,第三个是可以自适应的。


大数据文摘: 数据团队建设最大的痛点是什么?


车品觉: 人才缺乏。


在一个行业正走红的时候,找人很难找,即使是阿里,也很难得心应手找到合适的人。刚刚讲的东西也就更关键了,依靠团队,而不是依靠某一个人,在大家都没有人的时候,我刚刚进阿里的时候就是这样,一定要打配合,我常常跟我的团队说,我们不是单人作战的,我们是一起打的。


大数据文摘:  对有志于进入数据科学领域学生/数据团队领导人的建议和意见。 


车品觉: 最好在培养的时候能培养多一点domain的人才,其实AI和大数据都有两类:基础AI/大数据和应用AI/大数据,应用是跟行业联系起来的,这两种人才的培养是不一样的,在应用端的培养,应该在大学时候给予多一些行业知识。我在念书时候,有business computing,懂商业。当然我们也不仅要培养应用类AI/大数据,也要培养基础的。


☟查看《顶级数据团队建设报告》系列专访内容

会员同比涨七成,爱奇艺是如何用大数据助力娱乐工业革命的?

数据还在“周更”的快消巨人雀巢,将全球供应链预测误差降低了50%

车好多CTO张小沛:从高管到一线,如何营造全公司一致的数据价值观

被AI潮抛弃的企业?对话微软CTO韦青,如何应对“变革”焦虑

生产全国交通大数据的团队如何运作?对话交通运输部科学研究院叶劲松 

对话吴甘沙:强技术驱动公司如何建设数据团队?你得先抢来一位技术大牛

对话猎聘CDO单艺:数据人才困局还需要大数据应对

揭秘LinkedIn总部数据科学战队:技术强者常有,顶级团队胜在软实力

微软郑宇:这个时代不缺数据,缺的是开放的思维

对话Capital One纽约总部数据中心负责人:构建中央数据团队与业务部门的良性生态

对话东航数据实验室王学武:打造爆款速胜产品,为数据找到立足之

对话第四范式胡时伟:让数据科学家成为业务专家,再为他们配一支技术军团


【今日机器学习概念】

Have a Great Definition

登录查看更多
0

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
专知会员服务
123+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
电力人工智能发展报告,33页ppt
专知会员服务
126+阅读 · 2019年12月25日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
业界 | 清华发布《人工智能芯片技术白皮书(2018)》
人工智能学家
4+阅读 · 2018年12月12日
刘强东人设崩了,京东没崩
PingWest品玩
6+阅读 · 2018年11月20日
吴恩达:我的AI商业化方法论
量子位
4+阅读 · 2018年9月6日
大伽「趣」说AI:腾讯云在多个场景中的AI落地实践
人工智能头条
4+阅读 · 2018年8月1日
谈谈王者荣耀
小道消息
4+阅读 · 2017年7月6日
Arxiv
14+阅读 · 2020年1月27日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
4+阅读 · 2018年5月21日
VIP会员
相关资讯
5G时代:北京移动业务支撑系统 DevOps 实践
DevOps时代
15+阅读 · 2019年6月13日
业界 | 清华发布《人工智能芯片技术白皮书(2018)》
人工智能学家
4+阅读 · 2018年12月12日
刘强东人设崩了,京东没崩
PingWest品玩
6+阅读 · 2018年11月20日
吴恩达:我的AI商业化方法论
量子位
4+阅读 · 2018年9月6日
大伽「趣」说AI:腾讯云在多个场景中的AI落地实践
人工智能头条
4+阅读 · 2018年8月1日
谈谈王者荣耀
小道消息
4+阅读 · 2017年7月6日
相关论文
Top
微信扫码咨询专知VIP会员