2018 年初,学术界的明星人物,美国罗格斯-新泽西州立大学教授、ACM 杰出科学家、长江学者熊辉加盟百度,担任百度商业智能实验室主任以及百度人才智库主任。
从计算机博士到商学院教授,再从学术圈到工业界,熊辉一直在跨界。从加入百度到现在,熊辉已经带领团队拿下了管理界的最高奖项——哈佛商业评论“拉姆·查兰管理实践奖”(全场最高奖),主导完成了数字化解读雄安新区的项目,并成功助力新华社《瞭望东方周刊》与瞭望智库主办的“2018中国最具幸福感城市”评选活动。
从学术界的明星到工业界的红人,熊辉对整个大数据和人工智能行业有着深刻的认识。12 月 6-8 日,熊辉将与华东师范大学副校长周傲英以及阿里巴巴副总裁李飞飞一道,作为 BDTC 2018(中国大数据技术大会)的大会主席,与 100+ 位专家同台论道。
作为大会协办单位,CSDN 借此机会采访到了熊辉,聊了聊他的转型之路,以及他对人工智能行业和人才的独特见解。
谈转型:工业界有更多可能
AI科技大本营:您本科学的是自动化,硕士和博士学的计算机科学,您当时学的内容和现在的 AI 相关吗?
熊辉:我的硕士和博士学的是数据挖掘,也就是 Data Mining,它跟现在的 AI 紧密相关,因为现在的人工智能都是数据驱动的。
AI科技大本营:您是 2018 年初加入百度的,当初为什么选择加入百度?
熊辉:加入百度主要是因为:第一,我已经很了解百度。第二,百度有很多的数据平台和数据资源。现在的人工智能浪潮跟前两次很不一样,这一次最重要的是数据驱动。
从应用场景到数据,再到 AI 算法,这是一个铁三角的循环。应用场景可以产生数据,数据的质量提高之后,可以帮助提升 AI 算法,AI 算法变得更好以后就会产生更多的应用场景,这是一个良性循环。
百度的应用场景非常丰富,有搜索、新闻 feed 流、地图,还有 DuerOS 这种智能化生活场景,这对我们的科研工作有很大的促进作用。在数据挖掘领域,离前线越近,出的成果就越多,成果的影响力也越大。
AI科技大本营:您觉得现在高校里的科研工作人员是否还有机会在 AI 科研领域和大型的科技公司抗衡吗?
熊辉:我先说一下美国的整体趋势。其实在美国有很多我们这行的教授都去了工业界,很多都是学术休假,请假几年之后再回去,这是现在非常普遍的现象。之所以非常普遍,其实和我加盟百度的原因一样。因为百度这样的公司有各种应用场景和数据,可以让我们从事一些在纯学术界从事不了的科研工作,而且容易帮助我们产生一些创新型的科研成果。
但是待在学术界是不是什么东西都做不了?也不是。在学术界有些定义非常明确的问题还是可以做的,就像解决数学难题一样,学术界的人可以在划定的范围内努力把这些事做好。但是学术界很多从 0 到 1 的东西没办法尝试,这就是我们要来工业界实践的原因。
谈工作:数字化解读雄安新区
AI科技大本营:您在加入百度之前就跟百度有相关合作了,主要是哪方面的合作?
熊辉:主要是帮助百度建立智能化人才管理系统,包括对人的管理,对组织的管理,和对文化的管理。对人的管理包括人事的选、用、育、留、辞等所有环节;对组织的管理包括组织的领导力、稳定性和激励机制;对文化的管理包括企业的愿景、使命感和价值观。
以前企业的管理都属于经验型,比较主观,而且滞后。通过大数据驱动的智能化管理可以做到更加科学、更加客观、更加透明,更加具有前瞻性,以此推动企业整体管理的智能化变革。今年,百度人才智库拿了哈佛商业评论的“拉姆·查兰管理实践奖”,这是中国管理界的最高管理实践奖项。
AI科技大本营:除了百度人才智库之外,您还领导商业智能实验室,百度商业智能实验室主要是做些什么?
熊辉:今年我们主要做了几件事情:
第一件事情是百度地图的“智行”项目。用户给定任何两个地点,然后百度地图就会提供具有情境感知的混合式的出行模式推荐。比如在交通非常拥堵的时候,你要从百度大厦到北京南站,打车还是坐地铁?百度会对所有的可能的路径进行智能化学习,然后推荐混合式的出行模型。比如建议你先打车到某个地铁站,然后再乘坐地铁,这样更快也更省钱。“智慧出行”主要在这三个应用场景下非常有效:一是交通拥堵,二是陌生的城市环境,三是跨城市出行。
我们还做了“数读城市”项目,这是百度城市大脑的一部分。今年,我们帮雄安市政府做了一份大数据报告,这个报告对比了雄安市 2017 年和 2018 年的变化。我们运用了百度大数据的优势,从多个维度数字化地展示了雄安这座城市的变迁,比如人口教育程度的改变,城市绿化的改变,城市交通状况的改变,城市基础建设设施的改变等。这份数字化报告可以更好地帮助政府数字化解读城市,并帮助做未来的城市规划。
最后,我们还开发了《基于大数据的幸福城市指数》,并为新华社《瞭望东方周刊》与瞭望智库主办的“2018中国最具幸福感城市”评选,提供了基于大数据的客观幸福城市指标。
AI科技大本营:商业智能实验室是偏工程多一点,还是偏科研多一点?
熊辉:首先我们是一个研究型实验室,所以肯定以科研为主,包括我刚才所说的所有的东西都是从 0 到 1 的创新,像多模态混合式的出行模式推荐。而且我们不光做科研,还做真正落地的产品。我想做的是一个“顶天立地”的实验室。所谓的“顶天”就是要做到科研创新,“立地”就是想法和产品要落地。
我们做数据创新,不光是理论、方法、模型的创新,还有应用场景的创新,这才是我们建立这个商业智能实验室的目的和初衷,也是王海峰院长跟我们达成的一种共识。
AI科技大本营:商业智能实验室主攻哪个领域?
熊辉:今年我们的重点是智慧城市。我们提供的是底层的基础能力,比如底层POI知识图谱的构建,底层精细化用户的画像,以及精细化区域的画像。这三个底层的能力构建出来之后,我们可以在上层做很多应用,比如数读城市,智慧交通,辅助城市规划等等。
AI科技大本营:现在马上就年底了,也就是说您加入百度快一年了,您如何评价这一年的工作?
熊辉:任何研究院都是一样,我觉得主要考量三个方面:第一,对产品线有哪些贡献?第二,科研有什么进展?第三,影响力有多大?
首先,百度地图的“智行”项目为用户提供了很大的便利,从产品线的角度来看,我觉得是非常成功的,真正为百姓出行提供了一站式的服务。
基于这个项目,我们也在 AAAI 等会议上发表了文章。因此,从研究的角度来看,我们在短短的时间内就已经有了突破,包括算法的突破以及模型构建能力的突破,而且我们也申请了很多专利。
从社会影响力来看,比如雄安的大数据报告对政府的城市规划起到了很大的帮助作用,而且我们开发的《基于大数据的幸福城市指数》,有力的支持了新华社《瞭望东方周刊》与瞭望智库主办的“2018中国最具幸福感城市”评选,这些都是非常有意义和社会影响力的。
谈技术:AI 落地的真正阻碍
AI科技大本营:有人说过去 30 年间人工智能的概念没有重大进步,一直在用几十年前发明的神经网络,您赞成这个观点吗?
熊辉:完全从技术创新角度来说,确实进步不大,但是对方法本身的理解是在进步的。就好比一个数学公式很早就发明出来了,但是对于数学公式的创新性使用往往在以后的很长一段时间才有大的突破。也就是说,可能技术模型本身的创新不大,但是应用场景方向的创新还是很快速的。
AI科技大本营:诺贝尔经济学奖获得者 Thomas J. Sargent 曾表示:人工智能其实就是统计学。您怎样看待这种观点?您认为现在的人工智能是什么?
熊辉:我觉得不能简单地讨论人工智能是什么,因为现在是数据所驱动的人工智能时代,一定不要把“数据驱动”忘掉。如果没有现在的大数据,就谈不上现在的人工智能。所以不能简单地定义人工智能就是统计学,它实际上是一种包含多学科的交叉科学。
AI科技大本营:可能很多人对 AI 能做什么,不能做什么,其实有很大的误解。您觉得目前大众对 AI 的最大误解是什么?
熊辉:我觉得大众非常容易受到宣传的影响,比如 AI 可以替换人,甚至无所不能,其实这是一个非常大的误解。从某种意义上来说,AI 现在还没有超出人的范畴,现在 AI 所做的任何事情都是属于人预先程序化设定好的,并没有突破出人预先划定的边界,所以目前 AI 最缺的是什么?AI 缺的是创新能力。
AI科技大本营:您刚才也在谈 AI 的应用场景和落地,现在很多 AI 应用场景并不是很成熟,是技术的原因吗?
熊辉:我觉得并不只是技术的原因,更多的人们对应用场景的理解问题。比如说我们通过人工智能对 HR 的改造,为什么之前没人做出来?因为以前做 HR 的人不懂技术,真正做技术的人又不愿意了解 HR,这就产生了长期的鸿沟,而这条鸿沟一定得靠既懂技术又有商业背景的人,才能把这件事情做好。我自己就处在一个比较特别的位置,为什么是特别的位置?我是大陆学者中第一个计算机系博士毕业直接在美国主流商学院做教授的。
AI科技大本营:就是既要懂技术,也要懂商业?
熊辉:对,既要懂技术,又要懂领域知识,这种复合型人才才能做出一些创新型的应用。
谈人才:烦使之而观其能
AI科技大本营:您觉得数学能力对 AI 从业者来说有多重要?
熊辉:数学能力非常重要,我一直在强调这点。我是中国科学技术大学毕业的,中科大一直非常注重数学教育。2007 年我第一次从美国回来,在给包括中科大在内的很多学校举行讲座时,发现很多学生都非常歧视学数学,而且对很多数学课程表示反感,甚至包括中科大的学生。我当时在微博上也发过评论,我说什么时候开始学数学竟然会被如此歧视?这些人完全看不到现在已经进入到真正的数据科学的时代吗?
数学是至关重要的,如果一个人的数学基础不好,那么他对算法的理解能力和理解速度都会存在极大的问题。所以当时中国教育对数学的放松其实是存在问题的。
当然,现在大家的基本认识又转过来了,都认同数学是非常非常重要的。当然,我们做数据分析一向这么认为,因为我们会用到非常多的数学知识。
AI科技大本营:那写代码的能力,就是工程化的能力呢?
熊辉:也很重要,但是每个人会有不同的特长,有的人擅长算法设计,有的人擅长算法实现,跟个人的偏好有关,但是我觉得不可偏废。
AI科技大本营:您作为百度的人才智库以及百度商业智能实验室主任,假如您要招人,您最看中这个人的什么能力?
熊辉:我选人的标准,首先是基础好的。基础好的体现是什么?我不是看你的 GPA,我对基础好的定义就是有没有在顶会或者顶级期刊上发过 paper,我个人比较看重 KDD、ICML和 NIPS,而且必须是第一作者。为什么?因为它可以证明你的数学能力、代码能力,以及你的表达和沟通能力,说明你的选题、职业素养和科研能力是非常扎实的。这种基础科研能力是我最基本的要求。
第二,我非常在乎求职者的兴趣所在。兴趣为什么重要?有些人转过来做人工智能,纯粹是因为好找工作,这样的人我不想要,因为他不是发自内心地喜欢这件事情,稍微有一点变化可能就做别的事情去了,不能坚持。
第三个是态度。烦使之而观其能,就是说这个人要能够做很多繁杂的事情,而且还不抱怨,这样的人就是我需要的有能力而且做事态度好的人。
谈未来:数据壁垒成挑战
AI科技大本营:之前百度高级副总裁刘辉提出了 AI 思维,您觉得什么是 AI 思维?
熊辉:在我看来,现在的 AI 思维就是各行各业都要在基于数据收集的情况下进行智能化改造。首先要思考在这个过程中你能收集到哪些数据,再思考怎样将这些数据应用到场景中,然后再去做相应的提升。
AI科技大本营:整体来看,您觉得人工智能未来的发展方向和趋势是什么?
熊辉:从我的角度来看,未来人工智能跟各个行业的结合会更加密切。此外,未来人工智能会更多地偏重于行为科学,与社会科学相结合,探讨算法发展带来的社会公平性问题。另外,也会有更多的人去研究算法的伦理道德的问题。
AI科技大本营:刚才谈到了趋势,您觉得未来最大的挑战会是什么?
熊辉:第一个挑战是数据壁垒。如今各个公司、组织和国家都开始意识到数据的重要性,当大家都意识到数据重要性的时候,就会对数据进行保护,甚至是近乎自私的保护,有时既使是同一个公司的各个部门之间都会对数据进行保护。如果大家都占山为王,每个人守着自己一块数据,就会导致数据严重分割,做数据驱动的人工智能研究就会变得越来越具有挑战性。
第二个挑战是真正复合型人才的稀缺,这会是阻碍人工智能行业发展的很大问题。以美国为例,很多教授(包括我自己)本可以培养更多的学生,但现在很多都去工业界了,导致人才的培养有恶化的趋势。而且复合型人才更是稀缺。很多年轻人都对 AI 有误解,他们以为做 AI 把模型学好就可以了,所以大家所有焦点都在于纯粹技术模型的学习,非常不注重结合应用场景去学习。任何一个算法,离开了应用场景,中间的一些算法技巧就会不容易把握,而且对算法的认识也不深入。很多年轻人关注的都是学了一个新算法,但是这个新算法不是在应用场景中学的,他的认知是非常有限的。所以我特别强调缺乏的是复合型的、能够懂得应用场景的 AI 人才,这样的人才都特别珍贵。
AI科技大本营:您刚才说到了数据的重要性,现在有很多关于小数据的一些方法的研究,您觉得小数据研究的前景如何?
熊辉:我认为小数据对一些应用其实是有帮助的,包括我自己做的很多科研工作。我也注重小数据和大数据的结合使用,因为有一些场景无法收集太多数据,所以我们就会收集一些小数据,对整个大数据研究做一个补充,这是我自己做很多应用总结出来的经验。
AI科技大本营:但是大数据在未来很长一段时间内应该还是主流是吗?
熊辉:肯定的,而且作用会越来越大,特别是 5G 真正应用之后。
AI科技大本营:您也不是第一次参加了 BDTC 大会了,您觉得这几年中国的大数据产业发生了哪些比较深刻的变化?
熊辉:有一点是我感受比较深的。跟美国相比,早期中国的大数据跟真正的产业结合是比较疏远的,当时中国的科研工作都是做一些已经被定义得非常好的问题,创新性的应用问题非常少。这几年,大家也在思考怎么跟不同领域的应用场景结合起来,做一些创新型的应用,而不仅仅是跟在别人的后面做工作。这是我感受到的一个深刻变化。
2018 中国大数据技术大会
◆
BDTC 2018
◆
BDTC 2018中国大数据技术大会携主题“大数据新应用”再度强势来袭。本次大会由华东师范大学副校长、教授周傲英,百度商业智能实验室主任熊辉,阿里巴巴副总裁李飞飞三位会议主席对大会内容把关,多位两院院士参与指导,由最了解行业痛点的一线从业者为同行打造。
扫描下方二维码或点击【阅读原文】快速购票。现在购票还有机会获得大数据图书一本(中国科学院院士梅宏主编的《大数据导论》或华中科技大学教授金海主编的《大数据处理》),数量有限!