专访腾尚华教授:优秀的科学家该是什么样子?

2017 年 11 月 20 日 AI科技评论 camel

AI科技评论按:从哈尔滨飞往北京的飞机上,笔者的身旁一个五十多岁的中年人一直在向邻座的年轻人请教如何教育孩子,态度极为认真、谦虚、热切。两个多小时的行程,年轻人几乎把他从当爸爸始到现在止所有的经验和想法全部讲给了他。

其实笔者也曾有过类似这位年轻人此时的经历。

在微软亚洲研究院与哈工大共同举办的第十九届“二十一世纪的计算”国际学术研讨会(21CCC)午饭时间,当了解到笔者曾经从事过物理学研究后,这位中年人(一手端着饭菜)便站在那里,向笔者询问起引力波、暗物质等相关研究的前沿进展,十分投入,以致忘了手中还端着饭菜;十分热切,以致笔者不得不搜肠刮肚把知道的全部内容都说与他听。

这位中年人就是南加州大学计算机科学与数学系教授滕尚华。

滕尚华教授是国际上著名的理论计算机科学家,在理论计算机方面做出了巨大的贡献。

他和耶鲁大学的Dan Spielman教授共同提出的平滑分析理论使他们获得了2008年的哥德尔奖。

(哥德尔奖的获奖者必须在理论计算机领域具有开创性的重大贡献,同时其研究论文须在获奖前14年内正式发表在学术期刊上。——wikipedia)

2009年,滕尚华教授当选为美国计算机协会院士,同年获得由数学规划学会和美国数学学会颁发的福尔克森奖。

2015年,两人在线性时间拉普拉斯求解器方面的研究再次使他们获得当年的哥德尔奖。

滕尚华教授作为特邀嘉宾,参加了21CCC的大会,并做了《大数据和网络分析的可扩展算法》的报告。会后笔者有幸采访了滕尚华教授,了解了他的求学、研究生涯的一些细节、和Dan教授之间的合作、相关工作内容以及他五岁的女儿的教育。

内容速览:

1、本科学了三个专业的课程,在以后的研究中不会把自己局限在任何一个单一的学科里面;

2、做研究必备好奇心和兴趣,这两者甚至大于学位本身;

3、天才之间的相识与合作;

4、平滑分析、线性时间拉普拉斯求解器的工作过程及简介;

5、对女儿的教育与观察,女儿成为他生活和工作的重心之一。

以下内容为不改变原意的情况下的精简和编辑。




一、求学、研究生涯

AI科技评论:能否介绍一下你的求学经历。

腾尚华:我在中国时是在上海交大读书(注:85届),学的计算机科学。

当时上交大正在做教育改革,我们一共18个学生作为第一批优异生,当时我们可以选两个专业。我本想选数学加计算机,但还没有数学的选择,所以就选了生物和计算机。当时每天我都要到华东化工学院去上生物化学的课程。但后来我决定不学这个专业了,校长把我的学分转到电子信息,所以最后一年我基本上要上两倍的课,把电子信息需要学的全给补完了。所以我当时拿到了这两个学位。

但是到了美国以后,我基本上一直在做计算机的研究,先是计算机系统结构;一年后我觉得我更喜欢数学了,因为我发现我动手能力并没有那么强大。

AI科技评论:感觉您现在的知识背景(包括灵感来源)蛮复杂的,有经济学、数学、计算机等等,请问您是如何做到的呢?

腾尚华:首先可能是因为我当学生时候学的内容比较广,所以对什么都感兴趣,感兴趣了就会去了解一点。

其次,就是你要去不同的讲座,很多灵感都是从别人那里来的,如果只局限在自己看的几个问题上就会比较狭隘了。美国这点就很好,它有很多讲座。

你去参加会议,坐在那里多半也听不懂;但偶尔他讲的,你会觉得很有想象力,然后你就会自己多读一些相关的内容。知识就是这样过来的。

AI科技评论:你觉得做科研需要哪些必备的品质?

滕尚华:我觉得总体还是好奇心。当你好奇一件事情的时候,会让你长期去想这件事情。

因为任何一件事情,你刚刚看的时候都觉得好像很多问题都被别人做掉了,剩下的问题太难了。每一代人都这样想,我这代人看我老板那代人,他们都把那么简单的问题做掉了,都变成名人。但是实际上在他们那个时代并不是那么简单的事情。

每代人的平台不一样,他一直在想一些事情的时候,可以经常找到前一代人没有想到的问题,或者前一代人没有想到的办法。但是能够找到这个,往往就是他个人觉得自己要做出来的事情。

其次是兴趣。当时我在CMU有一个印度同学,他在印度的时候一直都是总统级的奖,最好的学校。博士二年级的时候他去英特尔实习,然后给我打了一个电话说:我很喜欢Pentium,我不想回去了。

我说:你疯掉了吗?你在全世界最好的学校,你再努力两年就毕业了。

他说:我大概要留在这儿(注:英特尔)了。

这是1990年的事,我是1991年拿到的PhD。1994年有一天他给我打个电话说:你要不要来英特尔?我现在需要对算法很精通的人。我想了半天,就只认识你,下个学校你多少工资,我给你两倍。

我去了英特尔,发现他自己创建一个实验室,带领了120个博士。他当时写出了英特尔Pentium的全部内容,但是他自己没有觉得他自己必须要做博士。

当年把整个Pentium全部模拟出来是非常不可思议的一件事情。你可以看到他对这件事情非常热忱。一个小小的研究生,这么几年就做出这么大一个模型。

二、天才之间的相识,是缘分还是必然

AI科技评论:你和Dan Spielman是怎么认识的?

滕尚华:这都是年轻时代的事了。Dan在大学二年级的时候就做出一个很伟大的论题。所以很多学校都要邀请他去做博士生,CMU也想,所以就先请他去做了个交流。当时他才20出头。我作为理论方向的学生,当时系里拿出400美元让我管他两天的生活。事情过去了也就没有多想了。

后来我去MIT做一个演讲。我刚到,坐在办公室里头,面对着门。一个小孩走了过去,然后他又倒了回来。他说“我认识你,但想不起来在哪见过了。”后来我俩终于想起来,我曾经是他的东道主。

我们一起去吃了个午饭,顺便聊了聊正在做的问题。所以实际上,我们先成为朋友,然后才考虑很多共同的问题。很偶然,但是有一些必然。

AI科技评论:在科研上你们两个一直都有合作吗?

滕尚华:对。你喜欢跟一个人讲一些事情,就会讲的多一些;尤其他是那么超群的人,这不是百里挑一,而是百万里挑一的才智。所以,正好我们共同喜欢一些问题,就会经常讲一讲,讲的多了有些时候就有点憷头。并不是每个问题都做出来了,但还是做出了一些。

不过最近稍少了一些。我女儿出生以后,我实际上在孩子身上花了很多精力。不像以前我就住在他们家,整天都在一起。 再过两年我女儿可能不理我了,所以我要想想以后要跟谁讲话。不过现在她跟我讲话,所以她是我现在最大的合作者。

三、两次获得哥德尔奖的工作

AI科技评论:您当时是否是根据计算机算法中的实际问题选的课题?

滕尚华:理论和实际总是有很大的距离的。这个距离有时候是好事情,有些时候也是坏事情。

好事情就是说它给做理论的人一个小的自我空间,这样你可以更加有想象力,你可以想一些事情,它不一定马上就产生影响。所以做基础研究会考虑一些问题,有些时候有长远的想法,但是更多的时候并不会去想20年、50年以后会有什么影响。多半做理论还是,你个人觉得很美。美和有用不一定相同,而且很多场合下是这样的。

要么你特别喜欢这个问题,要么这个问题的猜想让你很有想象力,或者他会牵扯到一些数学你觉得很奥妙,这些都是做理论的动力。但是偶尔有些时候,也会考虑一些实际应用的问题,尤其是计算机方面。

当然,虽然是从实际出发的,但是作为理论家,更会考虑到这个问题是不是漂亮。偶尔某些东西你突然想对了,事后人们说这个想法是长远性的。

AI科技评论:能否介绍一些您和Dan教授在2008年第一次获得哥德尔奖的平滑分析的工作?

腾尚华:当时理论界长期在分析算法的时候,采用的方式都是最坏情况分析(worse case analysis),就是用算法的最坏情况来评估算法。这就相当于你用一个班级里面考试成绩最低的同学来评估整个班级的水平一样。其实大多数情况下,都可以做得比WCA更好。

我们的出发点是,实际的数据总是一个很精确的东西加上一个概率性的变量。所以你要解决实际问题,那么你就必须说这个算法在实际中它的性能是什么样的。我们就希望至少有一些理论,做实际的人认为不是那么空想,而且理论的一些设想是符合实际的。

AI科技评论:能否介绍一下2015年第二次获得哥德尔奖的线性时间拉普拉斯求解器的工作?

滕尚华:实际上这个问题本身是蛮久的问题。最初也不是我们在看的问题,这个问题实际上是和很多人的经历都有关系的问题。我们上中学的时候学物理时会有一些电路的知识,并联或者串联、加压/减压时电压、电流多少,怎么变化等等。这个算法实际上是线性的。

这个问题其实出现在很多地方,包括社交网络分析、机器学习等,都可以归结到这个电路图上,当然此时这个“电路图”已经不再是并联、串联了,它可以是任意连接;但类似的问题仍然存在。

在复杂电路中,我在一些地方加个压或者减个压,电流会怎样变化?这个问题人们一直没有很明朗化地提出来。但是这个问题很奇怪,算法做了那么多年,一直不能做到线性时间。90年代有一个人提出了一个算法,他把当时的算法改进了一些,用到图论中一些很奥妙的东西。我们当时只是觉得他用图论中的这个东西很有趣,我们就想,它会导致对图论的哪些理解呢?

这件事情我们当时花了很多年,看不同的论文。后来我们就想到了一些策略,能够把这个电路的问题给线性时间求解出来。解出来后,突然就有其他人说这个和他做的问题很像,例如可以用到社交网络、机器学习等方面。机器学习实际上也是类似一个电路,只不过稍微有点不同。他们一直也在研究怎样找到一个函数来刻画整个图,于是就把我们的工作拓展到他们的领域中了。

所以,这也是我刚才讲的,我们做这个的时候,并没有想要用这个东西去改变世界,只是因为当时觉得数学很漂亮,想要去推进这个问题。

我们算法出现以后,2005年左右,我们又改善一点。这些算法现在已经完全被改善了。年轻人如果回头去看我们当时的结果,可能会说:你们怎么这么笨,做成这样子。但当时黑暗的时候,我们也看不清楚在什么地方,就自己打个手电筒尝试这件事情,所以当时就是这样构造的。事后人们再看的时候,会说还有其他的捷径。

四、女儿成合作者和观察对象

AI科技评论:   在很多场合下,都听到您介绍您的女儿,言语之中满满的喜爱之情。咱们能否谈谈她?

滕尚华:可以。我女儿现在刚刚5岁,也算是老来得子吧。我周围的朋友他们的小孩都已经上大学了。他们给我一些建议,很简单,就是:少做点科研,多跟小孩玩一玩。

看一个小孩成长,尤其是在当今机器学习、AI迅猛发展的时候,实际上我觉得是很有意思的一件事情,因为我可以看到这个小孩子怎么能够迅速的学到一些东西。所以有些时候,一些机器学习的东西,我自己知道一些理论或者是算法,我可以看看小朋友是怎么去想的。

不过更多时候是没有办法知道的。因为小孩的发展非常迅速,你觉得你好像猜到她会怎么样做。第二天她就会给你另一个惊喜。

但是,很多时候我还是可以看到她怎么样去扩展化的,怎么样从很多或者很少的数据里头突然转变。我经常可以看到的这样的事情在我女儿身上发生。

AI科技评论:能否讲一讲你女儿成长过程中的一些事情?

滕尚华:我经常会跟其他人讲我看到的一些东西。尤其是一些小故事,你突然觉得她怎么会达到这个地步。有一次刚会讲话的时候,我给她读一本动物书,她突然就会说,老虎。有一页我打开以后,书角底下有一只蝎子,她很激动,指着它说“恐龙”。因为她从来没有见过蝎子,在她看到的所有动物中这个动物最接近的确实是恐龙,所以实际上她是正确的。

以后知识越来越细分,刚开始这也是所谓归类,学习就是你怎样归类的过程,所以她看到一个没有看见的东西,也会确认这件事情,说这个是恐龙。所以我有时候会说,这个和机器学习比较接近。

AI科技评论:是您女儿影响了您,让您学机器学习、人工智能这些方面吗?

滕尚华:在和别人交流的时候我会想到这些。就像别人在讲,怎么样做自然语言处理。以前我也就听朋友讲讲自然语言处理怎么做的,但现在我自己有了一个很具体的自然语言处理模型,所以我能直接进行观察。

例如英文和中文的学习和表达也是自然语言处理。我太太不讲中文,而我非常希望我女儿可以讲中文,所以从她出生以后我基本上没有给她讲过英语。很多时候我都能在我女儿成长中很明显地看到中、英之间的影响。所以别人再讲自然语言,我就会和以前不一样了,而会去参考我女儿的学习。

所以就像很多理论学家,有些生活中的事情,当时你可能没有想到会改变你的科研方向,但是潜移默化地还是改变了。 

我很好奇,儿童在学语言的过程中,到底是怎么去处理这些不同语言的转换,到底一个语言对另一个语言有什么样的影响?我觉得这里头有很多AI或者机器学习的问题。所以我会读很多我之前做科研不会读的一些论文。

最近这五年,我花了至少1/3的时间在读一些和我的研究没有关系的文章上。从这个意义上,我女儿也算是我的合作者吧。

<完>


和滕尚华教授的接触,对笔者一个极大的感触就是:优秀的科学家之所以优秀,必有其优秀的原因;他就像一个有吸引力的知识漩涡,和他交谈的人都愿意倾吐自己所有的知识。

 推荐阅读 

专访丘成桐先生:做学问就要真正为学问而做学问

专访洪小文:人和当前AI的智能有什么区别?以简制繁 v.s. 以繁制繁

图灵奖获得者John Hopcroft:理性看待AI浪潮,下次革命或许还需要另外40年

—————  AI 科技评论招人啦!  —————

我们诚招学术编辑 N 枚(全职,坐标北京)、新媒体运营 N 枚(全职,坐标深圳)、学术兼职 N 枚。

详情请参见AI科技评论招人啦,新媒体运营、学术编辑、学术兼职虚位以待!

欢迎发送简历到 guoyixin@leiphone.com

—————  给爱学习的你的福利  —————

不要等到算法出现accuracy不好、loss很高、模型overfitting时,

才后悔没有掌握基础数学理论!

线性代数及矩阵论, 概率论与统计, 凸优化

AI慕课学院机器学习之数学基础课程即将上线!

扫码进入课程咨询群,组队享团购优惠!

详细了解点击文末阅读原文

————————————————————

登录查看更多
0

相关内容

CCC旨在促进计算复杂性理论的所有领域的研究,研究资源约束下计算模型的绝对和相对功率。典型的模型包括确定性模型、不确定性模型、随机模型和量子模型;均匀模型和非均匀模型;布尔模型、代数模型和连续模型。典型的资源约束包括时间、空间、随机性、程序大小、输入查询、通信和纠缠;最坏情况和平均情况。其他更具体的主题包括:概率和交互证明系统、不可近似性、证明复杂性、描述复杂性以及密码和机器学习的复杂性理论方面。会议还鼓励其他领域的计算机科学和数学的动机计算复杂性理论。官网链接:http://computationalcomplexity.org/
最新《机器学习理论初探》概述
专知会员服务
44+阅读 · 2020年5月19日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
 第八届中国科技大学《计算机图形学》暑期课程课件
专知会员服务
55+阅读 · 2020年3月4日
周志华教授:如何做研究与写论文?
专知会员服务
153+阅读 · 2019年10月9日
吴恩达“官宣”荣升准爸爸~
AI100
4+阅读 · 2019年1月18日
当我们在读书时,我们在读什么?
互联网er的早读课
3+阅读 · 2018年3月19日
Arxiv
14+阅读 · 2020年1月27日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
Arxiv
20+阅读 · 2019年9月7日
Arxiv
3+阅读 · 2018年3月27日
VIP会员
Top
微信扫码咨询专知VIP会员