来源:新智元
作者:闻菲,刘小芹
本文长度为3000字,建议阅读7分钟
本文介绍了科技情报挖掘系统AMiner对半个世纪以来的顶级研究者的迁徙的研究。
[ 导读 ] 2017机器智能前沿论坛今日在中国工程院报告厅成功举办。清华大学计算机系副教授唐杰发表主题演讲,并为大家介绍了数据科学研究院AMiner团队自主研发的研究者社会网络挖掘与搜索系统——AMiner及近期研究成果。
提到AMiner能够做什么,他举例:阿里巴巴一直关注AI领域,包括今年建立达摩院,非常需要引进相关人才,针对这一方面阿里巴巴与AMiner达成合作。AMiner系统可以通过对AI做领域梳理划分,再分析各细分领域的专家信息,最终实现精准学术画像,为阿里提供人才信息。唐杰老师还提到了包含亿级学术信息,并自动分析关联的开放知识图谱,可供大家用于研究。
开放知识图谱地址:https://aminer.org/open-academic-graph
随后,唐杰老师为大家展示了AMiner团队发布的半个世纪以来顶级学者迁徙视频,这是AMiner在对全球 1.3亿研究者进行精准画像的基础上做出来的研究者生涯职业变化图。这个视频包括了全球10,000名顶级研究者(根据发表论文引用计算的个人h-index最高的研究者)的职业地理位置迁移图。
从MS-DOS发明、第一个个人数字助理,到第一台iPhone,用基因方法修改人类胚胎,伴随人才的流动,展现科技发展图景。从图中可以清晰的看到在过去50年,人才从欧洲到美国、从美国东海岸到西海岸、从美国到中国的流动,以及更加全球化的变化。
仔细查看,还可以看出上世纪70年代整个亚洲的顶级人才都相对较少,少数集中在以色列、日本,印度和澳大利亚也有一些;到80年代中叶,中国开始有吸引了少量顶级学者(大多是顶级华裔学者回归),但全球这个时候的顶尖人才大多分布在美国(尤其是东海岸)、英国和西欧,回归国内的学者主要集中在北京、上海和南京;到90年的时候,中国顶尖人才数量在亚洲已经超过印度,而且分布也更广,不再仅仅局限于北上广,但数量上总体还不及日本;到2000年以后中国和欧美的交流大大增强,回归国内的全球顶尖学者也大大增加,而且很多顶尖学者开始回到内地,这个时期香港的发展达到顶峰;最近几年这个趋势得到进一步增强。从到目前为止的分布来看,全球顶尖学者更多的还是在美国和欧洲,但中国乃至亚洲都得到极大的发展。
另外,该视频还展示了每年最重大的科技实践,包括从计算机的出现和发展、互联网的萌芽、全球信息化的开始、互联网的普及、移动互联网的兴起等科技大事件。
这个工作的难点包括两个,一个是数据缺失,很多研究者的信息缺失,很难拿到所有学者每年的职业变化信息,我们使用机器学习算法自动对缺失数据进行补全。另一个难点是很多人的名字存在重名现象,我们设计了一个高效的命名排歧算法,并对识别出来的职业信息进行平滑化,自动纠正了大量识别错误,通过这两个方面的优化,目前自动识别精度达到90%以上。
除此之外,AMiner团队得到了几个有意思的结果。一是欧美之间保持着非常活跃的学术交流。“我们直觉上认为,进入21世纪后,中美两国在学术上更加活跃,尤其是在计算机科学领域,”唐杰说:“从文章发表数量上看,欧洲相对来说没有那么多。”但实际上,根据这次半世纪人才迁移调查,团队发现欧美之间学术交流仍然保持在一个非常高的水平。
其次,中国仍然处于顶级学术起步阶段。“最近中国的强势表现让我们有一种‘中国已经成为学术中心’的错觉,”唐杰说,实际上我们才刚刚起步,仍有很长的路要走。
再来是在计算机科学领域,很多人可能会以为谷歌、Facebook等大公司所在的硅谷是CS活跃地区,但实际上美国东部,有CMU、MIT所在的学术重镇,其实力和影响力都非常惊人。
唐杰告诉新智元,这次的数据只是一个初步的展示,包括了各个学科及领域的人才流动情况。接下来AMiner团队将会发布的版本计划增添新的功能,包括让用户能够指定学科和领域(比如AI),搜索该分类的人才流动情况。
来自AMiner的最新更新,唐杰教授4日在微博上发消息说:给大家分享一个AMiner自动生成的技术趋势预测“人工智能”,可以自动发现子领域;分析近期热度、全局热度;可以追溯技术源头;可以发现每个子领域历史来重要人物。
AMiner团队将不断的推出更多科技大数据的深度洞察报告和情报分析结果,让您“洞察科技,把握趋势”。
这还只是预览版,不久后将有更完善版本发布:
此前,AMiner曾经绘制过一副AI历史图,标出了AI历史节点上的关键概念和人物:
(点击图片查看高清大图)
以下就是AMiner团队“半世纪全球顶级学者迁移图”的调查结果。每张图中的蓝色线条表示顶级人才的迁移情况(视频中能够看到流动方向)。
每一年,团队都选择了代表性的人物和/或事件。这个选择的标准是根据当年论文的引用情况、著名的学术获奖(比如诺贝尔奖)等多项指标进行的排名。
1978
路易丝·布朗(Louise Brown)出生,成为第一名通过体外受精技术出生的试管婴儿。Robert K.Jarvik发明的人工心脏Jarvik-7。
1979
手机发明
Seymour Cray发明Cray超级计算机
1980
阿兰·古斯(Alan Guth)提出宇宙暴胀模型
1981
MS-DOS发明
第一台IBM-PC发明
Gerd Karl Binnig 和 Heinrich Rohrer 发明的扫描隧道显微镜
1982
理查德·费曼(Richard Feynman)提出可模拟任何物理对象的通用量子模拟器
人类生长激素基因工程。
索尼和飞利浦合作发明CD(光盘)
1983
Kary Banks Mullis 发明用于DNA测序的聚合酶链式反应(PCR)
Apple Lisa 个人电脑发明
Jaron Lanier 首词提出术语“虚拟现实”
1984
Psion 开发第一个个人数字助理
Barry Marshall 和 Robin Warren 证明溃疡是由细菌引起的
1985
微软开发 Windows 程序
David Deutsch 提出通用量子计算机
1986
苏联发射永久空间站MIR
Karl Muller 和 Johannes Bednorz 发现第一种高温超导体
1987
Applied Biosystems 推出了第一台全自动测序仪
第一个3D视频游戏诞生
1988
数字蜂窝电话发明
克里斯蒂安·多普勒(Christian Andreas Doppler)发明多普勒雷达
第一项遗传工程的动物专利被授予哈佛大学研究人员Philip Leder和 Timothy Stewart的“哈佛鼠”。
1989
高清电视发明
康奈尔大学学生罗伯特·泰潘·莫里斯( Robert Tappan Morris)由于散布蠕虫病毒,成为第一个根据1986美国“计算机欺诈和滥用法案”被起诉的人
赤崎勇(Isamu Akasaki)发明蓝色发光二极管
1990
哈勃望远镜发射
第一个互联网搜索引擎“Archie”出现
Tim Berners-Lee 发明万维网WWW、Internet协议(HTTP)和WWW语言(HTML)
威廉·弗伦奇·安德森(William French Anderson)完成第一例基因治疗手术
1991
第一个网站在CERN上线
Qiudong Wang 为n体问题提出解决方案
Nicola Pellow 推出第一个跨平台网络浏览器 Line Mode Browser
数字电话答录机发明
1992
Calgene创造“Flavr Savr”番茄,这是第一个在商店销售的基因工程食品
手机发送了的第一条短信(SMS)
SOCKS互联网协议公开
1993
Gerard't Hooft 提出全息理论
Pentium 处理器发明
William Wootters等人发现如何用纠缠实现量子传送
1994
HIV蛋白酶抑制剂发明
Netscape 启动 Netscape Navigator Web浏览器,创建HTTP Secure
高亮度蓝光LED发明,发明者在2014年获得诺贝尔奖
1995
Java计算机语言被发明
DVD发明
顶夸克(top quark)终于在费米实验室被发现
1996
诺基亚推出了第一款“智能手机”
Giacomo Rizzolatti 发现大脑使用“镜像”神经元来表达别人在做的事情
1997
Ian Wilmut 克隆了第一只哺乳动物,绵羊多莉
第一台漫游器机器人“火星探路者”登陆火星
丰田开始销售混合动力车普锐斯(Prius)
1998
Saul Perlmutter,Brian Schmidt 和 Adam Riess 发现宇宙的扩张正在加速(暗能量)
Juan Maldacena提出全息宇宙理论
James Thomson 等人培养人类胚胎干细胞
1999
第一个社交网络平台Friendster由Jonathan Abrams发布
Tekno Bubbles 获得专利
John Pendry 发现创造超材料的方法
2000
FluidSense 输液泵发明(自动标准化静脉给药)
Tau中微子由DONUT协作发现
2001
第一版人类基因组计划发表
AbioCor 发明AbioCor人工心脏
人造肝脏由 Kenneth Matsumura 和 Alin Foundation发明
2001年10月23日,苹果公司发布便携式音乐数字播放器的iPod
2002
James Auger 和 Jimmy Loizeau 发明植入芯片的牙齿
Nano-tex LLC 发明纳米可穿戴织物Nano-tex
Sanford Ponder发明ICOPOD
2003
格里戈里·佩雷尔曼提出庞加莱猜想的证明
人类基因组计划完成,确定了人类DNA中的所有基因
2004
NASA确认火星存在液态水
发现双脉冲星
Andre Geim 和 Konstantin Novoselov 成功分离出单层石墨烯。
2005
Edvard Moser 和 May-Britt Moser 发现大脑中的网格细胞
第一个视频被上传到在线视频托管服务YouTube
在卡特里娜飓风之后,新奥尔良地区的堤坝被毁坏。
2006
社交网络服务Twitter出现
Paul Rothemund 发明DNA折纸
美国威克森林浸会医学中心的Anthony Atala和团队成功将第一批实验室培育的膀胱移植到人类患者中
2007
史蒂夫·乔布斯发布苹果公司的第一款iPhone智能手机
中国月球探测计划的第一颗卫星嫦娥1号发射升空
Knome 首次尝试将人类基因组测序商业化
2008
比特币首先在一个密码学网站的邮件组列表被描述
“神舟7号”发射,这是中国太空计划的第三个载人航天器
CERN大型强子对撞机(LHC)开始质子团队测试
2009
Yinfa Ma 博士开发了一种使用尿样进行检测的癌前筛查方法
两队中国研究人员从诱导性多能干细胞(iPS)细胞中产生活小鼠
亚利桑那州立大学的研究人员Hao Yan和Yan Liu使用纳米粒子制作3D DNA纳米管
2010
自动驾驶汽车从意大利行驶13000公里来到中国,是自动驾驶汽车的第一次洲际之旅
2010年5月20日:Craig Venter领导的科学家创造出首个合成基因组细胞
科学家成功实现老鼠“逆生长”
2011
中国科学家计算出蛋白质折叠的量子定律,解释了温度对折叠的影响
航天飞机计划STS-135的最后任务是在亚历山大号航天飞机在肯尼迪航天中心着陆
美国宇航局成功建立了火星科学实验室,该实验室曾成功实现好奇火星车的着陆
2012
Jennifer Doudna 的小组发明了用于基因编辑的 CRISPR-cas9 系统
希格斯玻色子在CERN被发现(确认为99.999%的确定性)
在麻省理工学院发现了光子分子
京都大学Kiyotaka Miura发明了可以容纳数百万年数据的石英玻璃存储器
2013
第一种可植入癌症疫苗,结合了最新的癌症免疫学与材料科学,在2013年进入临床试验
科学家成功制造各种迷你器官
科学家通过克隆创造了人类干细胞
2014
欧洲航天局设计的罗塞塔航天器包括了美国宇航局的特殊仪器,并将其220磅重的菲莱登陆者登陆彗星67P / Churyumov-Gerasimenko
Lockheed Martin宣布,他们在核聚变领域取得了巨大的技术突破
2015
火星上发现液态水痕迹
Junjiu Huang 用基因方法修改人类胚胎
视频链接:
https://static.aminer.org/lab-datasets/trajectory/top10000career-trajectory.mp4
了解更多:
https://aminer.org/