数据院要跨界、融合,更要“大胆尝试” |访清华大学教育研究院党总支书记刘惠琴

2018 年 7 月 5 日 清华大学研究生教育


清华-青岛数据科学研究院(以下简称:数据院)的成立得到了上至原校长陈吉宁,下至各院系老师的支持,这其中也包括研究生院原副院长、现教育研究院党总支书记刘惠琴老师。

刘惠琴老师从最初进行调研,到形成方案并被校领导决策层通过,再到数据院成立之初便担任管理委员会委员,她称得上是对数据院“发家史”最为熟悉的参与者之一。

此次专访,刘老师为我们详细讲述了数据院成立的始末,以及学校对数据院建设的设想和期望。


清华大学教育研究院党总支书记 刘惠琴


问题:您作为数据院成立至今始终参与指导的老师,应该非常了解学校成立数据院的背景和初衷,能否为我们讲解一下?

刘惠琴:早在1980年就有人提出了“得数据者得天下”,随后大数据概念逐渐兴起,学校里一些从国外回来的青年教师提出清华应该做大数据研究。当时杨斌老师对这个问题非常感兴趣,他认为“清华不能做跟风者,而要做引领者”。于是杨老师委托我和研究生院的李鹏辉老师一起调研,分析清华在大数据领域的优势以及做大数据的关键,提出清华大数据行动方案上报学校。

经过调研,我们发现大数据主要包括基础层、应用层、数据层,这几个层都非常重要,而当时国内数据科学的发展状况实际上是技术研发和应用先行,人才培养放在后面。学校领导根据我们的调研方案,一致认为清华要成立大数据研究院,不仅要引领科研、要有应用落地,也要培养人才。在这样的背景下,数据科学研究院就成立了。

再谈设想和期望,当时国内数据科学的布局虽有多处动作,但缺乏整合、没有声音。那么数据院就要承担起一个跨界、融合平台的作用,为此我们提出“社科突破,商科优势,工科整合,业界联盟”,陈校长在前面加了“学校统筹、问题引导”,也就成为了数据院一直以来秉承的发展指导方针。

问题:学校当时做出这样的部署真的很有前瞻性。包括当时数据院设立管理委员会(以下简称:管委会),由不同院系主任及以上级别的老师担任委员,是出于何种思考决定的?

刘惠琴:对,这种模式是学校领导和老师通过调研报告共同商量提出来的。学校里的学科和院系有一种固化的趋势,这种固化既有优势也有劣势,优势在于老师和学生可以深入某一领域的研究,劣势在于研究范围也会相应受限。

而大数据是一个跨学科的平台,需要有一个半实体的机构把这些学科整合在一起,我们要跨界、融合才能创新,所以它应该是一个半松散的机构,有一个比较恰当的“CEO”把大家融在一起,这个人学术不见得很厉害,但是他能把政、产、学、研的英才都融在一起,达到“服务国家战略、推动产业发展、培养领军人才、引领一流科研”的目的。所以学校分析后决定由各院系的老师组成管委会,在顶层建设上支持数据院成为清华的直属一级虚体机构。

包括同时成立的教育指导委员会也是出于这样的考虑,学校在做人才培养计划时,开设了大数据硕士项目,设计十门核心课,由不同院系的老师授课,目前学生已经涵盖全校所有院系。

问题:那数据院成立过程中遇到过困难吗?

刘惠琴:筹建之初难度并不是很大,因为陈校长非常开明而且有很强的决策力,我们汇报完方案,校长非常满意,立刻就在全校大力推动。记得当时是2013年12月底汇报,2014年的1月初校长就召集14个院系的主任一起召开了协调沟通会,大家对这件事都一致支持,都认为应该整合这样一个数据科学研究院。4月份青岛市政府决定给予支持,接下来就是人的问题。

可能对人的选择算是一件难事,选择数据院的院长和执行副院长需要同时考虑到他们的学术能力和执行力、对业界的了解,后来请来了俞士纶教授和王建民教授分别出任数据院的院长和副院长,两位学者都能够为数据院提供全球视野的学术支持。随后,杨斌老师出面请到了韩亦舜作为数据院的执行副院长,韩院长是第一批职业经理人之一,有丰富的业界经验和资历,现在看数据院四年来的发展,当时的决定是正确的,数据院既有着较高的学术基础,也有着不逊于多数企业的执行力。

问题:现在看来数据院的发展是否符合学校最初的预期?还有哪些是需要继续发展的?

刘惠琴:数据院四年来发展基本是符合学校建设思路的,事实上在医疗、交通等多个方向的研究,以及在人才培养方向上,数据院做出的成绩已经非常不错了。但是如果从整体的目标设想来看,唯一还需要努力的是建成统一的数据分析平台。当时学校是希望整合全校的数据汇聚到数据院,对不同的使用者进行不同的授权,搭建统一的数据分析平台,进而可以做大数据国家实验室,以整合分析大数据信息。

目前数据院正在努力从不同的领域推动数据融合,比如与临床医学院合作搭建的清华临床医学科研数据平台,在融合不同医院、机构的医疗数据,但这终归是一个长远的目标,推进起来不容易,也不是韩院长一个人能推动的。

其实,管委会和教指委更多的是在管理和战略规划层面为数据院提供支持,落地执行部分还需要继续推动,如果能够汇聚政府、高校、研究机构、企业等各个领域的专家组建一个顾问委员会,相信能够更加有力的引领数据院加快跨界、融合的脚步,才能做些更大胆的尝试。也祝数据院发展得愈来愈好。


回望数据院的建设历程,正是学校领导和老师对时代的洞察和心系社会的使命感,激活了创新动力。他们身处时代洪流,既能入乎其内,热忱地参与建设;亦能出乎其外,冷静地进行反思。相信数据院在诸多方面给予的期望与支持中,会开拓出创新的道路,让数据科学更好地发挥“融”的特色,真正打通政产学研结合,实现技术与应用落地!




供稿 | 清华-青岛数据科学研究院

登录查看更多
0

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
中科大-人工智能方向专业课程2020《脑与认知科学导论》
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
重磅发布|清华大学创新领军工程博士长三角项目今年正式启动
清华大学研究生教育
7+阅读 · 2019年9月2日
国内高校人工智能教育现状如何?
大数据技术
9+阅读 · 2018年4月24日
易观联合清华海峡研究院成立人工智能实验室
Analysys易观
4+阅读 · 2017年10月28日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
5+阅读 · 2019年4月21日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
Top
微信扫码咨询专知VIP会员