[ 导读 ] 清华-青岛数据科学研究院(以下简称“数据院”)自2014年4月成立以来,秉承“学校统筹,问题引导,社科突破,商科优势,工科整合,业界联盟”24字指导方针,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才。
由清华大学研究生院、数据科学研究院及相关院系共同设计组织实施的“清华大学大数据能力提升项目”,通过整合建设课程模块,形成大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,提升学生大数据分析能力和创新应用能力。
四年来,来自全校31院系的1136名同学参加大数据能力提升项目,至今共有209位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。
清华的数据科学人才培养究竟有什么特别之处?让我们通过倾听优秀的大数据人才讲述他们与“大数据”的不解之缘,一起寻求答案吧!
“说起来,我应该算是清华第一批读数据科学方向的硕士生!”一聊到大数据能力提升项目,付睿就打开了话匣子:“我的导师张佐老师是学校里较早一批推崇数据科学教育的老师,而我也在大四的时候就已经意识到了数据科学对于日后的科技社会将有着很大的影响和推动作用,所以在那时我就已经在这个方向上探索和实践了。”
而与大数据能力提升项目的相遇,则为付睿在数据科学方向的研究中留下了浓墨淡彩的一笔。“我硕士期间的研究课题是围绕‘深度学习算法在交通流量中的预测’展开的。最初接触到机器学习和深度学习这个概念,是在张长水老师的课程中,这门课也是大数据能力提升项目的一个重要课程,真的是干货满满啊。在这门课中,我学习到了一些关于机器学习和深度学习的基本算法,比如SVM/KNN/CNN等等,而这些知识对我之后的研究课题有着很大的帮助。”
然而数据之路漫漫,挑战良多,荆棘犹在。
“最初接触一个新的领域,大家都会有一个迷茫期,尤其是同一个实验室里几乎没有人做这方面研究的时候。你要面对独立前行的困难和迷茫,面对未知的担忧和恐惧,遇到具体的问题不知道该请教谁,代码写错了也不知道该找谁帮着看看,这些都会导致入门很慢。刚开始接触的时候真的蛮痛苦的,从环境搭建到论文阅读和算法原理理解都有困难。但是我本身非常喜欢新鲜的事物,也很愿意尝试一些前所未用的东西。因此索性我就开始求助其他实验室中专门研究机器学习/深度学习的学长学姐,去请教他们关于架构和算法上的问题。这一路走来,我觉得这是快速走过新手入门阶段的一个捷径。”
“在这里也特别谢谢我的导师,她一直提点我要‘走出去’再‘走回来’,一方面会获得知识上的提升,同时也会结识一些行业中非常优秀的前辈,提升自己的视野。”
说到这里,付睿也同时提及了另一个有助于他大数据学习的小捷径。“还有一个就是大数据能力提升项目中其实有一个很明显的特性——同学们都是来自不同的学院,有不同的背景。因为在科学研究的过程中,你总会遇到各式各样的问题,那么当你有一票不同背景的同学在身边的时候,你就会发现事情变得好解决的多。像是计算机系、软件学院的同学可以跟你一起探讨关于技术层面的问题,文科背景的同学会跟你一同探讨关于大数据应用层面的问题,非常有趣,非常高效!”
采访的过程中我们天马行空地聊了很多,不得不感叹这个学大数据的男孩思路之开阔一点都不像是一名刚刚步入社会的少年。其中令我印象最深刻的一句是他对“跨学科学习”的感悟:
跨学科学习的过程中,你感受到更多的是原来世界是如此的一致。即:在一个领域成立的结论,在另一个领域,换一个场景,会相似地复现类似的结论。而这种原理和现象,非常有助于我们加深对现象背后的哲学思考,加深我们的思维深度。
往期毕业生专访: