NLP研究入门之道:本科生如何开始科研训练

2019 年 6 月 4 日 AINLP

推荐清华大学刘知远老师的Github项目:NLP研究入门之道

Github地址,可点击阅读原文直达:

https://github.com/zibuyu/research_tao

本期推送第六篇:本科生如何开始科研训练,感兴趣的同学可以直接在Github上阅读。




近年来,研究人员“低龄化”现象日趋明显,越来越多国内高校的本科生加入实验室开展科研工作,并开始在计算机各方向的顶级会议甚至期刊上崭露头角。科研创新能力是高校学生培养的重要目标之一,因此本科生培养中的这一趋势值得我们关注。

我的研究兴趣是自然语言处理,作为高校青年教师,最近指导了多名计算机专业本科生开展科研工作,其中有些在领域顶级国际会议上发表论文。在指导本科生开展科研工作的过程中,积累了一些个人体会和困惑,在这里与同行们分享。

本科生进行科研训练的背景条件

现在越来越多本科生选择加入实验室开展科研工作的趋势,是受到了很多因素影响而产生的。

首先,我国计算机科研水平和国际化水平显著提升。十年前,国内高校能够在计算机顶级会议和期刊上发表高水平论文的科研人员还凤毛麟角。经过近十年来的高速发展,在大部分领域的顶级会议和期刊上发表论文,对国内科研人员已非难事,很多国内学者活跃于国际学术界,更有很多最佳论文等奖项花落国内,这从某个侧面说明国内高校计算机专业的国际化水平不断提升,学术氛围日益浓厚。越来越多国内高校学者能够站在国际学术前沿考虑科研问题,通过专业课程讲授等渠道,影响到本科生群体。在过去,本科生同学甚至很多研究生同学主要通过在微软亚洲研究院等国际研究机构来接受国际化的学术训练,而现在,同学们在高校实验中就可以接受国际水平的训练,无疑极大地促进了本科生开展科研工作的热情。

其次,国内高校日益重视本科生科研创新能力培养。近年来,国内各高校分别提出了各自的发展规划与目标。以清华大学为例,在百年校庆时提出到2020年跻身世界一流大学,相应的,计算机系也提出建设世界一流的计算机学科。高校的根本任务是培养人,如何培养国际水平的本科生,是实现世界一流大学奋斗目标的重要指标。创新能力,特别是科研创新能力则是本科生培养的重要方面。国家和高校采取了很多措施推动本科生创新能力培养。清华计算机系设立了学生研究训练计划、学术新星培育计划、英才公益基金等项目,支持本科生积极参与实验室科研创新和国际学术交流。根据调研,清华计算机系本科生超过80%有过实验室研究经历,平均每年有十余位本科生在国际顶级会议和期刊发表高水平论文。

此外,新时代大学生更加注重自我发展和成长。随着物质文化水平的提升,当代大学生善于利用互联网等媒体了解世界,有更开阔的眼界,进而有更明确的自我定位,更加注重自我发展和成长。因此,当代大学生进入高校后,能够更积极主动地利用学校提供的相关优质资源,其中最重要的,就是高水平实验室的优秀导师和实验环境。

由于这些复杂因素的综合影响,越来越多的计算机专业本科生同学将加入实验室从事科研工作作为提升自己的重要课外活动之一。这也逐渐成为高校培养本科生的重要环节。

本科生为什么要进行科研训练

要想做好本科生科研的指导,需要理解高校本科生培养的目标,了解本科生参与科研工作的目的。

高校本科生除了课业学习外,实际上课外活动有很多选择,例如参加兴趣协会,从事社会工作,参与科创活动,等等。可见,进入实验室从事科研工作只是其中一个选项。那么,本科生为什么选择加入实验室的同学,他们的目的是什么呢?从我接触到的同学来看,本科生同学加入实验室可能包括以下几种目的:

  1. 寻找兴趣。希望寻找自己的研究兴趣,了解最前沿知识,提升个人能力。

  2. 出国申请。希望申请出国读研究生,需要科研经历和论文发表提升竞争力。

  3. 充实生活。希望让自己的业余生活更加充实,等等。这些目的并非互斥的,有些同学同时抱有以上几种目的。

我感觉,虽然大部分参与同学多少都抱有第1种目的,其中最积极、成果最突出的则是那些抱有第2种目的的同学。而从高校培养本科生科研创新能力来看,计算机专业本科生参与科研工作具有重要意义,能够得到全面的创新能力培养,具体体现在:

  • 选择研究课题,能够锻炼同学提出问题和发现问题的能力。

  • 寻找技术路线,能够锻炼同学独立解决开放问题的能力。

  • 设计实施实验方案,能够锻炼同学的动手实践和团队协作能力。

  • 撰写发表论文,能够锻炼同学的逻辑思维和严谨论述的能力。

  • 参加国际会议报告研究成果,能够锻炼同学的口头表达和与人交流的能力。

可以说,本科生能够成功发表一篇高水平学术论文,收获的将不仅仅是简历上的一笔亮点经历,更是自身能力的全方位提升。

计算机科学与技术是一门年轻的学科,目前正处于飞速发展的时期,相当多的领域知识短时间内根本无法来得及沉淀到教科书中。这样,一方面要求计算机学科同学需要建立终身学习的理念,有较强的独立学习的能力;另一方面则要求计算机学科注重通过实验室研究锻炼同学的科研创新能力。因此,高校培养计算机专业本科生科研创新能力的主要目的是,通过指导同学参与科研工作全过程,引导同学树立专业志趣,建立同学的专业自信心和自豪感,培养同学终身学习的理念、自我学习的习惯、提出问题的意识、以及独立解决开放问题的能力。

由此可见,高校培养本科生科研能力的目标,以及本科生参与科研工作的目的,均与研究生有显著不同,这决定了本科生开展科研工作有着迥乎不同的特点。

本科生进行科研训练的建议

我将本科生成功开展研究工作总结为以下公式:

成功的研究工作 = 重要的课题 + 新颖的方法 + 投入、积累、坚持

本科生与研究生相比,开展科研工作的条件差异巨大:首先,研究生阶段少则3-5年,而一名本科生总共只有4年时间,掐头去尾可能只有2年左右能够持续开展研究工作。其次,本科生只能在专业学习之外开展实验室科研工作,投入的强度和持续性都有明显的节奏性,会受到期中考试、课程作业以及其他课外活动等的影响。最后,不同于研究生有硕士或博士学位的“羁绊”,本科生与导师之间不存在官方的约束关系,关系更加松散。与研究生相比,本科生从事科研工作有非常鲜明的特点。

周期较短

本科生开展研究工作的功利性目的性更强。受到时间和投入等客观因素限制,大部分本科生不能像研究生那样系统地从事某个方面的研究工作,而只能从某个具体研究问题迅速切入,短时间内完成算法设计、实验验证和论文撰写等过程。如果本科生在短时间内无法获得较为可观的收获,会面临巨大压力和困惑,往往会选择转组或退出半途而废,所以在这方面建议同学:

谋定而动。在确定加入研究组前做充分的调研(如阅读研究组的发表论文、维基百科科普介绍等),确认自己的研究兴趣,而不是盲目选择一个组划水几个月后才发觉没那么喜欢这个方向,浪费的是自己的宝贵学习时间。倒也不是说一旦进入某个课题组再换就一定不好,而是建议所有决定都是深思熟虑、谋定而动的结果。当然,在进入课题组真正从事一项研究之前,的确很难那么确认自己真正喜欢,但入组前就能掌握的信息如导师研究介绍、科普文献等,功课还要做足。

经历连贯。以准备申请出国深造的同学为例,很多同学看到往年申请结果好的同学有很多论文发表,就认为发表论文多多益善,却没有看到这些论文背后真正的原因。见过很多同学要么在多个研究组(或公司)实习,同时开展不同方向上的研究,希望通过并行提升论文发表数量;要么频繁辗转于不同的研究组,寻找容易发表论文的课题。能有精力和能力这么做的,一般都是非常优秀的同学。然而,这样很容易落入一个陷阱,以为论文越多就距离国外顶级高校越近。其实这里有个前提,就是同学的研究经历、发表论文能够合在一起讲出一个动人的"优秀同学勇攀科学高峰"的故事。如果东一榔头西一棒槌,做过的几份实习或研究在主题上风马牛不相及,只能在个人陈述(PS)中做流水账式的记录,反而是大大减分。要知道,国外顶级高校的教授们希望招的是对研究充满热情、有研究潜力的同学,专注是重要的特质。短短时间里涉猎多个研究方向,很容易让教授们担心你不够专注,会不会入学后也会做段时间就跑了。总之,本科生开展科研工作时间本来就短,研究经历务必连贯,也不强求研究方向完全一致,但一定要能反映对个人研究兴趣或某个科学问题孜孜以求的探索过程。

举一反三。由于科研周期短,不可能像博士生那样可以从容地打基础,系统地考虑研究课题。因此,本科生在科研训练中,需要明确科研训练的目的是为了寻找专业兴趣、全面提升科研素质,在这个过程中,需要通过与导师、学长和同学多交流讨论,多听多想,举一反三,即使有些课题不是自己在做,也可以通过近距离观察学长、同学的科研过程,吸收经验教训,达到提升自己、提升学术品位的目的。

###个体差异

由于本科生科研训练周期短,开展研究中的个体差异体现更明显。研究生入学时都有相近的学科基础,而计算机专业本科生的个体差异相对较大,在刚入学时,有信息学竞赛经验的同学已经积累了若干年的算法编程基础,有的同学则可能尚未接触过编程,而有的同学则可能在数学或物理方面有更多的竞赛经验。此外,同学由于加入实验室的目的不同,也在投入积极性和发展诉求方面差异较大。

这些个体差异包括学习经历、学业成绩、编程基础、特长爱好,以及期待收获等方面,需要注意在科研经历中既查缺补漏又扬长避短。例如,有丰富编程经验的同学,可以参与更偏系统实现的研究课题;数学较好的同学,则可以进行偏模型设计的研究课题;而尚不了解课题组研究方向的同学,应该认真阅读相关科普书籍与文献。总之,需要尽快在科研工作中迅速找到感觉和自信,形成正反馈,进而更加投入更快进入研究状态。

本科生在不同的研究阶段,也需要侧重不同方面能力的训练。在本科生从事第一项研究任务时,可在阅读主要文献的基础上,主要负责模型的具体设计与实现,而导师或学长主要负责选题、技术路线设计和论文撰写。当同学成功完成首项研究任务后,则可以开始在选题等方面承担更多责任,从而得到更全面的锻炼。

本科生的关键目标就是全面发展、认识自我,这也是本科生科研训练的重要目标。同学应当正视自身的特点,充分发挥特长,更快进入角色;同时,利用有限的时间和机会,开阔眼界、提升境界,有针对性地弥补自身不足。

其他建议

除了针对上述两个特点的相关建议外,还建议同学在科研训练中不忘初心,找到自己的研究兴趣。我认为,一个好的研究兴趣或科研选题,是三个因素的调和:兴趣爱好、个人特长、社会需求。个人的兴趣爱好,是自己擅长的,才有可能做得更好,这是能力基础;是社会需要的,才有可能得到及时的正反馈,这是外部基础。这个建议,对于专业方向、研究课题等选择都适用。

此外,还建议同学在科研训练中:

  • 迅速进入研究实战状态。在学习入门知识的同时,迅速从具体研究任务入手,开始研究历练;在实践中学习,学以致用,实现对领域的全景式了解。如果长期停留在阅读教材和文献的阶段,缺少正面反馈,同学在面对其他压力(如考试等)时会不自觉地放松在科研训练的投入。

  • 将科研列为高优先级事项。无数事例表明,研究成绩与投入时间和重视程度成正比。科研选题和技术路线确定了,精力投入是关键。在正式加入实验室前,慎重决定,一旦决定就应当全力以赴,划水拖拉还不如不做。

  • 坚持主动积极的态度。科研是一个长期复杂的过程,期间必然会遇到各种问题。例如,有时候课程考试压力大,科研进展不大;有时候数据出问题,实验效果一直不好,等等。无论遇到什么问题,建议一切以完成高水平研究为目标,积极主动与导师学长交流,得到他们的反馈和建议。最忌讳的是,因为进展不顺利担心导师学长的不满或批评,所以长期不报告交流情况,想着等有好结果再报告。但结果往往是,问题积少成多,反而不利于科研进展,导师学长也会因为长期得不到你的反馈而误以为你缺少投入。科研过程本身充满挫折,这些挫折正是需要导师、学长和同学一起来应对、讨论和解决的。

导师指导本科生科研训练的建议

我自博士生就开始尝试指导本科生科研工作,至今已经有五六年时间,明显感觉到有越来越多的本科生,特别是更低年级的本科生主动加入到实验室来。从客观上来讲,优秀本科生已经成为实验室开展研究工作的重要生力军。

很多本科生通过实验室科研训练全面锻炼自身能力,有的荣获包括清华特等奖学金在内的各类奖励,也有很多成功申请到美国顶级高校留学。而对很多研究生招生数量严重受限的高校,特别是其中的青年教师而言,指导本科生也成为一条科研创新的蹊径。正由于这同时契合了本科生和高校教师的发展目标,本科生从事科研工作蔚然成风,这也符合我国建设世界一流大学和计算机学科的诉求。

本科生从事科研创新工作,是高校因材施教的重要方面,属于拔尖教育而非基础教育,并非本科生教育的必选动作。受到很多因素影响,并非所有同学能够成功完成研究课题甚至发表论文,本无须强求。但为了增加科研成功率,导师需要在识人断事上下足功夫,能够慧眼识材,并根据“璞玉”的特点,有针对性设计选题和指导,进行“打磨”。导师需要在课题和方法选择上量身定制,并巧妙鼓励同学在这个过程中努力投入、积累知识并坚持不懈,最终达成研究目标。这对本科生导师的指导工作提出了特殊要求:

导师要在科研指导的同时,关系同学的学习和生活状态,注意鼓励同学的科研积极性。具体措施可以包括,在实验室为同学安排固定的位置,在群发邮件等场合将本科生同学视为研究组一员,增进实验室同学间交流,让本科生同学在实验室中更有归属感。

同学功利性的发展目标是不成熟的表现,这正需要导师给予及时正确的指导和引导。导师既要晓之以利,通过发表高水平论文等短期目标激励同学坚持不懈,努力投入,还要晓之以理,引导同学树立高远的发展目标和志趣,将近期的发展目标与长期的人生规划有机衔接起来,积蓄更为持久的科研创新激情。

导师还要在研究选题、技术路线、基础知识等方面提供更为细致而系统的指导,这里可以充分发挥实验室高年级研究生的作用,协同进行本科生的科研工作培养,例如专门建立学习小组系统学习相关领域知识,等等。

登录查看更多
16

相关内容

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议,会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
145+阅读 · 2020年6月15日
【新书】图神经网络导论,清华大学刘知远老师著作
专知会员服务
361+阅读 · 2020年6月12日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
NLP研究入门之道:NLP推荐书目
AINLP
8+阅读 · 2019年5月26日
国内第一部AI本科教育体系书籍出版!周志华等人著
大数据技术
29+阅读 · 2019年5月15日
【教程】如何从零开始构建深度学习项目?
七月在线实验室
7+阅读 · 2018年4月23日
Python 如何快速入门?
全球人工智能
6+阅读 · 2018年3月15日
NLP选题:6大研究方向助你开启科研之路
论智
4+阅读 · 2018年3月6日
实践入门NLP:基于深度学习的自然语言处理
AI研习社
10+阅读 · 2018年1月22日
中科院自动化所一线青年教师,带你从0到1入门计算机视觉
机器学习算法与Python学习
17+阅读 · 2017年9月18日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Arxiv
6+阅读 · 2019年8月22日
Arxiv
8+阅读 · 2019年3月21日
VIP会员
相关资讯
NLP研究入门之道:NLP推荐书目
AINLP
8+阅读 · 2019年5月26日
国内第一部AI本科教育体系书籍出版!周志华等人著
大数据技术
29+阅读 · 2019年5月15日
【教程】如何从零开始构建深度学习项目?
七月在线实验室
7+阅读 · 2018年4月23日
Python 如何快速入门?
全球人工智能
6+阅读 · 2018年3月15日
NLP选题:6大研究方向助你开启科研之路
论智
4+阅读 · 2018年3月6日
实践入门NLP:基于深度学习的自然语言处理
AI研习社
10+阅读 · 2018年1月22日
中科院自动化所一线青年教师,带你从0到1入门计算机视觉
机器学习算法与Python学习
17+阅读 · 2017年9月18日
Top
微信扫码咨询专知VIP会员