【专知独家干货】-《科研写作之读论文》的一些心得体会

2017 年 9 月 20 日 专知钱胜胜

今天特别给大家分享下来自我们专知团队成员-钱胜胜博士最近在2017年中国多媒体大会上作的《撰写论文的一些心得体会》的报告。钱胜胜博士是中国科学院自动化研究所模式识别国家重点实验室助理研究员，曾获得多媒体顶级会议ACM Multimedia 2016最佳论文奖，中科院优秀毕业生，主要研究方向为网络多媒体数据分析。下面是他详细分享的报告。希望对科研入门的学生有所帮助。

大家好，很高兴来和大家分享博士期间读论文的一些心得体会，主要针对新入实验室或者刚进入科研领域的学生。（很多是和实验室老师，师兄们一起讨论交流的想法，以及网上的一些参考资料，在文末都有引用，大家也可以借鉴参考！）

在这引用刘成林老师PPT里的一句话：“科研和写论文没有固定的规则，谨以此与大家交流探讨”！在开始之前，我想一些老师和同学一开始进入实验室，进入科研领域的时候，都会有一些或多或少的困惑，比如说，如何读懂国际会议论文，如何选择好的科研方向来做，等等。也包括我刚开始进入实验室，也会遇到这些问题。也记得那时候我也不太懂，也非常感谢指导我的徐老师和张老师教我一些读论文理解论文的方法。我今天主要是针对刚进入实验室、科研领域的同学，说一下一些自己的想法，希望对大家有所启发。

一般的话，论文写作可以分为这几个部分，读论文，然后是如何进行实验，如何写论文，如何改论文，这四个方面。这几个方面其实没有固定的时间周期和顺序，看个人自己的实际安排。今天我们重点讲述关于读论文这部分分享一下我自己的一些心得体会。

一、读论文

在读论文的过程中，我们可以分解成这四个部分，

一开始需要选择一个合适的科研领域，然后查找关于这个领域相关的文献，接着仔细读这些文献了解当前最新的研究进展，最后产生一些靠谱的想法。

1、选题

在论文选题过程中，大概会有这几个因素，比如实验室老师指定某个科研领域让学生来完成。

第二个是环境因素，比如你是学术型的研究生会有文章要求，专业型研究生会有工程项目的要求。

第三个就是你自身对什么比较感兴趣，但是需要和老师沟通之后，可以进行这一块的探索。

在选题过程中，大家需要有一些自己的思考，需要想一想为什么要做这个课题，它的意义是什么，现有的理论方法有哪些不足，或者技术有哪些需要改进等等。

在实际情况中，很多学生都是实验室老师指定的课题，这个相对是比较靠谱的，毕竟老师在这个领域都比较资深了，给定一个研究题目和一些资料，或要求你做某某问题，这至少给了主要范围和认知点，等于已经把科学问题告诉你了，接下来要做的事情就是要你具体去做，做什么。

总结起来，在学生的选题中，一般的科研课题有纵向课题、横向课题和自选课题，这三部分，

在纵向课题中，选题主要是围绕着国家自然基金、省市基金等课题中某关键点重点展开和深化，进行课题的切入点。

在横向课题中，表面看起来是一个工程应用的问题，我们需要提取其中存在的疑难或未解决的方法等，升华为理论方法及实验研究。

在自选课题中，可以从学术探讨、交叉学科、工程实践中选择自己感兴趣的课题。

2、找论文

选择哪块研究方向之后，接下来就是需要仔细对这个领域进行文献调研，如何查找相关论文。

在查找文献这部分，其实目的是为了在短时间了解本领域国内外最新的研究进展，借鉴前人的经验。

在时间安排上，可以从近几年向前查阅，了解这个领域的深度和广度。

在方法上，我觉得可以先看看一些综述性的文章，然后在阅读比较技术性的文章。

在种类上，着重找领域内好的期刊，和会议资料。

特别是计算机领域日新月异，发展比较快，建议最好先查找顶级会议的论文。

a)、IEEE、ACM、arxiv相关数据库，第一个肯定建议大家去IEEE 和 ACM 相关数据库查找，以及 arxiv上也有最新的一些文章信息。

b)、名人微博、微信，另外一个途径是建议大家多关注名人的微博微信，比如比较活跃的好东西传送门，爱可可和王威廉等这些人士，他们每天都会有新的前沿技术和论文分享。

c)、推荐使用我们的产品——专知，下面一个也顺便介绍一下，这是我们实验室团队做的一个产品，叫专知，专注于人工智能的信息聚合以及链路化展示。专知网址：www.zhuanzhi.ai，或者最下角点击阅读原文访问。

在这个产品上，我们把最新关于人工智能，深度学习，计算机视觉等等相关的最新资讯都自动搜集整理好了，大家可以非常方便快速查看自己感兴趣的研究方向，通过www.zhuanzhi.ai 访问定制使用。

d)、下面就是一些人工智能领域顶级会议

这是我罗列的和我们比较相关的顶级会议列表，比如计算机视觉领域三大顶级会议CVPR、ICCV、ECCV， ACM MM多媒体会议，以及数据挖掘KDD、WWW等相关好的会议，大家可以从这些好的会议上去找和自己相关的文章。

e)、另外一个比较好的是关注这个领域的名人的个人主页

名人的主页会有他们最新的文章以及相关进展情况，你能够很快的知道大牛在做什么，如果有和自己相关的，那对自己的工作会有很多启发。

f)、DBLP数据库

这个是一个计算机领域内以作者为核心的数据库系统，比如如果大牛有些论文信息没有展示在个人主页，你可以到dblp 上进行搜索，会得到他发表所有论文的相关信息。

3、精读论文

我们在找到相关论文之后，接下来就是如何读论文，理解论文了。

在读论文中，我们的目的是了解这个科研领域的发展脉络以及最新的相关方法，发现一些问题难点，产生一些不错的想法。有些文章比较经典，可以记录一些好的句子和结构。那么如何读这些论文呢。一开始刚进入实验室的时候建议大多数文章看摘要就行了，主要是搞清这个领域的一些基本概念，然后选择重要的几篇论文精度，细读。

具体而言，可以分为这五个步骤（参考其他人写的内容总结而成）：

由点到面，选项目工作实践中的疑点，热点，由一个小枝节，检索较全的文献，一般近期的20篇左右已经相当多了。学习别人是怎么发现解决问题的。知道目前对这个科研问题的共同看法和分歧。然后，扩展开，根据研究的目的，知道在这个研究的领域：谁的文章被引用的次数多，谁的文章最多最新最有启发性。去找他的文章仔细看看。逐步扩展自己的视野，构建个人的专业知识结构和看法。
由杂到精，有了一定的知识基础以后，对于繁杂的文献，要有个人的判断。追踪某个专题、某个专家的研究进展，比较对于同一专题的论点的发展，掌握其新的方法或新结论，或注意作者观点的改变，探究其原因。培养个人的学术修养。对于高质量高水平的期刊，定期浏览，从面上了解学术进展和热点，根据个人的兴趣和工作进展，逐篇仔细阅读新作。
有所感悟，对于初次进入一个领域的新手，必须阅读大量的文献，才能把握本领域的动态和方向。带着想法读论文，对比当前论文和之前的有什么区别，优缺点（特别是缺点）是什么，用什么方法弥补该缺点等，反复思考，力图有所感悟。
归纳总结，俗话说好记性不如烂笔头。对于需要精读或略读的论文分类归纳，便于以后查找。对于阅读过程中遇到的疑点、思想的火花，精妙的句子等，及时记录总结。
第五点就是养成习惯很重要。记得一个学生说过，导师让他学生读大量的文献，而且每天都规定了数量，好像是100篇吧？由于刚刚接触这一领域，对许多问题还没有什么概念，读起来十分吃力，许多内容也读不懂。请教导师，却被告知只要每天把数量读够就行了。后来随着阅读量的增加，终于最后融汇贯通，也理解了导师的方法。所以，我觉得对新手而言，应当重视阅读文献的数量，积累多了，自然就由量变发展为质变了。

强调一下，我们总结一下哈，在读论文的时候，最重要的是要总结概括这篇文献到底说了什么！每次读完文献，不管是细读还是粗读, 合上文献后,想想看,文章最重要的是什么。如果不知道的话，那就需要从文章的摘要结论上找，并且从其他部分来确认一下，知道这篇文章的关键点是什么。其实一篇文章最核心的点不会很多，如果你发现你需要记得很多，那往往是没有读到重点。（在这里需要感谢一下指导我如何读论文的张天柱老师，深刻地记得张老师的一句话，“一定要弄懂不同模型和方法的本质，经常要问为什么这个有效果，是什么原因”）

4、产生Idea

最后读论文的终极目标就是能够产生一些想法。

在我们读了这么多论文之后，目的很明确了，就是想产生一些想法。

在这个里面，我大概总结了以下几个点。比如可以自我总结关联相关的论文的方法看看有没有某一个点可以做。与身边老师和同学交流讨论等，拓宽自己的视野。（一定要抱紧实验室师兄师姐的大腿，紧紧跟随指导你老师的给你的方向）对于一些经典的问题，使用最新的方法尝试一下。另外一个是提出一些新的问题，用已有的方法来解决。领域课题的方法交叉，迁移使用等等。

在这举一个例子，比如计算机视觉领域很多经典的问题，图像识别，目标跟踪等。这是指导我的张天柱老师，他研究的主要是目标跟踪这个经典问题，

他的很多工作都是在已有的基础上进行改进。而我们或者一个新同学如果进入这个领域的话，需要对这个老问题进行详细的文献调研。

比如，这是实验室老师对目标跟踪的发展一个小的总结。（感谢实验室张天柱老师和高君宇提供的PPT）传统的稀疏表示可以进行遮挡建模，但其效果差、速度慢。

基于分类的跟踪方法具有较强的判别力，逐渐提高了效果。随后，近几年基于相关滤波的方法涌现，在速度和精度上都有很大的提升。

深度学习方法的出现使得目标跟踪的效果上了一个新的台阶，但深度学习方法在速度上还有不足。综上所述，在当前目标跟踪的发展中，基于深度学习和相关滤波的方法占统治地位。我们需要结合深度学习与相关滤波的优势来进行相关工作。因此，之后如果一个新手进入目标跟踪这个经典领域的话，我们就着重选择这两部分的方法进行改进，提出一些新的方法来进行。

另一个是领域课题的方法交叉，迁移使用。这部分就是需要借鉴不同领域的一些方法，看看能不能解决本领域的问题。比如13年 word2vector 的出现以及 skip-gram 的机制来得到词的向量表示。然后14年有作者把这种方法用于网络节点表示这个领域，通过随机游走的方式在网络节点构建的图上产生顺序的词，然后使用skip-gram的机制来得到每一个节点的表示，效果很不错。因此，也建议大家多看看不同领域的经典文章经典方法，可能会对自己的领域有很大的启发。