微博大V@爱可可：arXiv论文怎么读？

会员服务 ·

微博大V@爱可可：arXiv论文怎么读？

2018 年 4 月 26 日 人工智能头条 爱可可

来源 | 爱可可爱生活（公众号ID：ai_co_co）

长话短说，先看图：

总的来说，arXiv学海无涯，泛舟有道：想清楚，巧选择，多泛读，勤总结。

其实不止arXiv，其他论文也一样，只是arXiv流量大，更需要技巧。

有人说arXiv垃圾太多，不值一读，这种说法，我深感不以为然。我在微博上曾说过——如果你爱它，就把它发到arXiv，因为那里是圣殿；如果你恨它，就把它发到arXiv，因为那里是垃圾场。

arXiv就是这么个鱼龙混杂，让人又爱又恨的地方。

平心而论，arXiv上高素质的论文不在少数，且有快速上升之势，废话少说，看数据：2017年，理论计算机科学与机器学习领域，超过60％的发表论文都有arXiv电子版。且不说arXiv还有最美的两点：快 & 多。“快”自不必细表，第一时间洞悉实力团队最新方向/成果，零延时跟踪最新问题/技术前沿，arXiv是个太理想的地方，期刊、会议绝无胜算；“多”怎么也成了优点？因为多，所以杂，统计上才能更有效代表整体趋势——占坑也好，废稿也罢，良莠不齐，总量庞大，一分析，哪有路、哪是坑、哪深哪浅自然清清楚楚——噪声不可怕，因为噪声，才真实，分布才有连续性，才可信。说arXiv全是垃圾的，八成是没深入研究、懒得淘金的人。怎么读？光靠勤奋还不够，得讲方法，讲策略。

▌第一步，想清楚

想什么？想定位，想目标，想方法。

为啥而看？跟踪前沿？找问题？找方法？膜拜？探坑？找人？找撕？学写作？凑谈资？打发时间？定位清楚了，题材范围自然清晰，不了解自己，只能“通吃”，结果往往是“消化不良”。

不管什么定位，有一点很重要：抱着学习的心态去读，收获往往更多。挑剔不会让你显得更有水平，取其精华，取长补短，才是成长正道。

前阵子Kyunghyun Cho在关于博士生为学之道的访谈里提到了“过度阅读”：

Excessive reading can create additional boundaries, holding a researcher away from trying out new ideas

说的是“过度阅读”有反作用，像“砌墙”，会妨碍你尝试新想法。解决方法很简单——摆正心态，就无所谓“过度”：读论文读的不是边界，是思考，是启迪，读完该做什么坚持去做：

Pursue your direction, try yourself, no matter if someone was successful or not in this direction so far.

读论文的同时也不要忽略读书——打好基础很重要，尤其是论文作者认为“大家都懂”的“常识性”知识。基础好才有“根”，新来的知识和思考才有关联和生长的“干”，终能长成一棵健康茂密的参天之“树”。

▌第二步，巧选择

读arXiv，选择很关键，选对了，就成功了一半。

简言之，选择看三点：形、神、从。

形：看的是论文的表象，具体包括出处、题目、文字和图表。

无疑，题目和出处是粗筛最有效的特征——题目言之有物、简短有趣、问题方法立意新颖，作者、机构耳熟能详，可迅速排除50%的论文，当然，根据具体定位，对作者、出处相对陌生的文章，不妨多一些宽容，如果标题有趣可以泛读试试，有时也会出现“惊喜”；

文字部分，一看摘要和导言，二看全文结构。摘要开门见山，重点突出，导言对问题、难点、相关工作和本文工作交代清楚、逻辑严谨，全文结构紧凑不拖沓，引用全面的论文，可优先入选；

图表部分，要求说明完整，自成一体又与文字相呼应。好的图表，应该能体现本文的思想和特色，配合文字说明，能了解论文的角度和作者的思考。

神：看的是论文的内涵，具体包括主旨、韵律和风格。

好的论文，主旨明确，角度合理，思路清晰，一条线索贯穿全文；

论文的韵律，是对内容轻重详略的编排，好的论文焦点明确，节奏得当，一眼能找到作者重点要表达的内容；

好的论文，一定不是自说自话，更像是与读者之间的对话，对于读者关心的方面和潜在的问题，都会贴心地预先作答，用主线引领读者顺畅阅读。

从：看其他读者的推荐和反馈，可从一人，也可从众。

跟随他人，恐怕是最便捷的一条选择之路，但有时可遇不可求。

跟随一个人，看的是对方的方向和品味。选择跟着谁，这是个不小的难题，就像是推荐系统做到最后，重点不在物物关联，而在找对要协同的用户。如何衡量对方是否值得“追随”呢？可以看是不是满足多、少、信三个条件。

多是指不但乐于分享，还能坚持不懈的持续分享；少是指在选读论文方面有统一的品味和态度，宁缺毋滥；信是说可信，水准稳定，不轻易“夹带私货”。如果找到一位符合以上三点的人，又恰巧和你方向相似或部分重合，那绝对是可喜可贺！我在努力寻找这样的人，也在努力做这样的人，利己，利人，希望你也一样。

从众，也许算得上是条捷径，大众关注的，必有其看点，炒作也好，批判也罢，“焦点”就是这么一种特别的东西，你不必完全“明白”，但“知道”一定有益无害。

以上所说，只是用来判断论文质量的一些粗浅“招式”，当你借助这些方法帮自己找出一定量的“好”论文，就会逐渐找到筛选论文的感觉和自信，这时候，就像习武的更高境界——“无招”胜"有招"，可以轻松给论文打个比较客观的总分了，相信这一天不会太远。

▌第三步，多泛读

终于到了读论文的时候，别激动，也别忙着深入细节，先把策略搞清楚。建议大量泛读，极少量精读，避免走读。

泛读看什么？看问题、看难点、看相关工作、看本文的角度和特色，重在拓展视野、延伸思考、充实基本面；

精读看什么？深入学习，不错过每一点细节，避免道听途说遗漏重点。只有对自己特别“有用”的论文才精读，一旦选定切勿浅尝辄止、囫囵吞枣。

打定主意，严格区分，不要在“知道”和“明白”之间徘徊，做到精力的高效优化分配。

读论文，重在思考，因联系、深化而增值的部分是最可宝贵的。多思考，多关联，加深、拓宽，为自己的知识体系添枝散叶，才是阅读的意义所在。

▌第四步，勤总结

把阅读的收获及时总结、适时回顾是个很好的习惯。学习的过程，就是不断地抽象、巩固，适当的重复不但会加强你的记忆，也会启发出一些更深入的思考。

试着多和别人分享，尤其是精读的文章。就像费曼先生说的：“要是你无法用简单朴素的语言解释清楚，说明你还没有真正理解”，讲给别人听，是检验自己是否真正读懂的有效基准。

可以听别人分享，但不要迷信，更不要当做了解新知的捷径，偷懒取巧只会得不偿失，老话说得没错：“想要知道梨的滋味，就要亲口尝一尝” 再细致的阅读分享，也不如老老实实阅读一遍原文来得实在。

扫描二维码，关注「人工智能头条」

回复“秘籍”获取 吴恩达机器学习训练秘籍前19章英文版

登录查看更多

相关内容

arXiv

关注 0

arXiv（X依希腊文的χ发音，读音如英语的archive）是一个收集物理学、数学、计算机科学与生物学的论文预印本的网站，始于1991年8月14日。截至2008年10月，arXiv.org已收集超过50万篇预印本；至2014年底，藏量达到1百万篇。在2014年时，约以每月8000篇的速度增加。

如何写论文？这份《科研论文撰写策略》看下

专知会员服务

148+阅读 · 2020年6月15日

30篇「CVPR2020」高赞论文抢先看！看计算机视觉2020在研究什么？

专知会员服务

50+阅读 · 2020年2月28日

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【强化学习论文推荐集合】2019年必读的10篇TOP强化学习论文，My Top 10 Deep RL Papers of 2019

专知会员服务

42+阅读 · 2020年1月15日

谷歌机器学习速成课程中文版pdf

专知会员服务

147+阅读 · 2019年12月4日

CVPR2019接收结果公布了，但CVPR 2018的那些论文都怎么样了？

MomentaAI

20+阅读 · 2019年3月22日

大神一年100篇论文

CreateAMind

15+阅读 · 2018年12月31日

阅读深度学习论文的新姿势

计算机视觉life

16+阅读 · 2018年7月22日

论文 | 15篇近期值得读的AI论文

黑龙江大学自然语言处理实验室

16+阅读 · 2018年2月12日

Netflix 官方技术博客：个性化分发与推荐，走在前列的 Netflix 是怎么做的？

人工智能学家

6+阅读 · 2017年12月25日

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Arxiv

11+阅读 · 2019年9月23日

How Does BERT Answer Questions? A Layer-Wise Analysis of Transformer Representations

Arxiv

4+阅读 · 2019年9月11日

OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge

Arxiv

10+阅读 · 2019年9月4日

BERTScore: Evaluating Text Generation with BERT

Arxiv

5+阅读 · 2019年4月21日

Twitter Sentiment Analysis

Arxiv

5+阅读 · 2015年9月14日

VIP会员