重读十年经典论文，我在b站竟磕起“大神”李沐的深度学习“系列剧”

会员服务 ·

重读十年经典论文，我在b站竟磕起“大神”李沐的深度学习“系列剧”

2021 年 10 月 26 日 极市平台

↑ 点击蓝字关注极市平台

作者丨吴彤

来源丨AI科技评论

编辑丨极市平台

极市导读

每周两更！李沐老师已在GitHub 开源了《深度学习论文精读》，挑选了近10 年来深度学习必须文章，知乎B站油管同步视频讲解！ >>加入极市CV技术交流群，走在计算机视觉的最前沿

深度学习应该看哪些文章？大神李沐甩出了一份《深度学习论文精读》宝典，给大家抄作业啦！

目前精读文章已在 GitHub 开源，速览！

GitHub地址：github.com/mli/paper-reading

个人主页：https://github.com/mli

从本月初做论文推荐和精读以来，现已上传5条视频，已经逐段式逐句式精读了2篇论文。话不多说，趁着还能上车，赶紧追呀！！！

每次精析近60分钟，时长感人！从发布时间来看，老师你为啥总是周四周五上传视频？莫非我已经掌握了你的输出节奏！新一期的视频预计在3天后，前排蹲起！

从李老师已经推荐的论文来看，开头就是两篇重头戏---

深度学习奠基作之一：AlexNet

9年后重读，原来AlexNet的报告也被大佬们喷过？

AlexNet论文中有多少观点现在看都不对？

撑起计算机视觉半边天的：ResNet

为什么网络越深，效果越差？

残差连接在做什么？

从当下最热火的深度学习问题入手，再重读经典深度学习论文，经典还能回应时代之声吗？

李老师不仅从专业角度“亮剑式”解析论文，还光明正大领着大家吃起了瓜！原来大佬的的论文也被喷过！

看李老师做过的视频讲解，真真是读书“破”万卷！

怎么老师您的笔法越邪魅狂狷，我心越踏实！这样的论文结构解析和技术分析，一眼就能把论文读“薄”！

在开篇之作如何读论文中，沐神总结了读论文的一种套路：

论文结构通常分为六个部分，要按照“读三遍”的方法快速掌握论文的精华。

1.title

2.abstract

3.introduction

4.method

5.experiments

6.conclusion

第一遍：标题、摘要、结论。可以看一看方法和实验部分重要的图和表。花费十几分钟时间了解到论文是否适合你的研究方向。

第二遍：确定论文值得读之后，快速把整篇论文过一遍。不需要知道所有的细节，但需要了解重要的图和表，知道每一个部分在干什么，圈出相关文献。如果觉得文章太难，可以读引用的文献。

第三遍：重点读论文提出了什么问题，用到了什么解决方法，实验是怎么做的。

在读方法的部分中，思考自己如何完成作者所提出的问题，用什么方法实现；

在读实验的部分时，思考自己能不能比作者做得更好；能用什么方法优化。

在沐神的接下来的论文精读中，同样是按照这种方法指导大家拆分论文，懂得如何读论文是科研入门的第一步。

当然我们从李老师的GitHub 主页中发现，他在15个小时之前已经悄悄更新了下一期目录：

Transformer：新的大一统架构？

图神经网络的可视化介绍。

这样勤奋的老师谁能不爱！难怪大家对沐神的评价是：不用催更反而督促粉丝跟上节奏的神奇up主！

李老师官方透露：

录一篇文章的时间大概是5个小时（拍摄、剪辑、上传），一般是每天深夜找半个小时或者一个小时做一点。如果没有其他更紧要的事情的话，10天左右可以出一篇。如果大家热情的话，可以多赶一赶！

考虑在之后视频中将要介绍的论文，选取的原则是10年内深度学习里有影响力文章（必读文章），或者近期比较有意思的文章。当然这十年里重要的工作太多了，不可能每篇都过。在选取的时候会偏向一些之前直播课中没讲到过的。欢迎大家在讨论区里提供（点）建议（歌）。

现在的候选论文已经列出，将持续更新（数字不代表讲析顺序）。

Adam：深度学习里最常用的优化算法之一。

链接：https://arxiv.org/abs/1412.6980

EfficientNet：通过架构搜索得到的CNN，现在常被使用。

链接：https://arxiv.org/abs/1905.11946

BERT：让深度学习在NLP上热度超过了CV。

链接：https://arxiv.org/abs/1810.04805

GPT3：朝着zero-shot learning迈了一大步，当然也得讲一讲GPT/GPT-2

链接：https://arxiv.org/abs/2005.14165

GAN。生成类模型中的开创性工作。

链接：https://arxiv.org/abs/1406.2661

CLIP。图片分类从此不用标数据。

链接：https://openai.com/blog/clip/

Non-deep networks：21年10月的新工作，非深度网络也能在ImageNet刷到SOTA。

链接：https://arxiv.org/pdf/2110.07641.pdf

为什么超大的模型泛化性好

链接：https://cacm.acm.org/magazines/2021/3/250713-understanding-deep-learning-still-requires-rethinking-generalization/fulltext

GNN 介绍： Distill上最近一篇写得很好的介绍性文章。

链接：https://distill.pub/2021/gnn-intro/

AlphaGo：让强化学习出圈的一系列工作。

链接：https://deepmind.com/research/case-studies/alphago-the-story-so-far

十篇论文已经安排好，意味着至少有两个半的时间，李老师将和我们一起云学习！

从李老师敲定的论文来看，篇篇都有讨论价值。

因此有网友表示：重读论文很有必要，技术需要时间验证。

至于一部经典作品是什么作品，哪怕它与时代的旋律格格不入，它也至少成为一种时代的背景噪音。

回顾李老师自己的生命历程，"大神"，是很多人对李沐的印象。作为一经推出便大受追捧的 MXNet 深度学习框架的主要贡献者之一，李沐功不可没。

以倒叙时间线来看，李沐目前为止的职业和学习生涯大致是这样的：

亚马逊首席科学家，2017 年 3 月至今

百度首席架构师，2014.4-2015.12

CMU 读博士，2012-2017

Google Research 实习生，2013 年夏

百度高级研究员, 2011.4 - 2012.8

香港科技大学研究助理，2009 - 2010

微软亚洲研究院实习，2007 年夏

上交 ACM 班

但是再看李沐近来的感悟，他更像是一位用理性审视生命历程的“有心人”，最近提出用随机梯度下降来优化人生的箴言：多向四处看看，每一步的方向都是你对世界的认识。

随机梯度下降的第一个词是随机，就是你需要四处走走，看过很多地方，做些错误的决定，这样你可以在前期迈过一些不是很好的舒适区。

重读论文大抵如此。优秀的经典论文就是要敢于直面权威的审视，也要在时间的流动中经久不衰。提到这十年以来的论文，李老师也谈到文中部分观点的失效，但能再从中锤炼出什么，从字缝里翻出什么细节，从段落中抖搂出什么字碴儿，正是重读经典的意义。

如果觉得有用，就请分享到朋友圈吧！

△点击卡片关注极市平台，获取最新CV干货

公众号后台回复“CVPR21检测”获取CVPR2021目标检测论文下载～

极市干货

神经网络：视觉神经网络模型优秀开源工作：timm库使用方法和最新代码解读

技术综述：综述：神经网络中 Normalization 的发展历程｜ CNN轻量化模型及其设计原则综述

算法技巧（trick）： 8点PyTorch提速技巧汇总｜图像分类算法优化技巧

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

登录查看更多

相关内容

论文

关注 165

论文（Paper）是专知网站核心资料文档，包括全球顶级期刊、顶级会议论文，及全球顶尖高校博士硕士学位论文。重点关注中国计算机学会推荐的国际学术会议和期刊，CCF-A、B、C三类。通过人机协作方式，汇编、挖掘后呈现于专知网站。

【Pytorch官方书】PyTorch 深度学习, 三部分15章节，522页pdf, 必备宝典, 通俗易懂

专知会员服务

211+阅读 · 2022年1月12日

【经典书】深度学习信息瓶颈理论，135页pdf

专知会员服务

98+阅读 · 2021年8月13日

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

专知会员服务

156+阅读 · 2021年4月4日

【经典】吴恩达《机器学习落地应用指南》，30页ppt 26/64

专知会员服务

44+阅读 · 2020年7月25日

如何持续深度学习？看这份《DNN2GP: 从深度神经网络到高斯过程》45页ppt和论文提供新思路

专知会员服务

57+阅读 · 2020年5月15日

普林斯顿大学陈丹琦主讲2020课程《深度学习自然语言处理》课程，21讲带你学习NLP最新技术

专知会员服务

154+阅读 · 2020年3月29日

【经典】论文是怎样炼成的，108页PPT教你研究生毕业通关秘籍

专知会员服务

138+阅读 · 2020年3月21日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

184+阅读 · 2020年3月16日

【经典重顾】如何学会读论文？三轮阅读法，滑铁卢大学S. Keshav

专知会员服务

83+阅读 · 2019年12月28日

周志华教授：如何做研究与写论文？

专知会员服务

161+阅读 · 2019年10月9日

投了3遍都被毙的论文，终于中了

图与推荐

0+阅读 · 2022年3月16日

干货｜李沐：如何快速阅读和整理文献的技巧

极市平台

3+阅读 · 2022年2月11日

用沐神的方法阅读PyTorch FX论文

极市平台

0+阅读 · 2021年12月27日

如何有效并快速地阅读一篇AI论文？

学术头条

3+阅读 · 2021年12月26日

覆盖近2亿篇论文还免费！沈向洋旗下团队「读论文神器」登B站热搜

新智元

0+阅读 · 2021年11月25日

AI大神李沐B站走红！连博导们都在追更，还亲自带你逐段读懂论文，网友：带B站研究生吧

量子位

3+阅读 · 2021年10月29日

GitHub超1.1万星：李沐经典作品《动手学深度学习》更新强互动

新智元

14+阅读 · 2019年9月18日

Papers With Code：一文看尽深度学习这半年

极市平台

61+阅读 · 2018年12月3日

深度学习之路——论文阅读

专知

11+阅读 · 2018年9月29日

阅读深度学习论文的新姿势

计算机视觉life

16+阅读 · 2018年7月22日

经典-量子协同计算：形式化模型、计算复杂性与模型检测

国家自然科学基金

1+阅读 · 2014年12月31日

前馈神经网络容错学习算法的设计与确定型收敛性研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩矩阵恢复理论与算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于压缩感知的鲁棒视频运动检测和跟踪技术的研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于结构化集学习的视频稀疏编码理论与技术

国家自然科学基金

0+阅读 · 2012年12月31日

量子算法和基于测量的量子计算的研究

国家自然科学基金

0+阅读 · 2012年12月31日

单孔腔内微型机器人外科手术系统优化设计与控制技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

与结构动特性协同的自适应直接积分算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于多模态分析方法的脑机接口运动想象盲神经机制研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于学习的视频关注计算及其在互动视频技术中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

Generative or Contrastive? Phrase Reconstruction for Better Sentence Representation Learning

Arxiv

0+阅读 · 2022年4月20日

Sketch guided and progressive growing GAN for realistic and editable ultrasound image synthesis

Arxiv

0+阅读 · 2022年4月19日

Monte Carlo Tree Search for Interpreting Stress in Natural Language

Arxiv

0+阅读 · 2022年4月17日

On Reporting Performance and Accuracy Bugs for Deep Learning Frameworks: An Exploratory Study from GitHub

Arxiv

0+阅读 · 2022年4月17日

Alternating Channel Estimation and Prediction for Cell-Free mMIMO with Channel Aging: A Deep Learning Based Scheme

Arxiv

0+阅读 · 2022年4月16日

How Different are Pre-trained Transformers for Text Ranking?

Arxiv

0+阅读 · 2022年4月5日

A Comprehensive Survey and Performance Analysis of Activation Functions in Deep Learning

Arxiv

23+阅读 · 2021年9月29日

Sequence Level Contrastive Learning for Text Summarization

Arxiv

14+阅读 · 2021年9月24日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

VIP会员