经典论文解读:Google三驾马车到底说了什么?| 极客时间

2022 年 6 月 2 日 AI前线

不知道大家在工作中,有没有遇到过这类程序员:他们无论在什么岗位,开发什么系统,好像都能够抓到问题的本质,做得「游刃有余」。

我也经常碰到这类程序员,每次我向他们请教究竟是如何做到的,他们给出的答案都少不了这一个:读经典论文

确实,关于学习和处理问题的方式,他们和很多普通码农不太一样。

比如,在面对一个异常复杂的系统时,我们不可避免会遇到一些问题,但大部分人的解决方式很简单:去群里问别人有没有可靠的解决方案,或是在技术社区搜索答案。

但很少人会想到看论文,去挖整个系统的「来龙去脉」。

这也能理解,毕竟说到读论文,就是一个字:

  • 一是原版论文都是英文,理解起来太费劲;

  • 二是学习资料良莠不齐,很难靠自己梳理出一条清晰的学习路径,去深入了解并建立数据系统的底层知识体系。但要想成为真正的优秀工程师,把技术研究精深,我认为「读经典论文」是必不可少的,也是最快的学习方式。

因为最核心的东西,就在其中,一旦看懂,就可以 「触类旁通」,从使用到开发,很多细节通过脑补就可以猜个八九不离十。

而且,在如今的互联网时代,到处可见「分布式系统」,尤其是「大数据」时代到来之后,各种优秀的分布式系统层出不穷,但它们实现的本质,都源于那几篇经典的研究和论文。

其中对分布式系统工程实践领域,贡献最大的公司是 Google,Google 的基础设施有三驾马车,分别是《Google File System》、《Google MapReduce》以及《Google BigTable》。

Google 发表了这三篇论文以后,基本上「奠定」了业界大规模分布式存储系统的理论基础。

现如今非常流行的 HDFS、MapReduce、Hbase,以及国产数据库软件 TiDB、OceanBase 都是参考这几篇经典论文设计的,可见这些基础原理的重要性。

会用某个开源框架,是懂了「基础招式」。看开源框架的源码,是「武功秘籍」,能让你更高效地 debug。那研读论文,就是真正的「内功心法」。

武功招式可能每年都在更新迭代,但内功心法却不仅只在今时今日有用,更能让你一辈子受益。

我也能理解,在大部分程序员的工作中,都忙着实现业务功能。90% 的工作是重复的逻辑堆砌,10% 涉及到底层、架构或核心算法的东西,而实际上,正是这 10%,决定了你和顶级程序员的差距。

那么,读经典论文有什么好的方法吗?

网上这类的资料其实并不多,最近看到极客时间专门做了个专栏 《大数据经典论文解读》,我第一时间买来看了看,看目录发现内容太全了,基本覆盖了读论文的痛点问题。

这个专栏的作者是 「徐文浩」,简单介绍下,他是 bothub.ai 创始人,一个创业的程序员,正在工业界的实战经验非常丰富。写过各种大型企业软件,从零开始搭建支撑每天百亿流量的广告算法系统,提升了十倍以上的广告收入和 ROI。

可能更出名的,是他的另一个爆款专栏《深入浅出计算机组成原理》,我 2 刷过了。只能说「太会讲了」,把底层知识讲得清晰透彻,还吸引着读者深挖下去,功力可见一斑。目前有超过 6W 人订阅,也是出于对他的认可,所以上线时,毫不犹豫就买了他的新课,目前这个课也有超过 8000 人学习了。

这个论文解读课,总结来说,就是让你从经典论文入手,提升问题解决能力。

专栏精进了 10 余篇程序员必读的经典论文,给出一条大数据系统底层知识学习路径,还有工业级数据系统迭代方案。你不仅获得一些大数据的知识,更能从系统架构、计算机底层原理层面,获得深入而长久的成长。

我一直认为,学习是自我驱动,要学会自己「找食物」,而不是「等着喂」。现在我把很靠谱的老师和学习方法,推荐给你,剩下的就看你自己了。   

👆扫码免费试读

今日立省 ¥40,到手仅 ¥89

除了老师是工业界大牛这个点外,专栏还有其他几个比较吸引我的地方:

1、超 10 篇必读经典论文精讲

从最经典的 Google 三驾马车:GFS、MapReduce 和 Bigtable 这三篇「经典论文」开始讲起,帮你理解大数据系统面对的主要挑战,以及应对这些挑战的架构设计方法

进一步地,带你一起来看大数据系统依赖的分布式锁 Chubby、序列化和 RPC 方案 Thrift,让你能够将架构设计和计算机底层原理结合到一起,掌握好计算机科学的底层原理。   

2、简化大数据论文的脉络关系

前面我也提到过,我们面对的是异常复杂的系统,而徐文浩帮大家简化过了大数据论文「脉络关系」,让你在对某一篇论文感到困惑的时候,可以通过脉络图翻看它前后对应的论文,找到对应问题的来龙去脉,让你在研读大数据论文的时候,有一个清晰的方向。   

3、剖析论文核心思想

专栏一共 36 讲,手把手带你剖析论文「核心思想」,带大家深入体会「大型系统」瓶颈的完善过程,并 给你真实、具体且独到的高手思路和经验观点。最终让大家能够得到的衍生性启发,「举一反三」的思路开拓,从而在平时工作中应用、改进和创新。

专栏上线以来,口碑一直不错,而且文章中没有理解透彻的问题,都会在评论区得到徐文浩的回复。可以说帮到不少人,截了些评价供你参考,从留言字数,就能看出来,相当走心了。

说了这么多,来看目录,我相信它会成为一个经典专栏。 

最后再和大家强调一下:   

👆扫码免费试读

今日立省 ¥40,到手仅 ¥89

最后,我想和你分享一句话:认真研读「经典论文」,是每一个优秀工程师的成年礼,希望你不要错过这次机会,一起共勉。

点击【阅读原文】👇,现在就提升问题的解决能力。

登录查看更多
0

相关内容

吴恩达知乎问答:如何系统学习机器学习?
专知会员服务
20+阅读 · 2022年4月10日
2021->2022必看的十篇「深度学习领域综述」论文
专知会员服务
112+阅读 · 2022年1月1日
周志华教授:关于深度学习的一点思考
专知会员服务
121+阅读 · 2021年11月23日
专知会员服务
47+阅读 · 2021年5月21日
【经典书】自然语言标注—用于机器学习,341页pdf
专知会员服务
52+阅读 · 2021年2月12日
【2020新书】Google软件工程方法论,617页pdf
专知会员服务
79+阅读 · 2020年11月11日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
由浅入深学习 Kubernetes | 极客时间
InfoQ
0+阅读 · 2022年7月3日
2022 年技术的新趋势和新方向 | 极客时间
空降进阿里的 P10 都是什么人 | 极客时间
InfoQ
0+阅读 · 2021年12月14日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Generative Bias for Visual Question Answering
Arxiv
0+阅读 · 2022年8月2日
Arxiv
20+阅读 · 2021年9月22日
Arxiv
13+阅读 · 2021年6月14日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
15+阅读 · 2019年9月11日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
29+阅读 · 2018年4月6日
VIP会员
相关VIP内容
吴恩达知乎问答:如何系统学习机器学习?
专知会员服务
20+阅读 · 2022年4月10日
2021->2022必看的十篇「深度学习领域综述」论文
专知会员服务
112+阅读 · 2022年1月1日
周志华教授:关于深度学习的一点思考
专知会员服务
121+阅读 · 2021年11月23日
专知会员服务
47+阅读 · 2021年5月21日
【经典书】自然语言标注—用于机器学习,341页pdf
专知会员服务
52+阅读 · 2021年2月12日
【2020新书】Google软件工程方法论,617页pdf
专知会员服务
79+阅读 · 2020年11月11日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
相关基金
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
相关论文
Generative Bias for Visual Question Answering
Arxiv
0+阅读 · 2022年8月2日
Arxiv
20+阅读 · 2021年9月22日
Arxiv
13+阅读 · 2021年6月14日
Arxiv
101+阅读 · 2020年3月4日
Arxiv
15+阅读 · 2019年9月11日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
29+阅读 · 2018年4月6日
Top
微信扫码咨询专知VIP会员