如果我没有那么优秀,我研究生阶段选择机器学习方向还有出路吗?

2019 年 8 月 14 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

编辑:Amusi

https://www.zhihu.com/question/339602806

本文仅作为学术分享,如果侵权,会删文处理

如果我没有那么优秀,我研究生阶段选择机器学习方向还有出路吗?


最近看了一些机器学习大小牛的经历,本科就是顶尖985参与科研发表顶会论文,研究生就开始自己写框架(比如xgboost和mxnet,雏形都是学生时代就有想法),在健身游玩的路上就不小心解决了项目中一个难题,在飞机上构思好了框架,各种出国各种藤校各种项目。写论文已经开始不追求顶会,而是追求完美的质量(比如poster级别的就不发了)。

题主在本科阶段只是一个普通本科,周围也没有那么多大牛能够指点,靠着自学学习了深度学习和机器学习方向一些算法的推导和实践,考研有幸考入到211学校,了解了一下导师大概是搞机器学习方向的博导,但是每次想起大牛们在研究生阶段谈笑风生间优化框架底层算法,感觉差距很遥远,内心一种无力感。

请问我选择在研究生阶段学习机器学习,会有好点的出路吗?我现在应该怎么做才可能弥补与大神们之间的差距?每天读一篇论文?但我不知道该从哪下手,希望能获得大家的一些建议。


作者:微调
https://www.zhihu.com/question/335991165/answer/771725335


那天读了一句话,大意是人生有两个重要时刻:一是意识到自己只是普通人,二是意识到自己的孩子只是 普通人。评论区也读到两句有意思的话,大意是人生有两个重要时刻:一是发现自己不是普通人,二是发 现自己是普通人。


这些想法虽然真实,但稍微有点悲观。如果我们普通人能先破后立的话,一般也能做出一点小突破。题主 提到的“每天读两篇论文,坚持背50个英语单词,多学点公开课”,这些都似乎都对科研有一定的帮助, 但都不是问题的核心。照我的观察,很多厉害的工作不是从一开始就那么惊艳,而是慢慢雕琢而成。作为 一个普通的科研工作者,我们可以从两个维度提高: 


  • 思考的频率、广度和深度 

  • 执行力 


思考的频率指的是回溯旧问题的次数,这种习惯可以培养。比如我们学习到的新知识其实是一件件工具, 不断用学到的新工具去重新思考以前的旧问题,往往新工具就能解决旧问题。我的一个建议不如把自己遇 到的各种科研问题,不论多么不成熟都记下来在本子上,每过一阵子去翻看一遍学到的新知是否能够解决 新问题。比如没学数据结构前,你总在想为啥我实现的机器学习模型这么慢,学了以后才知道搜索近邻可 以用kd-tree,要是可并行的任务可以分解成小任务在多个core上运行。很多问题的答案其实非常朴实无华,但当你知道答案时,往往连问题都忘了,所以你总是没有好点子。因此要不断的记录,不断的回溯。随着你不断重复这个过程,思考的广度和深度都会上升。


我喜欢的是在夜跑出发前选一个主题,一边跑就一边天马行空想和这个主题相关的内容。跑完步再把内容 记录下来(我一般看情况会选择纸质笔记或者evernote,最后再整理到OneNote里)。你往往想着A主 题,就会联想到B,时间长了就会有一些靠谱的点子出来。


其次就是执行力,人最终的问题就是想太多而做太少。绝大部分学术新星一开始的点子也是老板给的,或 者一开始的工作也并非特别惊艳。但做的多了,质量总是会上升的。务实的说,有了尚可的点子就先做实 验,有了尚可的实验结果就写论文,今天发不了CVPR就先发ICIP,迭代式上升才是符合普通人的路线。如 果想要奔着搞大新闻的目标做科研,往往会卡很久很久很久...很久很久很久。但也不能总恰烂文章,必须逐 步提高对自己的要求。


最后,也是我觉得最重要的一点就是「兴趣」。恬不知耻的举一个我的例子,几周前我回答了一个关于模 型集成的问题(大部分机器学习算法具有随机性,只需多次实验求平均值即可吗?),回答后我搜索了半 天发现没有易用的工具,于是就花了两周时间做了一个初步的Python工具库出来(微调:combo:「Python机器学习模型合并工具库」简介),并打算长期开发完善它。因为这一切都是兴趣推动的,所以 才很有动力。你只有对自己的内容认可,才能做出让大家接受的内容。我做过的第一个比较受欢迎的工作 (https://github.com/yzhao062/pyod)也是相似的,才能有热情花好几年时间来完善它。你最好能找到自己觉得有意思且重 要的课题,而非是能发XXX会议的课题。只有这样你的内心才有动力,而非迷茫与功利。而这一切的前 提,也还是要有一定的思考和观察,毕竟好的点子不会从天上掉下来。而当你的工作质量上去了,得到关 注与发表到好的期刊/会议只是水到渠成而已。


回到主题,我们必须先承认自己并不在科研食物链的顶端,而且往往是处于中下游。但梁静茹也给了我们 勇气,鼓励我们去做一些至少自己感兴趣且可以感到满意的工作。想要做出这类工作,就需要不断提高自 己的思考能力和执行力。再务实一点说,从就业角度看做机器学习不一定比学软件开发性价比更高,毕竟 后者岗位多需求大不易过气。所以在投身机器学习科研前,或者任何科研领域前,不如先想想自己的目的 是啥,是为了找工作?发大财?当科学家?还是?没了解清楚前,不要给自己定一个虚无缥缈的的目标, 也不要读了大牛的成功故事就感到自惭形秽。日子是我们自己的,你被感动、被激励只是说明人家文章写 得好,和我们关系不大。你学学写作技巧后,最好赶快回到现实世界里来比较重要。不要给自己加戏,自 怨自艾、感动、受鼓舞,都大可不必,务实就好。


有天我妈问我的工作内容到底是啥?我告她就是修自行车。一个新点子就像是个骨架,初期修修补补先上 路再说,叮叮哐哐咱慢慢修它,先能骑就行。你沿路捡个轮胎,随手淘个发动机(找到了新的工具),再一改装,或许就成摩托车了。搞科研的,别看见人家有摩托车就焦虑,就眼红,就着急,其实大家都是一 路捡破烂过来的。


大家出门都是一双脚,你要啥自行车啊?



作者:香蕉树下的老中医
https://www.zhihu.com/question/335991165/answer/773125654

每次看到这种类型的问题,我都想到沐神在朋友圈说过的话。

截图如下,




虽然tianqi也是我的偶像,但是我知道这种差距是弥补不过来的。。。


(xgboost就不说了),不管是从mxnet(早期cxxnet)还是到现在的tvm。你会发现,这些流弊的人思考问题的方式和执行能力(据说tianqi每天的作息时间都是非常固定)是你所想象不到的,这也能够说明为什么他们能在某个特定的时代做出具有一定意义,并且思想较为超前的system或者tools(虽然有些人会喷tvm,mxnet。。。


结合我自己的感觉,有幸今年暑假在cornell做summer research,旁边坐着dmlc社区,当时TVM的某位作者。和大佬简单对下了护照,没想到我俩竟然是同年同月同日同时生,大佬(PhD第一年)现在的citation已经110+了(各种大满贯+best paper)。。。再看看自己,菜狗一只,根本不敢说话,默默舔就完事了!其实啊,这些差距并不是你我这种普通人做了什么努力就能弥补过来的。


人生啊,活得开心就好,没必要把自己整的那么难受。实在不行就像我一样,早早脱坑,早早开始准备老家的公务员考试。进入新的世界,你就会发现其实你的天赋点加到了别的domain。


不知道兄弟你听没听过这句话:”十年科研一场空,一张彩票变富翁!





作者:纳米酱
https://www.zhihu.com/question/335991165/answer/774693547

说两点,我觉得你认知有偏差。


第一,你对标的目标错了,你和那位顶级学者比,大家都知道那位备受尊敬的人是谁,知道他的实力和影响力,这要求实在太高了。我觉得题主不应该一开始就定这种遥不可及的目标,你的定位,应该是对标国内价值观相对比较正确,能力公认比较强的博士,这才是合理的目标。我相信你不断追求,不出意外,也能够找到不错的工作,如果大厂要求高,不要你,只是一个行业的扩张期结束,人员流动性变差,不是你不优秀,商业有商业的本质,不要因为行业萎缩导致人才要求变高,就误认为是自己无能,行业萎缩,其它优秀从业人员一样会感受到这种冰冷刺骨,他们生存状态不比你好多少。


题主要学会换一种角度思考何为优秀,我们教育有个错误的导向,是告诉你赢了人家才有饭吃,比人家发多少文章才能生存,这是错误的认知。虽然现实仍然是残酷的优胜略汰法则,可是题主要坚信,教育最初的愿景,是你帮了其他人,才会有饭吃,无论商业还是学术,你要学会寻找如何让人家感到你有帮助,如何提升其他人的认知,而不是想着如何被世俗定义为优秀。优秀不是生态,只有利益能够转起来,才有行业的生机蓬勃。题主要懂得在一个旋转的时代轮子上,找到自己的位置,并坚信,站在轮子高处的人,也是因为轮子转动,才把他带到了更高的层面,AI 领域轮子转动很快,题主不要轻言放弃,但也到懂得放弃一些轮子,要懂得一些轮子看似高大上,但是上面挂满了人,转动变得很慢了。


至于题主说到的本科生科研,现状是高中生也到公司实习搞机器学习了。。除了少数天然厉害的,他们99%都需要有经验的人带, idea 都是可怜的导师和博士们给的,懂得带,给对了 idea,和年轻人的能力恰好匹配,他们确实很快能做出成果,他们可以,题主也可以,你只是没那个机会罢了。人生很长,受过苦难的人,才会对那些能够高度自驱的人,自己找方向做下去的人给以尊敬,即便世俗意义下,他们并不优秀,但是绝对不会惨。


第二,不优秀的人一样可以做机器学习,从事某个行业是你个人的权利,你不需要害怕。至于出路,我是坚实的 AI 民主化人士,我希望大家都能够学习编程,能够掌握 AI 的工具,人人都能够做AI,大家一起想办法提升生活方面面的点。


我反对机器学习领域因为不优秀就排挤从业人员,反对发不出文章就指摘对方能力不足,我反对因为你调不出 google 的模型,没学会 facebook 的框架,就被大佬鄙视,被行业世俗功利的评价批评不优秀。这是一种反人类思考模式,只有东亚内卷极致的国家,才会自卑到因为跟不上某个有钱玩家的步伐,就放弃思考差异性的提升。


AI 不是空中楼阁,需要有产品,有商业生态,而不是那一堆堆顶会文章,文章可以支撑起一个信仰,但是支撑不起产业,甚至连估值都不能支撑起来。AI 领域反而需要有自知之明的工程师去打磨产品,你能意识到自己不优秀,中国还有成千上万的人群连AI是啥都不知道,你心态平和,充满理想,实际上更容易挖掘人们的需求。放在10年前,你看了历史,就会了解到,移动互联网的爆发不是因为某一群人写前端很厉害,这只是码农自以为是的吹嘘。恰恰相反,移动互联网的爆发,是一群恰好懂一点开发的人,误打误撞,挖掘出移动端上的需求,快速尝到了技术带来的甜头,才有后面前端的蓬勃发展。喝水别忘挖井人,功与过,不能简单变成学术优不优秀,成绩好不好,排名高不高来衡量。移动互联浪潮如此,AI 也会如此,5G 更是如此,所有技术的革新亦是如此。


题主要有自信,国内那些发了顶会,评委给个高分就整个朋友圈吹,或者背后搞姑娘,对论文没有仪式感,到处吹嘘的垃圾,大家知道这帮人是谁,我很鄙视他们,题主也敢于鄙视他们,不要自卑,他们只是过眼云烟,只是学术江湖背后运作保护起来的人,他们的优秀,是病态的学术环境给与的。题主要有自信,这个行业没你想得这么高大上,有很多连价值观都是错误的人都能从事这个行业,他们靠啥手段发家,我在这个圈子,或多或少了解一点,他们都能够吃香喝辣,题主为何这么不自信。


我希望题主站到一定高度去思考人生,不要被眼前片刻的虚荣和浮夸所蒙蔽,影响自己前行的决心。



作者:zhongyian
https://www.zhihu.com/question/335991165/answer/765581119

这是,看了这位大佬前两天的文章?


陈天奇:机器学习科研的十年


同学,没必要对自己这么狠........和这位比起来,大部分机器学习的硕博,不是渣渣,是沫沫..........


1、想和大佬们缩小差距是好事,但是远在天边的榜样没有意义,跳起来能够到的榜样才有意义比如,实验室、学院近两年你认为文章发的最好的人,你觉得工作找的最好的人,你觉得科研做的最扎实的人。


2、理性的认识到自己与别人在某些方面的差距,同时发挥自己的优势,如果你总是觉得自己没有优点,那就让勤奋努力持之以恒成为你的优点。刚进实验室的时候我是被各路同学虐成渣,有特别热爱科研的,有工程能力非常强的,有数学特别好的,然后我么,全靠老师一路连拖带拽的踏上了科研这条路,回过头来看,我觉得我的优势就是,没放弃。


3、踏踏实实,一步一步来,别想一口吃成一个胖子。这个是看到你描述里有说“大佬们已经开始不追求顶会,而是追求完美的质量”,这点吧,不太建议刚入坑的同学学习。虽然总是吐槽说现在文章灌水严重,但是如果你刚接触一个研究领域,志向太宏伟的话,可能几年甚至一直都不会有成果,得不到激励的科研生活对于大部分人来说是很难坚持下去的。大牛们也是刻苦努力,一点一点积累起来的。


4、自信点,乐观点,开心点,适当的危机感要有,但没必要压力这么这么大,你的头发最重要了



重磅!CVer学术交流群成立啦


扫码添加CVer助手,可申请加入CVer-目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测和模型剪枝&压缩等群。一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡)

▲长按加群


▲长按关注我们

麻烦给我一个在看

登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
CMU博士论文:可微优化机器学习建模
专知会员服务
58+阅读 · 2019年10月26日
周志华教授:如何做研究与写论文?
专知会员服务
153+阅读 · 2019年10月9日
做机器学习和AI必备的42个数学知识点
AI前线
9+阅读 · 2018年12月6日
从数学入手,3招打破机器学习工程师的边界
机器学习算法与Python学习
4+阅读 · 2018年10月9日
2年Java经验,真的就拿不到30万年薪吗?
程序员观察
3+阅读 · 2018年4月8日
一个年薪30万的应届生告诉你应该如何学“算法”!
全球人工智能
4+阅读 · 2018年1月23日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
机器学习应该准备哪些数学预备知识?
AI100
4+阅读 · 2017年11月26日
机器学习: 入门与求职建议
九章算法
4+阅读 · 2017年10月6日
大学数学不好,或许是数学教材的锅?
算法与数学之美
15+阅读 · 2017年8月1日
Arxiv
4+阅读 · 2019年4月17日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
Arxiv
8+阅读 · 2018年6月19日
Arxiv
8+阅读 · 2018年1月19日
VIP会员
相关VIP内容
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
CMU博士论文:可微优化机器学习建模
专知会员服务
58+阅读 · 2019年10月26日
周志华教授:如何做研究与写论文?
专知会员服务
153+阅读 · 2019年10月9日
相关资讯
做机器学习和AI必备的42个数学知识点
AI前线
9+阅读 · 2018年12月6日
从数学入手,3招打破机器学习工程师的边界
机器学习算法与Python学习
4+阅读 · 2018年10月9日
2年Java经验,真的就拿不到30万年薪吗?
程序员观察
3+阅读 · 2018年4月8日
一个年薪30万的应届生告诉你应该如何学“算法”!
全球人工智能
4+阅读 · 2018年1月23日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
机器学习应该准备哪些数学预备知识?
AI100
4+阅读 · 2017年11月26日
机器学习: 入门与求职建议
九章算法
4+阅读 · 2017年10月6日
大学数学不好,或许是数学教材的锅?
算法与数学之美
15+阅读 · 2017年8月1日
Top
微信扫码咨询专知VIP会员