机器学习太难了!AI大佬们给你指条明路

2018 年 5 月 13 日 AI前线 8000hours


译者|无明
编辑|Debra
AI 前线导读:常有读者在后台或者微博私信向我们提问:机器学习难吗?对于这样的问题,通常的回答是:难。不仅难,对于那些基础能力薄弱的人来说,简直就是痛苦。有不少人选择这条路是因为高薪资的诱惑,但既然想要这份薪水,就要承受相应的苦难。不过好在现在信息渠道多,资源也相对丰富,今天 AI 前线就为各位带来一份机器学习的进阶指南,希望对你有所帮助。在这里需要向各位读者强调的是:虽然原文讲述的内容与机器学习博士有关,但实际上,本文讲述的重点是为什么要学习机器学习?机器学习从业者每天的工作都有哪些?如何判断自己是否适合从事机器学习?如何学起?本文对所有想要进入/正处于机器学习领域的人都有相当大的指导意义,不要被“博士”两个字吓到而停在这里。只要努力,你也可以,在此之前请先耐心读完这篇文章吧!

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

与机器学习博士相关的工作职位不仅创下了薪水的新高,而且对世界产生了巨大的影响。80000 小时(YC S15)提供了一个综合指南(https://80000hours.org/career-reviews/machine-learning-phd), 用于指导如何开始你的机器学习博士学位之旅。

80000 小时(https://80000hours.org) 是一个非营利组织,负责研究具有社会影响力的职业,并提供在线咨询。该指南基于与六名机器学习研究人员的讨论而总结而来,其中有两名来自 DeepMind,一名来自 OpenAI,还有一名是某机器人初创公司创始人。以下是该指南的主要内容。

机器学习博士的职业路径是怎样的?

通常,我们必须告诉计算机要做什么,它们才能按照我们的指令一步一步地执行任务。如果我们没有事先给出步骤,它们就无法执行任务。

相比之下,在机器学习领域,程序员制定规则,监督软件如何进行学习,而不是直接通过编程指定它们的行为。我们因此可以构建出能够自动改进体验的系统。

机器学习博士需要学习如何设计和实现这些算法。博士研究工作可能包括以下主题:开发一个能够标记视频中正在发生的事件的程序,通过改进技术来理解为什么机器学习系统能够做出预测,或者对在线文本进行分析,以便了解社交过程,例如网络流行语是如何传播的。

机器学习是计算机科学的一个分支,与统计学密切相关。统计学和机器学习都从数据中学习,它们之间有很多相通的概念和公用的数学工具。

但是,与统计数据不同,机器学习倾向于强调构建软件来进行预测,通常应用于较大的数据集,而且它使用的技术对数据本身或数据是如何收集的并没有多做假设。

机器学习博士日常都做些什么?

在美国,拿到博士学位通常需要 5 到 6 年。在头两年需要上课,在剩下的几年里从事研究工作。英国的博士学位时间较短,通常为 4 年,因为只需要做研究工作。与美国博士不同,他们一般要求你先拿到硕士学位,不过不同的大学也有不同的要求。

你需要为你的研究工作写一篇论文,对某个特定主题进行深入的探讨,或者(更常见的是在美国)发表一系列相关主题的论文。你的研究将经历几个阶段,首先完善你的主题,然后研究与之相关的研究项目,最后写出你的论文。

你将花费大部分时间进行编程、数学演算、阅读论文,并与合作者一起思考和讨论想法。

为什么要攻读机器学习博士学位?
1. 了解那些可能是未来十年最重要的技术

机器学习在过去十年中取得了飞速的发展,这要得益于理论上的突破、数据可用性的提升、投资的增加以及处理能力的提升。它已经被应用于很多以前未能完成的任务,包括自动驾驶、图像识别、游戏、直升机飞行、语音合成和电影推荐。

如果技术不断进步,我们将能够实现越来越多的劳动力自动化,并解决以前难以解决的问题。最终,我们可以通过软件来完成大多数任务,甚至比人类做得更好。

这种进步将会彻底改变我们的世界。我们将看到自动驾驶汽车交通事故造成的死亡人数大幅下降、医疗诊断费用更低、诊断更准确,以及具有危险性或繁琐的工作被自动化。

但它也可能导致出现自动化武器、大量的失业以及政治和经济权力集中在少数人手中。

更令人感到担忧的是,如果我们开发的软件具备了高度智能,却与我们的想法相左,那么就有可能产生灾难性的后果。

我们认为机器学习是未来几十年最重要的领域之一。尽管近来人们对这个领域的兴趣在增长,但仍然只有少数人能够掌握这些技能。

2. 积极促进人工智能发展

积极促进人工智能发展是我们最关注的问题,我们需要更多拥有机器学习专业知识的人才来解决这些问题。因此,我们认为,对于机器学习博士生来说,尝试解决这些问题才是他们应该做的事情。在这个问题领域,主要有两条途径。

技术安全研究

我们缺少能够通过技术研究来减少人工智能给社会带来风险的人才,而机器学习博士可以为此做好准备,迎接挑战。

政策和策略研究

人工智能政策可帮助政府、企业和非营利机构的决策者设计和实现有助于人工智能发展的政策。与政策相关的角色包括制定政策的研究人员以及倡导和实现政策的从业人员。

机器学习博士是很好的人才储备库,因为他们不仅拥有技术背景,而且其他政策角色还赋予了他们信誉。

3. 将机器学习应用于社会重要问题上

在美国,脓毒症和感染性休克占所有重症监护病房住院人数的 10%以及所有医院死亡人数的 20-30%。约翰斯霍普金斯大学的科学家已经开发出一种名为 TREWScore 的机器学习系统来帮助解决这个问题。它可以在使用标准筛查方法之前识别发生感染性休克的高风险患者,从而加快治疗速度。

机器学习可以用在很多紧迫性问题上:

健康:改善诊断,预测登革热暴发,减少不恰当的抗生素使用

全球性贫困:为现收现付的太阳能电力找到合适的客户,使用卫星图像找到收款方所在的村庄

动物福利:预测哪种植物蛋白最适合制作植物性肉类

要从事这类工作,你需要了解你的技能可以应用在哪些社会问题上。你可以通过参与到公司或相关研究项目中,与其他人一起探讨,来加深对这些问题的理解。你可能会在一家成熟企业工作,也可能创办自己的公司,或者进行学术研究。

4. 高收入职业

对机器学习专业知识的需求,导致该职位薪水一路走高:考虑到这些数据包括只需要硕士或学士学位的职位,我们预计博士的收入应该处于较高的范围。

由于发展迅速以及在解决问题方面的实用性,机器学习具备很高的盈利潜力(我们预计它在未来十年仍将保持高位)。然而,由于有很多感兴趣的人进入该领域,存在薪水逐步下降的风险。

机器学习技能在科技初创公司中非常受待见,近来,机器学习初创公司也不断涌现。 Y Combinator 首次增加了对 AI 初创公司的追踪。大型公司近年来一直在收购人工智能创业公司,而且收购的价值通常取决于团队本身,而不是一般的收入指标。

据业内人士透露,拿到机器学习博士学位,就很有可能在量化对冲基金中获得一份高收入的工作。

5. 具备自主性的智力工作

你需要和世界上最能干的人一起工作,并且会对你的领域有一个令人满意的深刻理解,而且你可以自由选择做什么以及什么时候做。

如何开始博士学位?

首先,你需要具备扎实的量化技能,通常是通过攻读计算机科学、数学、工程学、数量经济学或物理学等本科学位而获得的。至少,你应该掌握概率和统计、多变量微积分和线性代数。我们知道那些已经被机器学习硕士录取的人可能没有量化背景,所以他们需要在数学预备课程中进行自学或参加课程学习(如开放大学)。

在英国和欧洲其他国家,通常要求拥有机器学习硕士学位或相关学科(如计算机科学或数学)学位,不过也取决于各个大学的具体要求。在美国、加拿大和澳大利亚,通常没有这种要求,虽然如果拥有相关硕士学位有助于申请博士学位,也有助于在开始攻读博士学位之前进行兴趣和研究能力测试。

不要求硕士学位的博士学位通常比其他的要长 1 到 2 年时间。如果你打算攻读硕士学位,那么两年的学位会更好,因为你有更多的时间来做研究,这是开始顶尖博士学位的关键。

基于在线指南以及与正在攻读机器学习博士学位的人的交谈,我们发现,能不能获得认可完全取决于你如何展示好你的研究能力。

应该研究哪些主题?
深度学习

虽说不同的机器学习方法适用于不同的应用,不过深度学习确实在过去十年中取得了很大的成功。这项技术受我们大脑网络结构的启发,虽然它们之间有很多不同之处。

深度学习帮助我们解决了以前人工智能技术无法解决的问题,其中包括图像识别、预测潜在药物分子的活性、分析粒子加速器数据、重建大脑回路、预测非编码 DNA 突变对基因表达和疾病的影响。

由于深度学习的成功应用,对应的专业知识对于在机器学习方面处于领先地位的公司以及致力于促进 AI 发展的人来说都是很有价值的。

强化学习

在强化学习中,软件会在其环境中做出一些动作,以便最大化由程序员定义的奖赏。

强化学习非常重要,因为它是一种很有前途的创建软件的方法,与人类一样,它具有长期目标,并通过试错来学习在其环境中最有效的方法。

考虑到深度学习目前广受关注,强化学习博士学位可能不像深度学习那么难。当然,你也可以攻读深度强化学习博士学位。

应用

如果你要开发特定的机器学习应用,例如视觉或语音识别,需要记住一些事项。只要你使用的是底层的机器学习方法,那么选择哪种应用就变得无关紧要。不过,仍然值得花点时间在选择应用上,最理想的应该是那些正在取得进展但尚未定型的应用。

如何知道你是否适合这项工作?

如果不去尝试,就很难知道你是不是适合做机器学习研究。为了测试你的适应性,以下是可以采取的一些步骤,按照时间顺序排列:

  1. 与正在攻读机器学习博士学习的人交谈,更多地了解机器学习以及是否适合自己。

  2. 参加机器学习在线课程,例如 Coursera 的机器学习课程或所在大学的机器学习课程。

  3. 参加在线比赛。

  4. 参加更多的课程,阅读更多的教科书。

  5. 阅读研究论文并尝试复制其结果。我们采访了来自 OpenAI 的 Dario Amodei,他详细地介绍了如何做到这一点。以下是一些参考论文:

    一些重要的深度学习论文

    https://github.com/ChristosChristofidis/awesome-deep-learning)

    一些重要的强化学习论文

    (https://github.com/aikorea/awesome-rl#papers--thesis)

  6. 来自顶级会议的论文(https://80000hours.org/ai-safety-syllabus/#conferences)

  7. 参加夏季研究实习。

  8. 攻读一个包含研究项目的硕士学位。

加入哪个研究小组或机构?

基于在线指南和我们与该领域人士的交谈而得出的参考标准:

  • 研究小组的声望。你希望加入一个能够不断把论文带入顶级机器学习会议的团队。

  • 你的潜在导师是什么样的人。不要只关注大学或学院的声望,你的导师对你的成功至关重要。

  • 选择一位能与你一起工作并且支持你的导师。与其他学生交谈,看看他们是否对你正在考虑的导师感到满意。

  • 确保他们的研究兴趣与你的研究兴趣保持一致。

  • 如果前两项标准得到满足,那就选择有声望的成功导师。著名的研究人员,比如负责大型实验室的研究人员,往往拥有更好的资金和人脉,但可能很难与之合作,因为他们往往太忙而无法对你的工作提供反馈。不太出名的导师反而可以更好地支持你,比如一位即将上任的初级教授。另外,如果你感兴趣的领域有多个导师,这样也不错。

  • 导师和实验室的稳定性与资源。寻找确保能够让你呆在那里工作的实验室和导师。另外,奖学金(如来自 NSF 和 NSERC 的奖学金)有助于你与资金较少的导师合作。请确认你的潜在导师是否想在你攻读博士学位期间更换实验室。如果导师在中途离开,对你来说可能是灾难性的,因为你可能发现很难找到另一位具有同等专业知识的导师。

  • 教学负担。有些学院会要求你做很多教学工作,这样会占用你太多的研究时间。

  • 实验室气氛和包容性。你将与其他学生和博士后一起合作和学习,所以请确保他们愿意帮助你。如果可能的话,在实验室会议上或通过与当地在校学生交谈,看看实验室是否有友好的气氛。

  • 一个让你感到开心的地方。找到大家庭的感觉对你来说很重要,因为到了一个语言不通的地方,你会感到孤独。

  • 有与你感兴趣主题相关的研究人员。例如,如果你想从事与人工智能安全相关的工作,那么就应该与拥有人工智能安全研究小组的大学合作,这样就可以在博士学习期间开展这方面的工作,并建立与其他研究人员的联系。

  • 当地行业。如果你知道拿到博士学位后要做什么,那么就选择周边有相关行业的大学。也就是说,如果你对初创公司或大型科技公司感兴趣,可以去旧金山湾区的大学,如斯坦福大学和伯克利大学,如果你想与 DeepMind 建立更好的联系,就去英国的大学。

  • 整体机构声望。如果你要留在机器学习领域工作,那么机器学习研究组的声望比整个大学的声望要重要得多。

原文链接:

https://80000hours.org/career-reviews/machine-learning-phd

https://blog.ycombinator.com/a-guide-to-machine-learning-phds/

今日荐文

点击下方图片即可阅读

吴恩达的 7条机器学习训练秘籍



专栏推荐

极客时间 《推荐系统 36 式》,36 讲,深入浅出地为你搭建起整体的架构、算法等知识脉络,并在这基础上补充实践案例与经验,助力解决系统起步阶段 80% 的问题。听完这个专栏,可深知推荐系统的本质及运用策略。

可以说,若你是零基础,那这个专栏很适合你,拥有 8 年资深算法经验的刑无刀老师用通俗易懂、多举例少谈概念地方式帮你讲清楚各个问题,直击推荐系统本质。

订阅有福利!订阅后,可生成你的专属海报,分享给身边的小伙伴。每邀请一位好友购买,你可获得 13 元,好友也将获得 6 元的现金返现。多邀多得,上不封顶,立即提现(提现流程:极客时间公众号 - 我的 - 现金奖励提现)

AI前线
紧跟前沿的AI技术社群

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得点赞分享哦!

┏(^0^)┛明天见!

登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【资源】100+本免费数据科学书
专知会员服务
108+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
342+阅读 · 2020年3月15日
《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
205+阅读 · 2020年2月24日
KGCN:使用TensorFlow进行知识图谱的机器学习
专知会员服务
82+阅读 · 2020年1月13日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
Kaggle实战,10 分钟开启机器学习之路
机器学习算法与Python学习
4+阅读 · 2019年5月17日
机器学习:从入门到晋级
云栖社区
4+阅读 · 2018年11月21日
“搞机器学习没前途”
CSDN
236+阅读 · 2018年9月12日
机器学习自动文本分类
AI前线
23+阅读 · 2018年2月4日
机器学习实践指南
Linux中国
8+阅读 · 2017年9月28日
Arxiv
3+阅读 · 2018年12月19日
VIP会员
相关VIP内容
【资源】100+本免费数据科学书
专知会员服务
108+阅读 · 2020年3月17日
机器学习速查手册,135页pdf
专知会员服务
342+阅读 · 2020年3月15日
《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
205+阅读 · 2020年2月24日
KGCN:使用TensorFlow进行知识图谱的机器学习
专知会员服务
82+阅读 · 2020年1月13日
谷歌机器学习速成课程中文版pdf
专知会员服务
146+阅读 · 2019年12月4日
相关资讯
干货 | 可解释的机器学习
AI科技评论
20+阅读 · 2019年7月3日
Kaggle实战,10 分钟开启机器学习之路
机器学习算法与Python学习
4+阅读 · 2019年5月17日
机器学习:从入门到晋级
云栖社区
4+阅读 · 2018年11月21日
“搞机器学习没前途”
CSDN
236+阅读 · 2018年9月12日
机器学习自动文本分类
AI前线
23+阅读 · 2018年2月4日
机器学习实践指南
Linux中国
8+阅读 · 2017年9月28日
Top
微信扫码咨询专知VIP会员