你的毕设有救了!如何3个月搞定机器学习项目?

2018 年 9 月 22 日 AI前线
作者 | Tim Rocktäschel
译者 | Sambodhi
编辑 | Vincent
AI 前线导读:美国的暑期实习短期项目能够为大学生及研究生开阔视野,增长知识,很多学习人工智能大学生都会利用这个机会去进行短期机器学习研究项目,为自己积累经验。那么,对这种短期机器学习项目而言,有什么好的建议吗?

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)

每年都会有学生与我们联系,寻求从事短期机器学习研究项目的机会。到目前为止,我们已经监督了很多这样的短期研究项目,我们注意到,我们给出的一些建议遵循了一些重复的原则。在本文中,我们分享一些自认为对硕士论文项目或机器学习暑期研究实习的好建议。本文所提到的这些建议,肯定不会是全面的,而是强调了我们反复多次目睹的那些陷阱。例如,我们不会讨论如何选择一个好的项目,也不会讨论如何进行机器学习研究项目。我们给出的一些建议,通常是用于机器学习,特别是深度学习、强化学习的研究项目。然而,其中一些建议,只对那些只有三个月的短期项目才有重要的意义,而当你刚刚开始三到五年的博士学位之旅时,这些建议就没那么重要了。

1 主要陷阱:
1.1 假设你的代码没有 bug

众所周知,机器学习,特别是深度学习和强化学习模型很难进行调试。为了让你了解无数的犯错方式,你可以看看 Andrej Karpathy 发的推文:https://twitter.com/karpathy/status/1013244313327681536 。

我们所有人,哪怕是更资深的研究人员,总是会犯这样的错误。这些错误之所以难以察觉,是因为模型即使有缺陷也仍然可以进行学习并产生有意义的输出。bug 可能会给你的模型带来微秒的变化,并且这些 bug 大多数只会在运行时才会显现。因此可以说,你所能做的最槽糕的事情就是假设你的代码不包含任何错误

区分一个机器学习研究者是高效的还是低效的,是要看他们对自己的代码持什么样的态度。

如果你的默认假设是代码可能有问题,那么你将会更加仔细地检索 bug。一行一行地检查代码,并仔细检查中间输出。如果可能的话,将它们进行可视化呈现。张量的形状是否合适?它们是否被正确地初始化、克隆或分离?在模型训练期间监控梯度并注意 NaN。通过设置随机数生成的种子对编写单元测试并使实验结果复现可能有所帮助。

有关神经网络调试的更多小贴士,请参阅 Goodfellow 等人所著的《Deep Learning》一书中第 11.5 章节:Debugging Strategies(调试策略)(http://www.deeplearningbook.org/contents/guidelines.html)

1.2 只看最终的评估指标

虽然你的项目的目标可能只是实现某些评估指标上的改进,但更重要的是,你应该充分了解模型的工作原理以及取得改进的原因。尤其是在项目的早期阶段,最终评估指标包含的信息很少,但这些信息对迭代和开发算法或者模型却非常有用。

相反,要提出更为深入的问题,并开发出有用的信息诊断方法。如果你已经引入了门控(gating)或注意力机制(attention mechanism),你的模型是否真的利用了它?在你所提出的模型创新中,哪些实际上有助于整体性能的提高?你做过消融研究(ablation study)吗?你的模型需要多少训练样本或轮数(epoch)才能达到合理的性能?和你使用的基线有何区别?你的模型在哪些测试实例上表现良好或很差?它们是否存在系统差异?你的结果对于超参数的变化有多稳健?能够从模型的隐藏状态来预测重要特征吗?

请牢记这一点:你的研究和项目报告并非是要让研究社区了解你所做的一切与先前最先进的技术相比的一些微小的改进,而是要帮助我们来理解这个领域。这个领域的其他人会想知道哪些是有效的,哪些是无效的,以及你的哪些发现可以应用于他们的问题

1.3 尝试随机变化且无清晰的预期

在当前的深度学习库中,通过添加更多组件、层和优化技巧,很容易使模型变得更加复杂。但是,当你对代码或模型进行更改时,你至少应该对为何这些更改有用有一个直觉。同样,当你进行实验时,你也应该对这个实验结果有清晰的预期。你期望绘制的结果是什么样子的,它们会告诉你什么呢?当你发现自己的模型没有按照预期的方式进行时,这一点就显得尤为重要了。

那么,你现在更有可能看到 bug 的症状,因此,扩展你的模型并不能有助于找到这个 bug,甚至可能使隔离问题变得更加困难。在使你的模型变得更为复杂之前,请先深入了解它可能存在的问题。此外,请记住,在你的报告中必须证明你所做的是正确的。评估你的报告的人,对理解你的思考过程会有兴趣的。

如果你不能制定一个研究假设,并向自己解释为何你做所的事情应该起作用,那么其他任何人很有可能也不能复现你的项目结果。

1.4 过于复杂

我们经常看到上进心强的学生在遇到难题时毫不退缩,马上尝试复杂的解决方案。可是这样子,如果出现问题的话,就很难进行分析。

相反,应该要扪心自问:应该起作用的最小的东西是什么?模型能学会记住一个小数据集吗?如果只使用几个参数时,它能学到什么?在单个训练实例而不是批量实例进行训练时,代码是否有效?我们期望看到的最简单的泛化形式是什么?我们期望失败的简单基线是什么?什么是基线的最小扩展才能使它工作?

1.5 迭代太慢

实验可能需要很长时间。特别是深度学习和强化学习在积累大量随机种子时,可能会耗费大量的时间。因此,在短期项目的过程中,不要过早地陷入缓慢的迭代周期是很重要的。使用简单的环境来调试你的模型,并实现对你的想法进行概念验证,这些都可以在个人计算机上运行。

有时一个简单的矩阵游戏或网格世界实验都可以提供有用的想法验证。有时你还可使用 MDP 的精确值函数来测试算法思想,而不必纠缠于梯度估计、Actor-Critic 训练等等。在进行大规模实验时,要简化启动实验和检查结果的流程。在实验完成全部过程之前检查这些结果,看看性能是否平稳。在基础设施上投资,在开始时可能会耗费大量时间,但在项目结束时会有所回报。在分析结果时,要渴望得到有用的信息。

2 一些建议
2.1 在项目开始之前先了解背景和相关工作

我们通常会在正式开始的日期前几个月就分发项目。其原因是:  

  • 三个月对于了解背景和相关工作而言是非常短的时间;

  • 三个月对于项目的实施和实验而言也是非常短的时间;

  • 三个月对于撰写一份好的报告而言也是非常短的时间。

另外还有一个原因是,我们通常会提出一些研究项目,如果这个项目取得成功,我们有可能会在机器学习领域发表相关论文。虽然我们知道学生在一个学期内会有很多事情要去做,但我们通常都会鼓励你们至少提前开始阅读相关文献。理想情况下,当你开始为项目全职工作时,你应该知道要做什么,它如何与现有方法相关联,并且知道如何做到这一点。这也是熟悉你所选择的机器学习框架的好时机!(我们推荐 PyTorch!)

2.2 使用版本控制

你确实应该在研究代码和项目报告中使用版本控制。没有什么比在截止日期前丢掉繁忙工作日更糟糕的事儿了。如果你还没有使用版本控制,那就去 GitHub 注册账户吧。作为学生,你可以得到免费的私人存储库(https://education.github.com/pack)。如果你尚未了解版本控制,那么现在就去学习,你以后会感谢你自己现在的做法。

2.3 使用随机重复进行评估

在学术界,你不可能在项目期间访问多个 GPU。然而,尤其是在深度强化学习中,重要的是不要从单个或几个实验中得出聒噪的结论。理想情况下,你希望多次进行实验,并如前所述,得到不同初始条件和超参数的健壮性的感觉。

2.4 在整个项目中尽早开始写作并始终如一

如果你正在进行一个硕士项目,你的工作将会基于你的书面报告进行评估,而不是基于你已做出但没有足够时间来写清楚的杰出工作。尽早开始写作,不要低估传播你的研究成果的努力。

清晰的陈述你的目标、假设和贡献,让读者跟随你的思路。解释你设计选择并清晰地讨论你的发现。理想情况下,你应该在项目过程中始终如一地编写报告。这样,你就会强迫自己去考虑接下来的步骤,当截止日期临近时,你就不大可能会忘记项目中任何重要的信息。

2.5 当你需要帮助时,要积极主动寻求帮助

尽管你的老板都是大忙人,但要记住,他们来这里就是为了帮助你的。千万不要因为遇到问题,因为不敢寻求帮助而陷入困境,以致无法参加下次会议,记住,当你需要帮助的时候,请尽管找你的老板。你要积极、主动安排好会议并准备好你想要提前讨论的结果、代码或报告。好好利用你的老板,记得不要惊慌!作为过来人,我们都经历过这一切,我们深知这可能是一次令人生畏的经历,特别是如果你的工作前景或者你的博士申请的成功依赖于这个研究项目的话。我们真的希望你能够取得成功。

原文链接:

https://rockt.github.io/2018/08/29/msc-advice


今日荐文

点击下方图片即可阅读

快1万倍!伯克利提出用深度RL优化SQL查询


精品推荐

怪兽电影《巨齿鲨》你看了吗?其中数字化虚拟形象鲨鱼可谓是电影中的主咖C位,这是人工智能工程震撼人心之处。而重塑中国银联金融反欺诈、助力京东无界零售、辅助分析医疗影像...这也是人工智能惠及大众之举。人工智能,从至强开始!

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

登录查看更多
1

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
还在修改博士论文?这份《博士论文写作技巧》为你指南
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
五个给机器学习和数据科学入门者的学习建议
机器之心
3+阅读 · 2019年9月16日
吴恩达团队:神经网络如何正确初始化?
AI100
11+阅读 · 2019年5月15日
100行Python代码,轻松搞定神经网络
大数据文摘
4+阅读 · 2019年5月2日
Forge:如何管理你的机器学习实验
专知
11+阅读 · 2018年12月1日
【教程】如何从零开始构建深度学习项目?
七月在线实验室
7+阅读 · 2018年4月23日
从0到1 | 0基础/转行如何用3个月搞定机器学习
算法与数学之美
4+阅读 · 2017年11月20日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Object detection on aerial imagery using CenterNet
Arxiv
6+阅读 · 2019年8月22日
Knowledge Flow: Improve Upon Your Teachers
Arxiv
5+阅读 · 2019年4月11日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年6月8日
Arxiv
5+阅读 · 2018年1月30日
VIP会员
相关VIP内容
还在修改博士论文?这份《博士论文写作技巧》为你指南
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
相关资讯
五个给机器学习和数据科学入门者的学习建议
机器之心
3+阅读 · 2019年9月16日
吴恩达团队:神经网络如何正确初始化?
AI100
11+阅读 · 2019年5月15日
100行Python代码,轻松搞定神经网络
大数据文摘
4+阅读 · 2019年5月2日
Forge:如何管理你的机器学习实验
专知
11+阅读 · 2018年12月1日
【教程】如何从零开始构建深度学习项目?
七月在线实验室
7+阅读 · 2018年4月23日
从0到1 | 0基础/转行如何用3个月搞定机器学习
算法与数学之美
4+阅读 · 2017年11月20日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
相关论文
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Object detection on aerial imagery using CenterNet
Arxiv
6+阅读 · 2019年8月22日
Knowledge Flow: Improve Upon Your Teachers
Arxiv
5+阅读 · 2019年4月11日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
7+阅读 · 2018年6月8日
Arxiv
5+阅读 · 2018年1月30日
Top
微信扫码咨询专知VIP会员