机器学习可重复性最佳实践

【导读】机器学习、深度学习领域中一直存在一个令人头疼的问题--模型的可重复性问题。现在似乎很多研究人员都在谈论机器学习的可重复性问题,但是如何真正确保机器学习研究工作是可重复的呢?Kaggle平台的数据科学家Rachael Tatman给出了答案。


Rachael Tatman是Kaggle平台的数据科学家。 她获得了华盛顿大学语言学博士学位,主攻计算社会语言学,兴趣包括数据科学教育和机器学习的公平性。

个人主页:http://www.rctatman.com/


Reproducible research best practices (highlighting Kaggle Kernels), 这是一个一天课程量的训练课程。在该课程中,Rachael Tatman向你展示如何进行一个现有的研究项目,并利用Kaggle Kernels使这个项目完全可重现出来。通过课程中介绍三个关键点来实现项目的可重复性,你可以学到绝佳的实践经验和技巧。



课程中具体介绍和实践的三个关键点是:

  1. 数据(Data):格式化和记录数据,以便于使用和后续重复使用。

  2. 代码(Code):规范你的代码,让你的代码可以易于为其他人(或您将来)运行和理解。

  3. 计算环境(Computing environment):标准化你的运行代码的计算环境,以确保最后输出结果的一致性。


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),

  • 后台回复“RPML” 就可以获取 Reproducible Machine Learning PPT下载~


参考链接:

https://conferences.oreilly.com/jupyter/jup-ny/public/schedule/detail/68323


附课程PPT全文:



-END-

专 · 知


人工智能领域主题知识资料查看与加入专知人工智能服务群

专知AI知识技术服务会员群加入人工智能领域26个主题知识资料全集获取欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~


 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!


关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员