【导读】机器学习、深度学习领域中一直存在一个令人头疼的问题--模型的可重复性问题。现在似乎很多研究人员都在谈论机器学习的可重复性问题,但是如何真正确保机器学习研究工作是可重复的呢?Kaggle平台的数据科学家Rachael Tatman给出了答案。
Rachael Tatman是Kaggle平台的数据科学家。 她获得了华盛顿大学语言学博士学位,主攻计算社会语言学,兴趣包括数据科学教育和机器学习的公平性。
个人主页:http://www.rctatman.com/
Reproducible research best practices (highlighting Kaggle Kernels), 这是一个一天课程量的训练课程。在该课程中,Rachael Tatman向你展示如何进行一个现有的研究项目,并利用Kaggle Kernels使这个项目完全可重现出来。通过课程中介绍三个关键点来实现项目的可重复性,你可以学到绝佳的实践经验和技巧。
课程中具体介绍和实践的三个关键点是:
数据(Data):格式化和记录数据,以便于使用和后续重复使用。
代码(Code):规范你的代码,让你的代码可以易于为其他人(或您将来)运行和理解。
计算环境(Computing environment):标准化你的运行代码的计算环境,以确保最后输出结果的一致性。
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),
后台回复“RPML” 就可以获取 Reproducible Machine Learning PPT下载~
参考链接:
https://conferences.oreilly.com/jupyter/jup-ny/public/schedule/detail/68323
附课程PPT全文:
-END-
专 · 知
人工智能领域主题知识资料查看与加入专知人工智能服务群:
专知AI知识技术服务会员群加入与人工智能领域26个主题知识资料全集获取。欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知