现在关于AI论文非常之多,但真正有价值的不多,其中一个很重要参阅指标就是论文的复现性。最近,来自Maria Dobko讲述了论文复现的关键要点,可作为指引!
机器学习实验室研究工程师,主要从事计算机视觉和深度学习方面的工作。具有丰富的深度学习经验,并将机器学习技术应用于医疗领域和医疗保健领域。
https://apps.ucu.edu.ua/en/maria-dobko/
复现论文
背景知识:
“科学的进步取决于独立研究人员的能力,他们能够仔细审查一项研究的结果,能够利用其材料重现该研究的主要结果,并在未来的研究中以这些结果为基础。”
什么是论文复现?
为什么要复现论文?
教育的目的
研究结果比较
可靠性研究
生产中使用方法
挑战和比赛
预备要求:
1. 有效阅读论文
在Dmytro的讲座中有更多的内容
2. 确定方法中最重要的部分
3.了解你繁殖的原因
4. 确定您将如何测试方法
复现结果挑战
1. 缺乏记录(跟踪超参数值、批大小、更改)
2. 数据的变化
3.Hyperparameters不一致
4. 随机性
5. 框架和库的更新(tensorflow, pytorch, kornia)
6. GPU浮点差异
7. 不确定性算法
ReadMe是一个很好的复现代码参考文件
什么是有用的?
日志:
●模型版本控制(权重和偏差,海王星,mlflow, Comet)
●数据版本控制
依赖管理(像Conda, Docker, Kubeflow, Pipenv, Singularity这样的工具可以帮助你存储环境和软件依赖)在使用容器时要小心
避免非确定性算法(torch.use_deterministic_algorithms(True), TensorFlow具有GPU确定性功能,它可以被NVIDIA NGC TensorFlow容器或TensorFlow版本1.14,1.15或2.0访问,并支持GPU)
随机化管理(PYTHONHASHSEED, np.random。种子,tf.set_random_seed)
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“PR33” 就可以获取《《论文复现指南:要求、挑战与技巧》33页ppt》专知下载链接