一周前发布的一份对人工智能产业的评估发现,研究人员提交的论文中只有15% 发表了他们的代码。
由美国康奈尔大学科学基金会维护的 arXiv 保存着来自生物学、数学和物理学等领域的预印本论文手稿,它已经成为人工智能研究人员公开分享其研究成果的最受欢迎的网站之一。
arXiv携手Papers with Code,一键复现最新论文!
预印本存储库为研究人员提供了一种分享他们工作的方式,在经历漫长的同行评审过程之前,放到著名学术期刊上进行实践。在 arXiv 上分享的代码将通过带有代码的论文提交,并且可以在每篇论文的「Code」标签中找到。
选择提交后则会自动跳转到Papers with Code网站,然后在此页面之上进行代码提交。
「arXiv 上的代码使得研究人员和实践者更容易建立最新的机器学习研究」,Papers with Code的创建者 Robert Stojnic 今天在一篇博客文章中说,「我们也希望这一变化能对机器学习之外的更广泛的计算科学产生连锁反应。科学是累积的,开放的,提供诸如代码之类的关键技术,使研究更容易建立,有助于加快进展」。
作者可以通过访问 arXiv. org/user,点击带有「Code」图标的「Link to code」 ,将官方代码添加到 arXiv 论文中,它将跳转到Papers with Code,在那里他们可以添加他们的代码。一旦他们添加了官方实现,官方代码部分将显示在 arXiv 文章页面上。
所有Papers with Code的论文数据都可以免费获得,并且使用 CC-BY-SA 授权(与维基百科相同)。
Papers with Code创始人:越开放越进步
从2018年开始,Papers with Code 集中于鼓励人工智能模型结果的可重复性,该网站分享了近2000篇来自人工智能主要领域的论文和代码,比如自然语言处理、计算机视觉、对抗性机器学习和机器人技术。
Robert Stojnic说,「我们在Papers with Code中的目标是通过使研究更容易掌握、使用和扩展来加速科学进步。在 arXiv 上安装代码使得研究人员和实践者更容易建立最新的机器学习研究。」
「这是一个重要的时刻,并完成了我们的使命的第一章,我们很高兴能与 arXiv 团队合作,为机器学习社区实现这一改变」
带有代码的论文最初部分由 Facebook AI Research 的成员创立。去年,Facebook 和 Papers with Code 推出了「PyTorch Hub」,以鼓励可复用性。
在过去一年左右的时间里,分享代码和研究论文手稿已经成为AI领域主要研究会议的一种标准。
在 ICML 2019年会议上,将近70% 的作者在会议开始前提交了代码和论文。ICML 的组织者发现,提交代码的90% 的研究人员来自学术界,约27% 的研究人员来自工业界。相反,近84% 的作者来自工业界,约27% 来自学术界。
在公司内部开发软件或人工智能的人可能更倾向于认为保密对于保护知识产权或公司利益很重要。
2019年,NeurIPS 开始尝试代码提交政策,并在今年实施了官方的代码提交政策。今年早些时候,NeurIPS 也开始要求所有提交的文件都包括社会影响报告,并且需要声明任何潜在的利益冲突。
展望未来,或许会有更多的工具和网站来解决人工智能领域的可复用性和信息超载的问题,来加速各个领域的研究进度。
参考链接:
https://venturebeat.com/2020/10/08/arxiv-now-allows-researchers-to-submit-code-with-their-manuscripts/
https://medium.com/paperswithcode/papers-with-code-partners-with-arxiv-ecc362883167