【新智元导读】7月15日,智源研究院发布了关于4月中旬「A Roadmap for Big Model」综述报告问题调查和处理的通报。
据通报称,在综述报告10处被质疑片段中,有2处属于抄袭,另有4处属于引用不规范。
目前,相关责任人已主动离职,大模型研究中心也将进行部门重组。
智源研究院表示,大模型研究中心作为组织单位,对综述报告撰写中可能存在的风险隐患缺少充分考虑,未采取必要措施避免相关问题出现,对整个事件负有监督失察责任。
综述报告的第一作者(智源大模型研究中心人员)未严格按照学术出版规范的流程执行,在未与其他作者确认的情况下,于2022年3月26日将综述报告上传至arXiv,负有主要组织责任。
这篇综述报告是由智源研究院大模型研究中心牵头组织、邀请国内外19个机构共100位科研人员分别撰写的16篇独立专题文章组成。
其中,每篇文章都有对应的撰写作者和通讯作者(除第12篇外),所有作者共同署名整个报告。
第一处抄袭为第2篇文章2.3.1节中共计179个单词的多句重复。作者虽然在最开始明确标注了引用文献,但未明确区别引用文字,且篇幅较大。
属于《学术出版规范 期刊学术不端行为界定》中的「文字表述剽窃」,其程度为《IEEE出版物服务和产品委员会操作手册》相关规定中的第5级(第1级最严重,第5级最轻微)。
文章第二作者负直接责任,通讯作者,未对该文章进行有效审查,负失察责任。
第二处为第8篇文章的8.3.1节存在74个单词的整句重复,无明确引用,属于抄袭。
由于文章一作者未经其他作者同意,就将自己加为第一作者并对文章进行了大篇幅修改,且在文章发布前未与通讯作者确认,因此负直接责任,而通讯作者和其他作者均没有责任。
IEEE分级标准:https://www.ieee.org/content/dam/ieee-org/ieee/web/org/pubs/Level_description.pdf
除前述2处抄袭外,有4处属于引用不规范,并不构成抄袭:
-
第12篇文章:12.2.3节存在共计36个单词的重复,其中一部分包含19个重复单词,进行引用时,未在本句中未标注引用参考文献。
-
第14篇文章:14.2.2节存在一处一句29个单词的重复,文字上指明了引用对象,但本句没有直接添加引用。
-
第14篇文章:14.2.3节存在一处一句27个单词重复,在14.2.3节中有参考文献标注,但在本句中没有直接标注。
-
第16篇文章:16.1节一处存在多句重复,该段落起始处对参考文献有明确引用,后续其他句子存在本句未直接标注的情形。
目前,智源研究院已经安排可能存在问题文章的作者向原作者进行了书面致歉,并且均已得到原作者反馈和谅解,论文也已从arXiv撤稿。
4月8日,来自一名被抄袭的谷歌大脑的研究员Nicholas Carlini在其个人博客上贴出文章「机器学习研究中的剽窃事例」(A Case of Plagiarism in Machine Learning Research)。
其中条分缕析、清楚克制地指明了「大模型路线图」(A Roadmap for Big Model)的抄袭实迹。
Nicholas Carlini还表示:「由于筛选工具的急就性质、和对比数据集的不完备性(只包括已在学刊上发表的论文,不包括预印本网站论文),很可能还有更多的抄袭部分尚未被发现。无论如何,现有程度已经很令人伤感了。」
这一起AI界的学术不端的事件可也算是「引爆」了整个学术圈。
4月13日晚,智源研究院作为这一综述文章的组织者,在知乎的官方账号上发表公开致歉信,称「从互联网上获悉」此事,承认涉事论文有抄袭的部分,并向学界与公众表示歉意。
4月15日,智源研究院理事会委托中国计算机学会作为第三方开展独立调查。
https://www.baai.ac.cn/portal/article/index/cid/5/id/504.html
领取步骤:
1.点击下方视频,并关注新智元「视频号」。
2.在视频下留言评论,文案「引爆元宇宙,奔向AI新天地」(可复制)。
3.评论点赞数前10、且已关注的用户,将获得《人机物融合群智计算》一本。
《人机物融合群智计算》简介
![]()
全球首本!人机物融合群智计算开山之作,系统化地阐明新一代「群智感知计算」内涵,并匠造出一把开启「人机物融合群智计算」新世界大门的钥匙。
本书既可以作为专著,为物联网、人工智能、工业互联网、智慧城市、智能制造等领域的科研人员和IT从业者提供创新的发展视角及相关理论、方法与技术支撑,也可以作为高年级本科生或研究生的参考教材。
![]()