一篇19家机构、100位学者联名发表的AI大模型综述论文,被指涉嫌大量段落抄袭。
此事已在国内外学术圈引起广泛关注。
事件爆出当日晚,论文第一单位智源研究院发表中英文致歉信。
承认文章中存在问题,已启动第三方独立审查,后续将进行追责。
根据智源研究院声明,这篇综述报告由智源牵头,邀请国内外100位科研人员分别撰写了16篇独立的专题文章,并单独署名。
按初步调查结果,智源决定立即从文章中删除已确认的抄袭内容,并通知所有作者对所有内容进行全面审查。
目前论文修订版已提交arXiv进行更新,
问题最早由谷歌大脑研究员Nicholas Carlini指出。
他在一篇博客文章中列举了10个涉嫌抄袭的段落,文字一致的部分用绿色标出。
同时通过收集数据初步核查, Carlini发现这篇论文还涉嫌抄袭十余篇来自其他作者的论文。
此事在社交媒体上不断发酵,引发大量关注。
随后Carlini更新了一段话,呼吁大家理性看待,不要演变成猎巫行动。
在不清楚100个作者中的具体责任人之前不要一棍子打死。
不过,ViT作者之一Lucas Beyer认为,在论文中署名就意味着要参与从创意脑暴、试验、撰写、校对的过程,承担相应责任。
被抄袭的作者之一、谷歌大脑研究员Katherine Lee给出建议:
如果需要复用文本,请使用引号明确你的意图,并注明来源
对于复用文本,Carlini认为这是一篇综述文章,并不算把别人成果说成自己的那种最恶劣的抄袭。
但综述文章的意义在于对一个研究领域的重新构建,直接复制之前的论文并不能带来新的价值。
最后,附上智源研究院致歉信中文版全文。
智源研究院致歉信:
https://www.baai.ac.cn/portal/article/index/cid/4/id/404.html
Nicholas Carlini博客文章:
https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html
— 完 —
「人工智能」、「智能汽车」微信社群邀你加入!
欢迎关注人工智能、智能汽车的小伙伴们加入我们,与AI从业者交流、切磋,不错过最新行业发展&技术进展。
ps.加好友请务必备注您的姓名-公司-职位哦~
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见~