百人联名AI大模型综述论文被指抄袭，智源研究院致歉：承认存在问题，立即删除修订，后续追责到人

会员服务 ·

百人联名AI大模型综述论文被指抄袭，智源研究院致歉：承认存在问题，立即删除修订，后续追责到人

2022 年 4 月 14 日 量子位

梦晨发自凹非寺
量子位 | 公众号 QbitAI

一篇19家机构、100位学者联名发表的AI大模型综述论文，被指涉嫌大量段落抄袭。

此事已在国内外学术圈引起广泛关注。

事件爆出当日晚，论文第一单位智源研究院发表中英文致歉信。

承认文章中存在问题，已启动第三方独立审查，后续将进行追责。

根据智源研究院声明，这篇综述报告由智源牵头，邀请国内外100位科研人员分别撰写了16篇独立的专题文章，并单独署名。

按初步调查结果，智源决定立即从文章中删除已确认的抄袭内容，并通知所有作者对所有内容进行全面审查。

目前论文修订版已提交arXiv进行更新，

事件经过

问题最早由谷歌大脑研究员Nicholas Carlini指出。

他在一篇博客文章中列举了10个涉嫌抄袭的段落，文字一致的部分用绿色标出。

同时通过收集数据初步核查， Carlini发现这篇论文还涉嫌抄袭十余篇来自其他作者的论文。

此事在社交媒体上不断发酵，引发大量关注。

随后Carlini更新了一段话，呼吁大家理性看待，不要演变成猎巫行动。

在不清楚100个作者中的具体责任人之前不要一棍子打死。

不过，ViT作者之一Lucas Beyer认为，在论文中署名就意味着要参与从创意脑暴、试验、撰写、校对的过程，承担相应责任。

被抄袭的作者之一、谷歌大脑研究员Katherine Lee给出建议：

如果需要复用文本，请使用引号明确你的意图，并注明来源

对于复用文本，Carlini认为这是一篇综述文章，并不算把别人成果说成自己的那种最恶劣的抄袭。

但综述文章的意义在于对一个研究领域的重新构建，直接复制之前的论文并不能带来新的价值。

最后，附上智源研究院致歉信中文版全文。

智源研究院致歉信：
https://www.baai.ac.cn/portal/article/index/cid/4/id/404.html

Nicholas Carlini博客文章：
https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html

— 完 —

「人工智能」、「智能汽车」微信社群邀你加入！

欢迎关注人工智能、智能汽车的小伙伴们加入我们，与AI从业者交流、切磋，不错过最新行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

登录查看更多

相关内容

大模型

关注 215

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

AAAI 2022接收论文列表发布，1349篇论文都在这了！

专知会员服务

146+阅读 · 2022年1月11日

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

首篇《后门学习综述》论文发布，阐述AI系统训练过程的安全性问题

专知会员服务

30+阅读 · 2020年11月21日

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

专知会员服务

40+阅读 · 2020年10月27日

哈佛大学Miguel Hernan科学家最新2019年《因果推断:概念与方法》书稿终版，280页讲解因果效应（附下载）

专知会员服务

110+阅读 · 2019年12月14日

百余大佬署名AI论文被爆抄袭！智源现已致歉

极市平台

0+阅读 · 2022年4月14日

百位学者署名的大模型综述研究被质疑「抄袭」，智源研究院官方发布致歉信

机器之心

0+阅读 · 2022年4月14日

本科生论文综述被剽窃，但不想与导师撕破脸，Reddit上求助网友

新智元

0+阅读 · 2022年2月6日

已删除

CVer

3+阅读 · 2021年12月15日

已删除

将门创投

14+阅读 · 2019年5月29日

基于压缩感知与重采样技术的NMR噪声抑制新方法

国家自然科学基金

0+阅读 · 2014年12月31日

面向众包恶意炒作的早期检测技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

双相障碍工作记忆损害的海马相关记忆环路机制初探

国家自然科学基金

0+阅读 · 2012年12月31日

人工耳蜗植入者汉语普通话音调识别和音乐感知的试验研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向海量文本数据的社会网络系统演化性与计算方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

A Roadmap for Big Model

Arxiv

1+阅读 · 2022年4月20日

Experimental twin-field quantum key distribution with flawed and correlated sources

Arxiv

0+阅读 · 2022年4月18日

Machine Reasoning Explainability

Arxiv

14+阅读 · 2020年9月1日

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction

Arxiv

11+阅读 · 2019年9月23日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

VIP会员