The rapid adoption of generative language models has brought about substantial advancements in digital communication, while simultaneously raising concerns regarding the potential misuse of AI-generated content. Although numerous detection methods have been proposed to differentiate between AI and human-generated content, the fairness and robustness of these detectors remain underexplored. In this study, we evaluate the performance of several widely-used GPT detectors using writing samples from native and non-native English writers. Our findings reveal that these detectors consistently misclassify non-native English writing samples as AI-generated, whereas native writing samples are accurately identified. Furthermore, we demonstrate that simple prompting strategies can not only mitigate this bias but also effectively bypass GPT detectors, suggesting that GPT detectors may unintentionally penalize writers with constrained linguistic expressions. Our results call for a broader conversation about the ethical implications of deploying ChatGPT content detectors and caution against their use in evaluative or educational settings, particularly when they may inadvertently penalize or exclude non-native English speakers from the global discourse.


翻译:快速采用生成语言模型带来了数字通信方面的重大进展,同时也引发了有关潜在滥用 AI 生成内容的担忧。虽然已经提出了许多用于区别 AI 和人类生成内容的检测方法,但这些检测器的公平性和鲁棒性仍未得到全面探究。在本研究中,我们使用来自英语母语和非英语母语写手的写作样本,评估了几种广泛使用的 GPT 检测器的性能。我们的研究结果表明,这些检测器不断地将非英语母语写作样本错误地分类为 AI 生成,而母语写作样本可以被准确地识别。此外,我们证明了简单的提示策略不仅可以缓解这种偏差,而且可以有效地绕过 GPT 检测器,这表明 GPT 检测器可能无意识地对具有有限语言表达能力的作家进行惩罚。我们的研究结果呼吁进行更广泛的讨论,探讨 ChatGPT 内容检测器的伦理影响,并警告在评估性或教育性环境中使用这些检测器时可能会无意间惩罚或排除非英语母语写手参与全球讨论。

0
下载
关闭预览

相关内容

知识增强预训练语言模型:全面综述
专知会员服务
93+阅读 · 2021年10月19日
专知会员服务
124+阅读 · 2020年9月8日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
11+阅读 · 2018年3月15日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月22日
Generalized Out-of-Distribution Detection: A Survey
Arxiv
15+阅读 · 2021年10月21日
VIP会员
相关VIP内容
知识增强预训练语言模型:全面综述
专知会员服务
93+阅读 · 2021年10月19日
专知会员服务
124+阅读 · 2020年9月8日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员