本文建立的人工智能模型可以改善生活,帮助解决复杂的挑战,但我们知道,威胁行为者有时会试图滥用模型来伤害他人。这包括滥用模型来支持秘密影响力作战(IO)的人。应对这些威胁需要许多学科和组织的共同努力。OpenAI 致力于在破坏 IO 和威胁情报共享方面发挥自己的作用。
本报告调查了威胁行为者利用OpenAI产品进一步开展隐蔽在线 IO 的活动。将此类行动定义为 “在不暴露幕后行动者真实身份或意图的情况下,试图操纵公众舆论或影响政治结果的欺骗行为”。其中一些行动已广为人知;另一些行动则是OpenAI发现的。虽然OpenAI观察到这些威胁行动者使用OpenAI模型进行了一系列 IO,但他们都试图欺骗人们,让人们不知道他们是谁或他们试图达到什么目的。
调查显示,虽然这些行动背后的行动者试图使用我们的模型生成内容或提高生产力,但这些活动似乎并没有因为使用我们的服务而有意义地提高受众参与度或影响力。