近年来,人工智能技术接连取得突破,尤其是在强化学习、大规模语言模型和人工智能生成内容技术等方 面,正逐步成为各个行业的创新驱动力。OpenAI于 2022年 11月 30日发布的 ChatGPT由于具有惊人的自然语言理 解和生成能力,引起全社会大范围的关注,成为全球热议的话题,并被广泛应用于各个行业。仅两个月后,ChatGPT 的月活跃用户数便达1亿,成为史上用户数增长最快的消费者应用。鉴于ChatGPT目前造成的影响,对其进行全面 的分析较为必要。本文从历史沿革、应用现状和前景展望这3个角度对ChatGPT进行剖析,探究其对社会的影响、技 术的原理和挑战以及未来发展的可能性,并从模型能力的角度简要介绍 GPT-4相对于 ChatGPT的改进。作为一个 现象级技术产品,从技术角度而言ChatGPT对相关领域具有里程碑式的重要意义,从应用角度而言其可能会给人类 社会带来巨大的影响。ChatGPT有潜力成为计算机领域最伟大的成就之一。但就目前而言,ChatGPT仍然存在一些 局限,尚未达到强人工智能的水平。在当前阶段,研究人员需要对人工智能技术持有自信和谦虚学习的态度,继续 发展相关的技术研究和应用。在人工智能时代,人工智能技术已经普及到许 多行业,为底层技术赋能升级,并在各种应用场景中 发挥着重要作用。其中,最常见的应用场景包括自 然语言处理、计算机视觉、推荐系统以及预测分析 等。
人工智能技术在持续提高和改进,并不断冲击 着人类的认知。 2012年,ImageNet图像识别比赛中,一种神经网 络模型(AlexNet)(Krizhevsky 等,2017)首次展现了 明显超越传统方法的能力。2016年,AlphaGo(Silver 等,2016)战胜了围棋世界冠军。在那之前,人们普 遍认为这个古老的中国棋类游戏由于具有过高的复 杂性而难以被人工智能系统模拟。2017 年,Google 的 Vaswani等人(2017)提出 Transformer 深度学习模 型架构,奠定了当前大模型领域主流的算法架构基 础。2018 年,谷歌提出了大规模预训练语言模型 BERT (bidirectional encoder representations from transformers)(Devlin等,2019),该模型是基于 Transformer 的双向深层预训练模型,其模型参数首次超 过了 3亿规模(BERT-Large约有 3. 4个参数);同年, OpenAI 提出了生成式预训练 Transformer 模型—— GPT(generative pre-training)(Radford等,2018),大大 地推动了自然语言处理领域的发展。2018年,人工 智能系统 OpenAI Five(Berner 等,2019)战胜了世界 顶级的 Dota 2 人类队伍,人工智能在复杂任务领域 树立了一个新的里程碑;此后,Google DeepMind 团 队提出的AlphaFold(Jumper等,2021)以前所未有的 准确度超越了人类研究者在蛋白质结构预测上的表 现,突破了人们对人工智能在生物学领域的应用的 想象。2019 年,一种人工智能系统 AlphaStar(Viny⁃ als 等,2019)战胜了世界顶级的 StarCraft II 人类选 手,为人工智能在复杂任务领域的未来发展提供了 更加强有力的支持。2020年,随着OpenAI GPT-3模 型(Brown 等,2020)(模型参数约 1 750 亿)的问世, 在 众 多 自 然 语 言 处 理(natural language processing, NLP)任务中,人工智能均表现出超过人类水平的能 力。2021 年 1 月,Google Brain 提出了 Switch Trans⁃ former模型(Fedus等,2021),以高达1. 6万亿的参数 量成为史上首个万亿级语言模型;同年 12 月,谷歌 还提出了 1. 2亿参数的通用稀疏模型 GLaM(Du等, 2022),在多个小样本学习任务的性能超过 GPT-3。 2022年 2月,人工智能生成内容(artifical intelligence generated content,AIGC)技 术 被《MIT Technology Review》评选为 2022年全球突破性技术之一。同年 8月,Stability AI开源了文字转图像的Stable Diffusion 模型(Rombach等,2022)。同样在8月,艺术家杰森· 艾伦(Jason Allen)利用AI工具制作的绘画作品《太空 歌剧院》(Théâtre D’opéra Spatial),荣获美国科罗拉 多州艺术博览会艺术竞赛冠军,相关技术于年底入 选 全 球 知 名 期 刊《Science》年 度 科 技 突 破(Break⁃ through of the Year 2022)Runners-up 第 2 位(https:// www. science. org/content/article/breakthrough-2022)。
近几年,自然语言处理技术逐渐成为了各个行 业关键的创新驱动力。其中 2022 年 12 月公布的 ChatGPT 则是生成式人工智能技术的佼佼者,几乎 可以赋能各个行业。随着人工智能技术的不断提 高,ChatGPT 作为一种先进的语言模型受益于更大 的模型尺寸、更先进的预训练方法、更快的计算资源 和更多的语言处理任务。因此,它已广泛应用于各 行各业,并成为全球热议的话题。本文将尝试剖析 ChatGPT,评估其舆论影响力 和应用现状,归纳其特性;简要分析其背后的技术原 理,探讨其可扩展性;评估其存在的技术挑战及局 限,讨论其未来的发展和应用前景,并从模型能力的 角度简要介绍GPT-4相比于ChatGPT的改进