人工智能的飞速进步和应用带来了前所未有的机遇和挑战,也将可信人工智能推向产业发展的前台。2021年,中国信通院《可信人工智能白皮书》首次系统提炼出业内较为统一的可信AI特征要素在安全鲁棒、隐私保护、公平性、可解释的大框架下,可信AI正在金融、保险、制造、医疗等领域加速落地。伴随人工智能技术底座不断夯实和大模型、AIGC 等的爆发式增长,人工智能迈出了走向通用人工智能的关键一步,2023年4月中共中央政治局会议强调“重视通用人工智能发展,营造创新生态,重视防范风险”,可信AI成为新阶段平衡创新与风险的重要技术手段。
本报告基于统一的可信AI认知维度,梳理总结可信AI技术和应用发展现状,提炼面向新阶段大模型和AIGC引发的新需求,形成以技术为保障的可信 AI评估体系和工具。全文主要观点如下:
一是归纳了可信AI发展变迁的产业技术背景,即近期算法、算力、数据基础不断夯实,人工智能固有技术风险持续放大,可信AI技术成为AI领域关键底层能力,各国也正在围绕生成式人工智能监管、人工智能伦理等推动治理。
二是梳理了现阶段可信AI四大技术方向发展情况。可信 AI 已在行业领域落实成具体产品和实践案例,总体上正从创新整合解决方案阶段迈向形成可信系统机制的阶段,完整的实践链路、健全的标准和系统机制将逐步落地。
三是概括了面向大模型和AIGC的可信AI探索,即大模型时代下可能面临的安全可信挑战,主要包括大模型的生成式攻击和防御、大模型自身的安全风险和隐患、大模型的可解释性和公平性问题等三大类。 四是构建了以技术为保障的可信AI评估体系,面向产业发展需求,构建了包括隐私保护检测、可解释性检测、公平性检测和鲁棒性检测的可信 AI检测指标体系,并提出了具体的评估内容、指标和方式,并可进一步赋能大模型与 AIGC发展。
最后,本白皮书从技术、产业、生态和监管维度对可信人工智能发展提出了建议,对趋势进行了展望,将迎来研究应用更加均衡、内在动力更加多维、外在监管更加全面的发展局面。