随着众多国内外公司纷纷推出各种大规模模型,包括通用大模型、行业大模型、垂直大模型以及专属大模型,这些超强模型服务的背后都是基于拥有千亿或万亿参数的基础模型。大模型的诞生标志着人工智能领域取得了重大进展,可以在各种任务中实现更高的准确性,降低了应用开发的门槛,并增强了模型的泛化能力。这些因素共同催生出新的场景和产业模式,并加速产业智能化应用落地的进程。
一、大模型技术应用不断演进,迎来发展新机遇
随着ChatGPT这一对话生成式预训练变换模型的诞生,大模型进入一个快速发展的时代。这些超强模型服务背后是拥有千亿或万亿参数的基础模型,它们通过学习丰富的知识,成为与人类进行交互以及连接万物的强大工具。
通用大模型的发展
自2016年Open AI发布Gym强化学习平台以来,模型参数从GPT-1的1.17亿开始,经过不断迭代,增长到GPT-4的1.76万亿的参数规模,通用大模型的性能也得到显著提升。
斯坦福大学的研究发现,GPT-3已经可以解决70%的心智理论任务,相当于7岁儿童;至于GPT3.5,更是解决了93%的任务,心智相当于9岁儿童!2022年11月,ChatGPT正式发布,是基于GPT-3.5架构并通过强化学习训练后的大语言模型,目前仍以文字方式互动,支持包括自动文本生成、自动问答、自动摘要等多种任务。
自2017年6月以来,Google陆续发布了BERT、T5等预训练模型,参数规模也在逐步提升。近期,Google发布的通才模型PaLM-E包含5620亿参数,可用于控制机器人,为通用人工智能(AGI)的实现提供了可能。
Google PaLM-E 大模型控制机器人
二、MaaS 支持大模型应用落地全流程能力构建
MaaS(模型即服务)提供一套完整的大模型服务工具链和开放平台,允许行业用户基于行业基础大模型,利用整体模型套件经过微调再训练,生成满足特定场景需求的专属大模型。与提供基础设施的IaaS(基础设施即服务)、提供工具的PaaS(平台即服务)和提供软件的SaaS(软件即服务)不同,MaaS以模型作为交付产品。
基于MaaS构建的一站式行业大模型构建和应用解决方案,围绕模型的生命周期提供各种的产品和技术辅助,行业用户实现从数据预处理、模型构建、模型训练、模型评估到模型服务全流程能力构建。MaaS解决了企业构建行业大模型成本高、时间长、难度大的问题,降低数字化转型的成本和风险,支撑客户快速实现大模型应用的产品化和商业化,更快地实现数字化转型和升级。
MaaS 解决方案
三、场景化需求快速推动大模型价值释放
随着技术能力的提升和多样化场景需求的推动,大模型已成为人工智能领域最重要的动力源泉。不仅推动人工智能从技术积累、行业应用和产业变革,更是赋能千行百业的基础设施。
大模型在场景中的应用
四、行业大模型应用落地亟需建设路线指引
通用大模型在满足行业用户直接需求方面存在一定难度,主要是由于模型参数量巨大,训练和部署对算力消耗巨大,导致成本高昂;其次,模型的可解释性仍然较弱,通常需要增加内容管控手段来保证结果的安全性;最后,模型对训练数据的依赖性较强,对于超出训练数据的任务效果不尽如人意。更重要的是,在某些特定行业,通用基础大模型的表现并不理想,因此行业大模型应运而生。
行业大模型通常基于该行业领域的数据进行训练和优化,更好地理解和处理该行业的专业术语、规范和语义。行业大模型更加专注于某个特定的行业,满足对应行业的需求。目前的产业解决方案中,行业大模型结合自身在算力方面的优势,为行业模型训练提供强大的支持和动力,助力构建专属大模型及智能应用。然而,行业大模型最终要在真实场景中落地并达到理想的服务效果,需要充分解决行业用户的痛点。目前行业用户面临的问题主要包括计算资源不足、数据质量差、投入成本较高以及缺乏专业人才等突出问题。
报告来源:新华社品牌工程&凯度&牛津大学
报告部分内容展示:****************
****************