机器之心原创
在今日举行的百度 WAVE SUMMIT+2022 深度学习开发者峰会上,百度产业级深度学习开源开放平台飞桨以及产业级知识增强大模型文心均迎来了重大升级,其中大模型的产业化路径和文心行业大模型的实践成为峰会的焦点。
从 BERT 和 GPT-3 发展至今,大模型已然成为当前 AI 发展的重要方向。大模型增强了 AI 的通用性,构筑了 AI 技术和应用的坚实基座。在这股不可阻挡的大模型发展潮流中,各家大厂纷纷投入大量资金、人才和配套服务,从数据、算法和算力多方面推进大模型的研制、训练和建设。
行业的投入使大模型迎来显著进展,千亿甚至万亿参数的大模型陆续出现,覆盖了 NLP、CV 和跨模态等领域。然而,只有落地才能实现大模型的价值。各家不断探索大模型落地的新方法、新模式,作为国内 AI 领域的领头羊,百度持续发力自身文心大模型体系,形成产业级和知识增强两大核心特性。
今年 5 月,百度提出了要构建更适配应用场景的模型体系,最亮眼的发布就是业界首发两个行业大模型 —— 国网 - 百度 · 文心和浦发 - 百度 · 文心。此后行业大模型成为文心着力的重点,7 月推出世界首个航天领域大模型 ——航天 - 百度 · 文心。近日又相继推出传媒行业大模型——人民网 - 百度 · 文心、影视行业智感超清大模型——电影频道 - 百度 · 文心、智慧城市领域大模型——冰城 - 百度 · 文心。
百度并没有止步于此,而是致力于将大模型应用拓展到更广泛的行业领域。在 11 月 30 日举行的 WAVE SUMMIT+ 2022 深度学习开发者峰会上,百度文心产业级知识增强大模型全景图迎来升级,在全新发布的 11 个大模型中,包括 5 个行业大模型,分别是泰康 - 百度 · 文心、深燃 - 百度 · 文心、吉利 - 百度 · 文心、TCL - 百度 · 文心以及辞海 - 百度 · 文心。
在仅仅半年的时间里,百度文心行业大模型的数量已经达到了 11 个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,进一步丰富了行业大模型的应用场景,在产业化落地的过程中使大模型真正赋能千行百业。
更多行业大模型的发布彰显出百度文心大模型践行自身产业级特性的决心,无论是从如今行业大模型的数量还是覆盖行业范围而言,百度显然已经初步形成自身大模型产业化落地的行业布局。
在峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。
契合场景需求、加速 AI 落地,文心行业大模型不断壮大
大模型的发展从来不是一蹴而就的,从数据采集到模型开发、训练、推理部署再到最后的落地,关关难过但又必须过。在实现落地的最后一环上,研发契合场景需求的行业大模型成为业界采取的主要发展模式,而正是百度开启了先河。
文心行业大模型植根于文心大模型,在 NLP、CV 和跨模态等基础通用大模型掌握通识知识的基础上,对行业知识、数据、经验和任务进行更深入的了解,达到在特定行业、特定应用场景中的性能最优。文心行业大模型的打造,就是要解决大模型与应用场景之间的鸿沟。
百度通过联合头部企业和机构,秉持「从产业中来,到产业中去」,不断将大模型技术融入到更多行业和应用场景中。在这一过程中,文心行业大模型逐渐形成自己的核心特色 ——行业知识增强。
一方面,基于通用的文心大模型挖掘特定行业应用场景中大量存在的行业特色数据和知识,进行大规模无监督的联合训练;另一方面,与行业专家一起探讨,引入行业实际业务积累的样本数据和特有知识,并在训练中结合业务经验,设计行业领域特色算法,使最终训出的行业大模型适配性更强,切实解决真实场景问题。
特定行业数据、知识以及经验的加入,使得通用文心大模型真正做到了与行业的融会贯通,其能力的发挥也更加地有的放矢。
对于合作企业、机构而言,加入行业特色数据与知识、精准匹配真实应用场景的行业大模型能够极大提升业务流程效率和水平。
以百度联合吉利发布的知识增强的汽车行业大模型 ——吉利 - 百度 · 文心为例,它基于文心 NLP 大模型 ERNIE 3.0,结合了吉利汽车专业领域行业数据(汽车领域媒体知识、客服工单、法律法规以及汽车售后维修手册)进行预训练,充分理解掌握汽车行业知识,得到性能更强、稳定性更高的汽车领域大模型。
目前,吉利 - 百度 · 文心已经应用于吉利的智能客服系统、车载语音系统和汽车领域知识库构建等业务场景中,实现显著的业务效率提升。随着将大模型等 AI 前沿技术应用于更多汽车业务中,双方还将以吉利 - 百度 · 文心大模型为通用底座,进一步支撑吉利在智能车机、知识资产管理和用户运营与智能营销等场景实现智能化升级。
同样,其他四个新发布的行业大模型在对应的行业应用场景中也实现了任务效果的显著提升。但影响远不止此,文心大模型具备强泛化能力,因此除了适配已展示任务之外,将来可能针对更多相关领域任务进行训练微调,从而加速大模型在整个行业的落地,发挥更大的行业价值。
从开启先河到体系初成,文心行业大模型内外两手抓
随着业界越来越认可行业大模型的发展模式,趋同在所难免,因此发展自己的核心竞争力尤为重要。
在百度看来,行业大模型是结合行业落地过程中非常重要且有效的方式,今年以来陆续发布的 11 个行业大模型即是最好的例证。对于行业来说,它们得到 AI 技术力量的加持;对于文心大模型的建设来说,行业的反哺使得整个体系更强,基础通用大模型能力也得到提升。
至于百度文心行业大模型如何保持优势?我们可以从「内秀」和「外拓」这两个建设思路具体分析。
所谓「内秀」,即百度自身技术能力的持续积累。一方面,百度有自研的深度学习平台 ——百度飞桨,包括其上开发、训练、推理部署的能力、高效的工具与组件、广泛的硬件适配和生态等,所有这些为包括行业大模型在内的文心大模型提供支撑;另一方面,行业大模型自身也具有强沉淀性,它建模了大量的行业数据和知识,在整个应用过程中,又由应用反馈带来持续训练和进化,能力愈来愈强。
所谓「外拓」,即百度联合各行各业的头部企业、机构,不断寻找与产业场景需求高度契合的领域,拓展行业大模型可能产生助益的范围,在与合作伙伴的深入技术交流和合作中充分释放大模型的价值。
飞桨平台支撑文心大模型,加速产业智能化升级
在模型层,除了行业大模型之外,此次升级的百度文心大模型全景图中还新增了 5 个基础大模型,它们分别是知识增强轻量级大模型 ERNIE 3.0 Tiny、跨模态理解大模型 ERNIE ViL 2.0、跨模态生成大模型 ERNIE ViLG 2.0、文档智能大模型 ERNIE-Layout 和单序列蛋白质结构预测大模型 HelixFold-Single;1 个任务大模型,即代码大模型 ERNIE-Code。
全面释放大模型的效能、让开发者方便快捷地使用文心大模型,配套的开发套件、平台和 API 必不可少。因此,此次文心大模型在工具与平台层也进行了一系列更新,让大模型与使用者之间连接的更紧。
开发套件全面升级,提供开箱即用的场景化建模工具,首发产业级行业大模型定制工具,提供更为丰富的模型精调工具,以及大模型可信学习工具;
文心 API 服务支持多种模型尺寸的精调,体验专区提供更多可体验能力,同时基于大规模集群算力分布式推理加速能力,可满足大规模高性能产业级调用;
飞桨企业版 EasyDL 零门槛 AI 开发平台和 BML 全功能 AI 开发平台,升级提供全流程开箱即用的大模型能力。EasyDL 零门槛 AI 开发平台预置了各种通用任务场景的大模型,使 AI 应用开发者获得更好的模型训练效果;BML 全功能 AI 开发平台实现大模型训练加速、场景建模、应用集成,让大模型的落地像流水线一样高效。
此前,为了充分开拓大模型的创意与探索空间,百度推出了基于文心大模型的创意社区 ——旸谷大模型创意与探索社区,将智能化能力带到各行各业以及所有人的面前。此次文心大模型在产品与社区层又收录了 2 个大模型应用产品,分别是文心一格和文心百中。
文心一格是基于文心大模型的业界首个 AI 艺术和创意辅助平台,于今年 8 月推出。用户使用自然语言输入创想,即可完成别具一格的画作。文心一格在创作风格上多变,支持插画、科幻、动漫风以及中国风骨的画作。现在文心一格的能力又得到了更多升级,支持以图生图、支持可控的增删改等图片二次编辑、一键生成视频,进一步激发了用户的创造力,降低内容生产成本。
文心百中是百度搜索与文心大模型联合研制的基于大模型的产业级搜索系统,寓意为搜得准确,百发百中,具有极简、强大以及高效三大特性。首先与传统级联式的搜索系统不同,文心百中以文心大模型为支撑,在系统和应用方法上简约化;其次语义理解能力强大,采用大模型机制后在多词、转义等多个方面效果显著,并在问答、搜索等场景提升明显;最后高效表现在基于大模型的搜索系统大幅降低了人力成本和数据成本。
加强大模型技术突破,联合研制行业大模型,并建设配套的工具平台和应用,这是大模型产业实践过程中重要的一个方面。同时,支撑大模型开发、训练和推理部署的深度学习平台也在持续进化。
飞桨升级让大模型性能更强、应用更便捷
如果没有飞桨支持,文心大模型就成了「无源之水、无本之木」。作为产业级深度学习开源开放平台,飞桨集核心框架、产业级模型库、开发套件、工具组件以及学习和实训社区于一体,能够标准化、自动化地支撑模型生产和应用。在 WAVE SUMMIT+ 2022 峰会上,飞桨生态也带来了最新进展:截至目前,飞桨已凝聚 535 万开发者,服务 20 万家企事业单位,基于飞桨创建了 67 万个模型。
今日飞桨平台也迎来升级,在技术创新、功能体验和生态建设三个方面持续发力,坚定平台的产业级特性,引领大模型训练和推理核心技术创新,联动上下游龙头企业共创繁荣生态,加速产业智能化升级。
具体地,飞桨开源框架推出最新的 2.4 版本,围绕开发、训练及推理部署进行创新。在开发训练方面,飞桨动静统一的开发范式以及自适应分布式架构实现了大模型的灵活开发和高效训练。
在推理部署方面,飞桨支持大模型高效推理,并提供服务化部署能力。而为了适配更多场景、更苛刻环境和更极致推理性能,飞桨利用计算融合等方式进行全方位性能优化,并通过软硬协同的稀疏量化进一步加速。同时飞桨提供了蒸馏裁剪等丰富的压缩策略,将模型进一步小型化,实现高效部署。
新发布的全场景高性能 AI 部署工具 FastDeploy 解决大模型部署中的痛点问题。FastDeploy 覆盖多端、边和云场景的支持,加之大量简单易用的设计,在性能上做了极致优化。最核心的是将大模型的压缩能力和推理引擎的推理能力无缝衔接,实现压缩和推理的协同。
为了让大模型产业落地更高效便捷,飞桨提供全套的产业化工具与平台,支持大模型的多样化应用。
一方面新发布了大模型训推一体开发套件 PaddleFleetX,让大模型的全流程研发更加便捷高效。大模型的开发、训练、小型化和推理对框架有很多不同的要求,因此 PaddleFleetX 开发套件瞄准了大模型的全流程,与飞桨的核心框架层及一系列底层能力全面对接,打通整个流程,在体验上实现升级。
另一方面,飞桨企业版 AI 开发平台 EasyDL 和 BML 也围绕大模型的技术应用进行了全新升级。在 EasyDL 零门槛 AI 开发平台预置了各种通用任务场景大模型,可以让 AI 应用开发者获得更好的模型训练效果。在 BML 全功能 AI 开发平台上,端到端的并行训练优化方案大幅提升了大模型训练性能;预置的基于大模型的场景模型生产线,让开发者在主流的场景开箱即用,快速构建大模型场景应用;新增的自动化推理服务监控能力,及时感知变化和问题,驱动反馈和迭代,让 AI 应用的高效迭代闭环。
无论是文心大模型还是飞桨平台的升级,百度正朝促进产业智能化这一方向前进。王海峰博士曾发表观点称,深度学习正推进人工智能进入工业大生产阶段。此后得益于深度学习的突破以及自身飞桨平台的建设与发展,人工智能开始广泛实现产业落地,与产业结合的深度和广度不断拓展。同时随着大模型为人工智能发展带来新的机遇,开始引领深度学习平台的发展方向,并在今年迈入产业落地的关键年。
百度一方面持续升级飞桨平台,在技术、场景和生态领域齐头并进,逐渐打造成为中国最强的开源开放深度学习平台,为 AI 的产业化落地打下坚实的基础;另一方面推出产业级知识增强文心系列大模型,并与头部企业、机构合作打造行业大模型,在促进这些企业业务效率提升的同时,通过向相关领域更多业务的能力泛化,进而实现整个产业的智能化升级。
可以这么说,飞桨深度学习平台和文心大模型已经组成一个完整、体系化的基础平台,未来持续的升级与迭代必将为产业智能化升级提供全方位支撑。
正如王海峰博士所说,「深度学习平台 + 大模型的布局贯通从硬件适配、模型训练、推理部署到场景应用的 AI 全产业链,夯实产业智能化基座,进一步加速产业智能化升级。」
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com