GPT-4一经发布激起千层浪,不难看出大模型的发展已经势不可挡,AI技术从过去的“预测推断”开始向“内容生成”方向延展,人工智能开启新时代。产业界和学术界都看到了大模型的潜力,纷纷下场。
然而,大模型的研发复杂度高,耗时长,对算力资源的消耗需求巨大。在“狂飙”的大模型时代,如何让更多人享受科技红利?我们看到一些大企业正在行动。
2020年3月,华为开源了昇思 MindSpore全场景AI框架,原生支持大模型训练,充分考虑大模型开发时可能会遇到的内存、通信、调试、部署等问题,提供业界领先的全自动并行能力,一行代码即可实现模型自动切分、分布式并行计算,使得大模型开发并行代码量降低80%、系统调优时间下降60%;极致的全局内存复用能力,极大降低大模型训练成本;极简的断点续训能力,解决大集群训练故障导致的任务中断问题,实现自动恢复、继承性训练,开发者无需从头开始,千亿参数模型在分钟级就可无损恢复。
AI框架作为人工智能的“魂”,其上承应用下接算力,帮助产业界和学术界降低大模型研发门槛,提升大模型研发效率。基于昇思MindSpore框架,中科院自动化所、武汉大学和华为诺亚团队等先后发布业界首个图文音三模态大模型紫东.太初,全球首个智能遥感框架及数据集武汉.LuoJia和业界首个基于扩散模型和最大开源中文数据集生成的中文生图大模型悟空.画画。
有了大模型,将大模型能力开放给开发者也非常重要,昇思MindSpore没有忽视这一点。在2022年推出了首个基于国产算力和框架、服务全球开发者的一站式大模型平台——昇思大模型平台,开发者不仅可以在线调用大模型推理服务,还可以在线使用大模型微调组件,打造基于行业大模型训练场景化模型。
(传送门:https://xihe.mindspore.cn)
恰逢昇思MindSpore开源三周年之际,昇思大模型平台为开发者带来了全新升级:
为提升开发者的参与感和趣味感,平台在原有的大模型在线体验模块,开放了业界首个基于悟空.画画以文生图大模型的技术社交互动能力,开发者可随心分享模型生成的优质画作;
为提升开发者在线编程体验,平台打造Jupyter与MindSpore transformers特性模块,提供pipeline高阶易用接口简化代码,开发者无需下载安装,一键便可开启AI模型创新之旅,几行代码即可体验业界SOTA transformers模型。
除此之外,平台还用心升级了首页视觉和移动端适配,提供免费多样的算力、优质的大模型课程资源、易用的样例Demo和丰富的大赛活动,一站式贴心服务帮你玩转AI大模型!
自2021年以来,昇思MindSpore携手伙伴推出了全球首个2000亿参数中文 NLP大模型 “鹏程.盘古”,全球首个三模态大模型 “紫东.太初”,打造了面向生物医学领域的人工智能平台“鹏程.神农”,全球首个遥感影像智能解译专用框架“武汉.LuoJiaNet”,业界最大遥感样本库武汉.LuoJiaSET,使用中文亿级文图数据进行训练的“悟空.画画”等20余个创新模型。为普惠AI开发,助力AI产业化发展,昇思大模型平台在去年上线后开放“悟空.画画”“紫东.太初”“ 武汉.LuoJia”的大模型能力。
自2022年的一幅AI作画的作品获奖后,AI作画潮流席卷全球。在昇思大模型平台,即使是没有画画基础的用户,也能用简单的提示词在悟空.画画“画”出大片了。
这次平台升级后,首次开放AI画廊模块,用户只要点击“AI画集”按钮,就可以查看海量开发者基于悟空.画画生成的图片,小编再也不用头(花)疼(钱)为排版文章找图片了:
小编惊喜地发现,点开这些基于悟空.画画生成的图片,均可做下载、分享、收藏、点赞等互动操作,大家可以尽情展示和使用自己的AI作品,增强用户体验和社交互动。
这些AI图片质量较高,不仅为设计师提供创作灵感,也能让普通用户也能了解和体验艺术之美,真正地让AI与人类携手展示艺术的创新。
立即体验艺术之美:
https://xihe.mindspore.cn/modelzoo/wukong/album
另外,悟空.画画大模型体验功能迎来全新升级,用更简单的形容/描述创作出更优质、精美的画作,使用更便捷,更易于上手。
小编上手试了试本次升级后的效果,点击“在线体验”,输入提示词:悬崖、美景、瀑布。
有 20 多种绘画风格供挑选,小编选了“新海诚”得到两张AI图片,效果不错:
在线体验悟空.画画:https://xihe.mindspore.cn/modelzoo/wukong
AI大模型浪潮下,模型是否开源、数据集是否丰富、训练应用成本等是开发者尤为关注的点。昇思大模型平台提供一站式服务,将平台集模型选型、在线推理、在线训练集为一体,支持Gradio项目可视化推理、在线进行迁移学习,并提供多种免费异构算力,如:Ascend、CPU、GPU等,助力开发者轻松开启AI之旅。
例如在“AI实验室”模块中,我们可创建自己的项目空间,支持在线训练和推理可视化,覆盖多领域任务,让开发者体验全流程开发。现在又新增了Jupyter Lab在线编程和集成MindSpore Transformers,让AI大模型的门槛变更低了。
(1)Jupyter Lab在线编程,预装丰富,零基础也能玩
Jupyter Lab是一个在浏览器中使用的交互式的笔记本,可以将代码、文字完美结合起来,用于机器学习、数据分析等领域。
之前大伙使用它时可能需要下载安装到本地,现在只要来昇思大模型平台,一键开启,就可以云上开发!
在“AI实验室”页面点击“打开Jupyter”按钮,可以看到Jupyter已经集成了大量的MindSpore相关套件和常见的科学库依赖。
轻松点击“启动”就可以创建自己的应用了,小编试用了下,平台对零基础入门也很友好!
当然,如果你是数据科学家,也可以轻松开发数据应用,如Matplotlib画热力图:
(2)集成MindSpore Transformers,让大模型开发更极简易用
MindSpore Transformers是基于昇思MindSpore的深度学习大模型开发套件,是一个用于构建大模型训练、微调、评估、推理、部署的全流程开发套件。提供业内主流的Transformers类预训练模型和SOTA下游任务应用,涵盖丰富的并行特性,帮助用户轻松实现大模型训练和创新研发。
目前Jupyter集成MindSpore Transformers,可支持下载和加载类Transformer和SOTA模型,并支持Pipeline推理,目前支持众多任务。简单几行代码就能玩转Transformer大模型,绝不能错过!
在Jupyter里,轻松运行MindSpore Transformers Pipeline:
几行代码即可解决
(3)插件丰富, 集成Gradio让推理可视化
Jupyter集成了Formatter、Debugger、Git、Lsp等插件,提高开发者研发效率,带来绝佳的用户体验,如断点调试也不在话下:
还可以在Jupyter中写Gradio代码,快速创建AI小应用:
对于开发者来说,原来模型开发从环境部署安装,再到训练验证,往往需要花费几天甚至一两周的时间。通过本次昇思大模型平台升级,开发者无需任何安装部署,现在只要几分钟就能在线体验大模型开发,快速实现创意落地。
从开放大模型能力,到提高开发者的开发体验,我们看到昇思MindSpore始终坚持以开发者为本,为提高开发者体验不留余力。
开发者作为创新的活水,昇思MindSpore积极拥抱开发者,便于开发者线上线下交流与学习,打造学习成长型社区。本次昇思大模型平台升级贴心为开发者提供课程模块,帮助开发者从入门到精通,深入浅出玩转昇思MindSpore。小编浏览了课程信息,在首页有AI大模型、计算机视觉、深度学习入门等课程,且均为免费学习,可以说超级宠粉了!
值得一提的是,昇思大模型平台特设比赛模块,定期开展AI相关的大赛,赛题涵盖AI基础领域如图像分类、文本分类、目标检测、风格迁移等,比赛形式多样,种类繁多。比赛还提供组队,提交结果,实时评分,排行打榜等功能。每年除了常规比赛以外,还开展特色比赛,例如正在进行中的“象牙之塔-AI画家大赛”,便是贴近当前热点技术,通过以赛促学、以赛促创的模式来助力AI人才的培养。
此外,平台还打造业界首个大模型产业专区,包括电力专区、工业专区等。配合专区开发,平台将面向企业开发者提供从模型训练、推理到部署的AI应用开发专区,将开放企业课程、企业领域赛事,并提供多种免费异构算力,全面提升平台产业专区易用性,助力企业开发者快速开发AI应用,欢迎更多企业加入,与我们一同将大模型赋能千行百业。
除了本身技术模块的升级,平台也在积极增进与外部开源社区的联结,拓展海内外大模型生态。通过在Hugging Face社区上线首个基于国产算力的MindSpore专区,让开发者在Hugging Face上可体验所有昇思大模型推理服务,同时,成功对接Hugging Face Inference API,支持在Hugging Face 体验MindSpore模型加载与运行,开发者可直接在线上传MindSpore模型体验推理服务。未来,平台还将提供算力弹性调度模块,让更多计算中心能够无缝接入,为开发者开放更多的算力,使能大模型的开发与训练。
CSDN认为,如今 AI技术日新月异,开发者机遇与挑战并存,如何跟上技术潮流发展成为开发者的必答题。昇思大模型平台对开发者开放创新大模型,帮助开发者的创意快速落地,提供趁手易用的平台来提升开发效率,降低大模型开发门槛,让 AI 惠及全社会,促进AI产业的蓬勃发展。
点击阅读原文,立即体验昇思大模型平台吧!