中文「大大大大大」模型开源开放!从吟诗作画写代码到蛋白质预测全都有,源代码可编程API均奉上

2022 年 11 月 4 日 THU数据派


  
  
    
来源:量子位

  本文为约2520字,建议阅读5分钟

本文介绍 了国内AI工业界和学界联合推动诞生的国内第一个MaaS社区——魔搭。


中文领域的“大大大大大”模型,开源开放了!


一口气10+个大模型联手登场,能写诗、写作文、写代码,还能画画、做视频、看图说话。



戳进主页,不仅代码可下载,Notebook、在线Demo也已就位。



直接就是在线可玩开箱即用


炼丹师福音还不止如此。


在这个名为魔搭ModelScope的开源社区里,你甚至可以1行代码就实现模型推理


一行pipeline完成模型推理

10行代码搞定调优训练(finetune):



不得不说,这波开源有点东西。



如此大手笔,确实也并非哪家研究机构的SOLO,而是由国内AI工业界和学界联合推动:阿里达摩院与CCF开源发展委员会共同发起,首批合作机构包括澜舟科技、智谱AI、深势科技、中国科学技术大学、浙江大学等,阵容蔚为壮观。


更多细节,咱们一起研究研究。


以模型为核心的中文AI开源社区


要说魔搭ModelScope有何不同之处,答案其实就在社区名字里:以模型为中心,搭建AI应用服务


因此社区刚成立,就已经有300+模型上线,其中包括10多个大模型和150+ SOTA模型。并且其中1/3都支持中文。


就说最近大火的AI画画,在模型库里一搜,就能找到对应的模型。



点进可体验的通义-文本生成图像大模型,即使你完全是AI小白,也能直接体验。


比如让AI生成一张“小鸡戴墨镜唱歌跳舞”的图片。



结果是这样的:



还有更潮酷的。


输入“一张柯基犬在时代广场骑自行车的照片。它戴着墨镜和沙滩帽”,就能得到:



你想要什么样的图片?自己来试试吧,下面是传送门



红极一时的GPT-3中文复刻版也在魔搭社区上架了,写起古诗来可谓有模有样。



在AI for Science方面,“中国版AlphaFold2”——深势科技的Uni-Fold同样亮相魔搭。


输入蛋白质单体的一级结构,就能线预测蛋白质的三级结构啦。



此外,会写爽文、以10亿参数轻量化模型登顶CLUE(中文语言理解榜单)的澜舟科技孟子系列模型,智谱AI同时支持101种语言的预训练模型……都能在魔搭上找到并体验。


并且正如前文所说,魔搭提供的不仅仅是模型下载和使用,还把环境安装、推理验证、训练调优、模型部署的一站式服务都搭好了


环境安装方面,魔搭支持本地环境快捷安装,提供了Python whl包安装和源码安装。


同时也支持云端Notebook免安装,一键就能开启在线Notebook实训平台。


模型推理方面,基于魔搭提供的封装Python SDK,开发者只写一行代码,就能快速验证和使用模型。


模型调优方面,魔搭同样提供了简单易用的调用接口,以及灵活的配置文件设计,实现了10行代码运行一个调优任务。


最后,在模型部署上,魔搭支持云端、本地、设备端等多种部署方式。


值得一提的是,魔搭还给开发者们提供了不少免费算力资源


其中,8核32G的CPU资源不仅免费,还可无限续杯。


GPU算力方面,则有16小时的免费V100资源可用。并且多贡献多得。


魔搭社区,为什么是现在?


那么,问题来了,这么多家产业界和学术界研究机构,怎么就凑到一块儿搞起新的开源平台来了?



究其根本,其实还是一个AI落地应用,尤其是AI大模型产业化应用的问题


一方面,我们能看到,AI技术正在各个领域迅猛发展。在顶尖的学界、产业界研究机构里,AI模型们的更新迭代可谓是日新月异。


但另一方面,AI技术本身的门槛仍然很高。尤其是在大模型上,以模型为核心,算法、算力、数据三位一体的重要性更加突显


更不用说,到了具体的应用层面,由于现在的技术仍无法实现“一个模型打天下”,后续还有大量模型调优、二次开发工作要做。



开源无疑是推动AI技术更快走向大众的神兵利器。


问题是,在今天,尽管GitHub之类的代码托管平台已经非常成熟,但各种开源资源实际上还是非常分散,并且往往被框架、渠道等因素所限制。


也就是说,对于更广大的开发人员来说,现在仍缺少统一的中立社区,能把海量模型、算力、数据高效地汇聚到一处。


就是在这样的背景之下,达摩院等中国AI玩家们一拍即合,共同攒出了魔搭这么一个大招。


简单来说,魔搭社区核心提供的价值就是“模型即服务(Model as a Service,简称MaaS)”:


开源,并且提供开源之后模型的使用服务


让普通开发者能更低门槛地把模型跑起来。让AI,尤其是AI大模型不再是少数人的游戏


从这个意义上来说,我们可以将模型分散开源视作AI开源的1.0模式,而魔搭社区则是在探索AI开源2.0时代的新范式。



说到MaaS,其实并非全新概念。


之所以此前并未激起太大水花,与其本身面临的困难不无关系:


一方面,需要AI技术、优质模型本身的积累达到一定数量。


另一方面,围绕模型展开服务也就意味着大量资源的调度。


简而言之,单靠一家公司、一个机构是很难真正做到“模型即服务”的。


因而此中国科研机构们强强联手,积极贡献出一大波先进大模型、SOTA模型,属实不易。


对于本土AI开发者而言,不可谓不是一个好的开始。


阿里巴巴集团资深副总裁、达摩院副院长周靖人还透露,接下来,魔搭社区还会每月上新,达摩院将长期支持社区的维护和发展。



AI时代的新型基础设施


如果将AI技术带来的变革视作第四次工业革命,那么AI技术的落地,终将从依赖专家调参的手工作坊时代,走向工业化大生产时代。


在这其中,预训练模型就是关键所在。


中国计算机学会副理事长、澜舟科技创始人兼CEO周明博士表示:

魔搭这样的AI模型社区堪称AI时代的基础设施,能将预训练模型以较低门槛提供给广大开发者,让AI惠及全社会。


中国科学院院士、CCF开源发展委员会主任王怀民也认为:

开源是AI发展的重要驱动力,魔搭作为新型的AI开源社区,不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。


需要正视的是,作为国内第一个MaaS社区,魔搭还只是一个开始。


只有当更多开发者参与其中,在得到模型服务的同时,让AI在各个领域应用落地,不断拓展AI模型新的发展空间和可能性,这样一个开源社区才能真正work。


我们离大规模、可复制的AI大工业时代,才可能更近一步。


那么,你会参与进来吗?


魔搭社区地址:modelscope.cn


——END——


登录查看更多
1

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
专知会员服务
13+阅读 · 2022年8月1日
专知会员服务
12+阅读 · 2021年7月2日
【NeurIPS 2020】融入BERT到并行序列模型
专知会员服务
25+阅读 · 2020年10月15日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年12月26日
Arxiv
11+阅读 · 2019年6月19日
Arxiv
13+阅读 · 2019年1月26日
Arxiv
11+阅读 · 2018年5月21日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员