中文「大大大大大」模型开源开放！从吟诗作画写代码到蛋白质预测全都有，源代码可编程API均奉上

会员服务 ·

中文「大大大大大」模型开源开放！从吟诗作画写代码到蛋白质预测全都有，源代码可编程API均奉上

2022 年 11 月 4 日 量子位

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

中文领域的“大大大大大”模型，开源开放了！

一口气10+个大模型联手登场，能写诗、写作文、写代码，还能画画、做视频、看图说话。

戳进主页，不仅代码可下载，Notebook、在线Demo也已就位。

直接就是在线可玩，开箱即用。

炼丹师福音还不止如此。

在这个名为魔搭ModelScope的开源社区里，你甚至可以1行代码就实现模型推理：

△一行pipeline完成模型推理

10行代码搞定调优训练（finetune）：

不得不说，这波开源有点东西。

如此大手笔，确实也并非哪家研究机构的SOLO，而是由国内AI工业界和学界联合推动：

阿里达摩院与CCF开源发展委员会共同发起，首批合作机构包括澜舟科技、智谱AI、深势科技、中国科学技术大学、浙江大学等，阵容蔚为壮观。

更多细节，咱们一起研究研究。

以模型为核心的中文AI开源社区

要说魔搭ModelScope有何不同之处，答案其实就在社区名字里：以模型为中心，搭建AI应用服务。

因此社区刚成立，就已经有300+模型上线，其中包括10多个大模型和150+ SOTA模型。并且其中1/3都支持中文。

就说最近大火的AI画画，在模型库里一搜，就能找到对应的模型。

点进可体验的通义-文本生成图像大模型，即使你完全是AI小白，也能直接体验。

比如让AI生成一张“小鸡戴墨镜唱歌跳舞”的图片。

结果是这样的：

还有更潮酷的。

输入“一张柯基犬在时代广场骑自行车的照片。它戴着墨镜和沙滩帽”，就能得到：

你想要什么样的图片？自己来试试吧，下面是传送门：

红极一时的GPT-3中文复刻版也在魔搭社区上架了，写起古诗来可谓有模有样。

在AI for Science方面，“中国版AlphaFold2”——深势科技的Uni-Fold同样亮相魔搭。

输入蛋白质单体的一级结构，就能在线预测蛋白质的三级结构啦。

此外，会写爽文、以10亿参数轻量化模型登顶CLUE（中文语言理解榜单）的澜舟科技孟子系列模型，智谱AI同时支持101种语言的预训练模型……都能在魔搭上找到并体验。

并且正如前文所说，魔搭提供的不仅仅是模型下载和使用，还把环境安装、推理验证、训练调优、模型部署的一站式服务都搭好了。

环境安装方面，魔搭支持本地环境快捷安装，提供了Python whl包安装和源码安装。

同时也支持云端Notebook免安装，一键就能开启在线Notebook实训平台。

模型推理方面，基于魔搭提供的封装Python SDK，开发者只写一行代码，就能快速验证和使用模型。

模型调优方面，魔搭同样提供了简单易用的调用接口，以及灵活的配置文件设计，实现了10行代码运行一个调优任务。

最后，在模型部署上，魔搭支持云端、本地、设备端等多种部署方式。

值得一提的是，魔搭还给开发者们提供了不少免费算力资源。

其中，8核32G的CPU资源不仅免费，还可无限续杯。

GPU算力方面，则有16小时的免费V100资源可用。并且多贡献多得。

魔搭社区，为什么是现在？

那么，问题来了，这么多家产业界和学术界研究机构，怎么就凑到一块儿搞起新的开源平台来了？

究其根本，其实还是一个AI落地应用，尤其是AI大模型产业化应用的问题。

一方面，我们能看到，AI技术正在各个领域迅猛发展。在顶尖的学界、产业界研究机构里，AI模型们的更新迭代可谓是日新月异。

但另一方面，AI技术本身的门槛仍然很高。尤其是在大模型上，以模型为核心，算法、算力、数据三位一体的重要性更加突显。

更不用说，到了具体的应用层面，由于现在的技术仍无法实现“一个模型打天下”，后续还有大量模型调优、二次开发工作要做。

开源无疑是推动AI技术更快走向大众的神兵利器。

问题是，在今天，尽管GitHub之类的代码托管平台已经非常成熟，但各种开源资源实际上还是非常分散，并且往往被框架、渠道等因素所限制。

也就是说，对于更广大的开发人员来说，现在仍缺少统一的中立社区，能把海量模型、算力、数据高效地汇聚到一处。

就是在这样的背景之下，达摩院等中国AI玩家们一拍即合，共同攒出了魔搭这么一个大招。

简单来说，魔搭社区核心提供的价值就是“模型即服务（Model as a Service，简称MaaS）”：

开源，并且提供开源之后模型的使用服务。

让普通开发者能更低门槛地把模型跑起来。让AI，尤其是AI大模型不再是少数人的游戏。

从这个意义上来说，我们可以将模型分散开源视作AI开源的1.0模式，而魔搭社区则是在探索AI开源2.0时代的新范式。

说到MaaS，其实并非全新概念。

之所以此前并未激起太大水花，与其本身面临的困难不无关系：

一方面，需要AI技术、优质模型本身的积累达到一定数量。

另一方面，围绕模型展开服务也就意味着大量资源的调度。

简而言之，单靠一家公司、一个机构是很难真正做到“模型即服务”的。

因而此中国科研机构们强强联手，积极贡献出一大波先进大模型、SOTA模型，属实不易。

对于本土AI开发者而言，不可谓不是一个好的开始。

阿里巴巴集团资深副总裁、达摩院副院长周靖人还透露，接下来，魔搭社区还会每月上新，达摩院将长期支持社区的维护和发展。

AI时代的新型基础设施

如果将AI技术带来的变革视作第四次工业革命，那么AI技术的落地，终将从依赖专家调参的手工作坊时代，走向工业化大生产时代。

在这其中，预训练模型就是关键所在。

中国计算机学会副理事长、澜舟科技创始人兼CEO周明博士表示：

魔搭这样的AI模型社区堪称AI时代的基础设施，能将预训练模型以较低门槛提供给广大开发者，让AI惠及全社会。

中国科学院院士、CCF开源发展委员会主任王怀民也认为：

开源是AI发展的重要驱动力，魔搭作为新型的AI开源社区，不仅将有力推动AI迈向广泛的落地应用，还将助力中国从开源世界的参与者逐步成长为引领者。

需要正视的是，作为国内第一个MaaS社区，魔搭还只是一个开始。

只有当更多开发者参与其中，在得到模型服务的同时，让AI在各个领域应用落地，不断拓展AI模型新的发展空间和可能性，这样一个开源社区才能真正work。

我们离大规模、可复制的AI大工业时代，才可能更近一步。

那么，你会参与进来吗？

魔搭社区地址：modelscope.cn

点击阅读原文可访问魔搭~

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

登录查看更多

相关内容

代码

关注 10

代码（Code）是专知网的一个重要知识资料文档板块，旨在整理收录论文源代码、复现代码，经典工程代码等，便于用户查阅下载使用。

AlphaFold预测出2亿种蛋白质结构，打开整个蛋白质宇宙

专知会员服务

14+阅读 · 2022年8月1日

《深度学习平台发展报告（2022年）》发布, 26页pdf

专知会员服务

121+阅读 · 2022年7月29日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

TensorFlow开发者峰会2020 Keynote，TF2及其庞大的科研、工业生态圈

专知会员服务

26+阅读 · 2020年3月20日

【实战电子书+代码】自然语言处理的实战，545页pdf，使用Python理解、分析和生成文本

专知会员服务

266+阅读 · 2019年12月28日

首批开源超300个顶尖模型：这几家中国「AI主力军」，合力打造了一个AI模型社区「魔搭」

机器之心

1+阅读 · 2022年11月4日

“魔搭”来了！一文深度解读达摩院推出的AI模型社区

阿里技术

3+阅读 · 2022年11月4日

3行代码3分钟，搞定NLP模型开发！只要你会中文就行

新智元

1+阅读 · 2022年10月1日

CMU创建一个开源的AI代码生成模型，C语言表现优于Codex

机器之心

4+阅读 · 2022年3月14日

C代码写的比Codex还溜的AI神器开源

CSDN

2+阅读 · 2022年3月11日

基于氨基酸序列协同进化编码的蛋白质热点残基预测

国家自然科学基金

1+阅读 · 2013年12月31日

蛋白质结构模体识别及结构预测算法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于适配子的微流体装置捕获CTC预测鼻咽癌的复发和转移

国家自然科学基金

0+阅读 · 2012年12月31日

基于在线百科和问答社区的中文文本蕴涵知识获取

国家自然科学基金

0+阅读 · 2011年12月31日

非编码RNA-蛋白质功能网络在急性肺损伤发生发展中的调控机理研究和防护药物研发

国家自然科学基金

0+阅读 · 2011年12月31日

Reprogramming Pretrained Language Models for Protein Sequence Representation Learning

Arxiv

0+阅读 · 2023年1月5日

Open-Set Face Identification on Few-Shot Gallery by Fine-Tuning

Arxiv

0+阅读 · 2023年1月5日

Linear chain conditional random fields, hidden Markov models, and related classifiers

Arxiv

0+阅读 · 2023年1月3日

ProtGNN: Towards Self-Explaining Graph Neural Networks

Arxiv

22+阅读 · 2021年12月2日

Position-aware Graph Neural Networks

Arxiv

15+阅读 · 2019年6月11日

VIP会员