价值1亿美金时，Stable Diffusion背后的团队开始互撕，谁才是真官方？

会员服务 ·

价值1亿美金时，Stable Diffusion背后的团队开始互撕，谁才是真官方？

2022 年 10 月 21 日 机器之心

机器之心报道

机器之心编辑部

Stable Diffusion 到底是谁的 Stable Diffusion？

前几天，一家 AI 公司融资的消息吸引了不少人的目光。这家公司名叫 Stability AI，成立于 2020 年，在拿到本轮 1.01 亿美元的融资之后成为新晋独角兽，估值高达 10 亿美元。

在很多媒体的报道中，这家公司还有一个特别的身份——Stable Diffusion 背后的公司，因为他们为近段时间大火的、可以在消费级 GPU 上快速生成高质量图像的 Stable Diffusion 内容生成模型提供了算力支持。

Stable Diffusion 生成的高质量图像。

在 Stability AI 的高调宣传下，许多人以为这家公司就是 Stable Diffusion 的所有者，毕竟一个月前他们刚刚官宣发布 Stable Diffusion，并引发业内极大的关注。

Stability AI 官方博客发布

但其实，这个模型的技术来源是发表在 CVPR 2022 中的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》，署名作者一共五位，分别来自慕尼黑大学、海德堡大学和 AI 视频剪辑技术创业公司 Runway。

为了在此基础上训练出 Stable Diffusion，研究团队动用了 4000 个 A100 Ezra-1 AI 超大集群，而 Stability AI 公司正是这些算力的提供者。

总之，你大体可以理解为：在 Stable Diffusion 的最出名的版本中，Stability AI 出钱搞定了 GPU，慕尼黑大学、海德堡大学、Runway 的研究团队完成了研发。

至少在 GitHub 项目的描述中，Stability AI 和 Runway 的贡献是「平等的」，不能说 Stability AI 就是 Stable Diffusion 的所有者。

当然，这一成果的诞生背后还有许多其他的支持力量，包括非营利组织 LAION 提供的数据集。Stable Diffusion 模型最初就是在 LAION-5B 的一个大子集上训练的。LAION-5B 于今年 3 月发布，而创建这一数据集的资助者是 Doodlebot、Hugging Face 和 Stability AI。

创业未半，争端已起。当 Stable Diffusion 大火，最终成为价值 1 亿美金的项目时，事情就开始变得富有戏剧性。

谁才是真正的官方？

事情还要从 Stable Diffusion 的新版本发布说起。

今天，Runway 公司官宣发布了 Stable Diffusion v1.5，同时还把模型权重放到了 Hugging Face 的平台上。

这就让一直以为 Stability AI 是 Stable Diffusion 所有者的网友看不懂了：「这是官方发布吗？我怎么在 Stability AI 的官方渠道没有看到任何公开声明呢？」

随后，整个开源社区围观了一场闹剧：

在 Hugging Face 平台 Runway 发布的 Stable Diffusion v1.5 版本帖子上，Hugging Face 首席技术官 Julien Chaumond 提示了一个法律问题：Stability AI 法务团队要求 Hugging Face 删除发布的新版本 Stable Diffusion，且声称是侵犯知识版权。

在大家迷惑的时候，Runway 的 CEO、联合创始人也下场解释了，表示自家发布 Stable Diffusion 1.5 版本是没问题的，是对「他们」创造、发布的原始研究的更新。此外，他再次强调了：这个研究的作者们来自 Runway ML 和慕尼黑大学，研究和代码去年也已经开源。

那篇 Stable Diffusion 论文的作者之一 Patrick Esser，身份是 Runway 的首席研究科学家。

在网友看来，他还阴阳怪气了一波：「我们确定没有违反任何知识产权问题，也感谢 Stability AI 为原始版本模型贡献算力。」（ps. 难道是想说，后续版本不需要你们了？）

目前，这场闹剧还没有一个清晰的结果。

PyTorch 创始人 Soumith Chintala 也通过推特表明了自己的想法：「我一直以为 Stability AI 代表着人工智能的去中心化，所以这一举动让我感到惊讶。」

Soumith Chintala 对 Stability AI 的这一印象可能来自该公司创始人兼 CEO Emad Mostaque 近期的一些表态，后者确实表明他们要推进 AI 模型的民主化，去做一些「更独立的、更去中心化的事情」，让 10 亿人用上开源大模型。

也许真的就如人们所说，当开源工作变成了一个 1 亿美元的项目时，创始团队成员之间的「关系」就不再稳定了。

参考链接：

https://huggingface.co/runwayml/stable-diffusion-v1-5

声纹识别：从理论到编程实战

《声纹识别：从理论到编程实战》中文课上线，由谷歌声纹团队负责人王泉博士主讲。目前，课程答疑正在持续更新中。

课程视频内容共 12 小时，着重介绍基于深度学习的声纹识别系统，包括大量学术界与产业界的最新研究成果。

同时课程配有 32 次课后测验、10 次编程练习、10 次大作业，确保课程结束时可以亲自上手从零搭建一个完整的声纹识别系统。

点击阅读原文，了解更多课程内容。

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

相关内容

关注 7014

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文，这些论文构成了整个领域的进步，也欢迎介绍人工智能应用的论文，但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能，而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案，强调其新颖性，并对正在开发的人工智能技术进行深入的评估。官网地址：http://dblp.uni-trier.de/db/journals/ai/

【NeurIPS 2022】Stable Diffusion采样速度翻倍！清华提出扩散模型高效求解器

专知会员服务

49+阅读 · 2022年11月17日

扩散模型数学太难？经典扩散模型DDPM手把手Pytorch代码实现，对照数学公式详解

专知会员服务

122+阅读 · 2022年9月8日

不可错过！2022伯克利新课-《全栈深度学习2022》课程视频及ppt免费分享

专知会员服务

89+阅读 · 2022年8月19日

语言模型如何产品落地？《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操，151页pdf

专知会员服务

120+阅读 · 2022年8月15日