机器之心报道
Stable Diffusion 到底是谁的 Stable Diffusion?
前几天,一家 AI 公司融资的消息吸引了不少人的目光。这家公司名叫 Stability AI,成立于 2020 年,在拿到本轮 1.01 亿美元的融资之后成为新晋独角兽,估值高达 10 亿美元。
在很多媒体的报道中,这家公司还有一个特别的身份——Stable Diffusion 背后的公司,因为他们为近段时间大火的、可以在消费级 GPU 上快速生成高质量图像的 Stable Diffusion 内容生成模型提供了算力支持。
Stable Diffusion 生成的高质量图像。
在 Stability AI 的高调宣传下,许多人以为这家公司就是 Stable Diffusion 的所有者,毕竟一个月前他们刚刚官宣发布 Stable Diffusion,并引发业内极大的关注。
Stability AI 官方博客发布
但其实,这个模型的技术来源是发表在 CVPR 2022 中的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分别来自慕尼黑大学、海德堡大学和 AI 视频剪辑技术创业公司 Runway。
为了在此基础上训练出 Stable Diffusion,研究团队动用了 4000 个 A100 Ezra-1 AI 超大集群,而 Stability AI 公司正是这些算力的提供者。
总之,你大体可以理解为:在 Stable Diffusion 的最出名的版本中,Stability AI 出钱搞定了 GPU,慕尼黑大学、海德堡大学、Runway 的研究团队完成了研发。
至少在 GitHub 项目的描述中,Stability AI 和 Runway 的贡献是「平等的」,不能说 Stability AI 就是 Stable Diffusion 的所有者。
当然,这一成果的诞生背后还有许多其他的支持力量,包括非营利组织 LAION 提供的数据集。Stable Diffusion 模型最初就是在 LAION-5B 的一个大子集上训练的。LAION-5B 于今年 3 月发布,而创建这一数据集的资助者是 Doodlebot、Hugging Face 和 Stability AI。
创业未半,争端已起。当 Stable Diffusion 大火,最终成为价值 1 亿美金的项目时,事情就开始变得富有戏剧性。
谁才是真正的官方?
事情还要从 Stable Diffusion 的新版本发布说起。
今天,Runway 公司官宣发布了 Stable Diffusion v1.5,同时还把模型权重放到了 Hugging Face 的平台上。
这就让一直以为 Stability AI 是 Stable Diffusion 所有者的网友看不懂了:「这是官方发布吗?我怎么在 Stability AI 的官方渠道没有看到任何公开声明呢?」
随后,整个开源社区围观了一场闹剧:
在 Hugging Face 平台 Runway 发布的 Stable Diffusion v1.5 版本帖子上,Hugging Face 首席技术官 Julien Chaumond 提示了一个法律问题:Stability AI 法务团队要求 Hugging Face 删除发布的新版本 Stable Diffusion,且声称是侵犯知识版权。
在大家迷惑的时候,Runway 的 CEO、联合创始人也下场解释了,表示自家发布 Stable Diffusion 1.5 版本是没问题的,是对「他们」创造、发布的原始研究的更新。此外,他再次强调了:这个研究的作者们来自 Runway ML 和慕尼黑大学,研究和代码去年也已经开源。
那篇 Stable Diffusion 论文的作者之一 Patrick Esser,身份是 Runway 的首席研究科学家。
在网友看来,他还阴阳怪气了一波:「我们确定没有违反任何知识产权问题,也感谢 Stability AI 为原始版本模型贡献算力。」(ps. 难道是想说,后续版本不需要你们了?)
目前,这场闹剧还没有一个清晰的结果。
PyTorch 创始人 Soumith Chintala 也通过推特表明了自己的想法:「我一直以为 Stability AI 代表着人工智能的去中心化,所以这一举动让我感到惊讶。」
Soumith Chintala 对 Stability AI 的这一印象可能来自该公司创始人兼 CEO Emad Mostaque 近期的一些表态,后者确实表明他们要推进 AI 模型的民主化,去做一些「更独立的、更去中心化的事情」,让 10 亿人用上开源大模型。
也许真的就如人们所说,当开源工作变成了一个 1 亿美元的项目时,创始团队成员之间的「关系」就不再稳定了。
参考链接:
https://huggingface.co/runwayml/stable-diffusion-v1-5
声纹识别:从理论到编程实战
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com