成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想
2022 年 9 月 13 日
新智元
新智元报道
编辑:David
【新智元导读】
特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创作新时代。
近日,由Emad Mostaque创立和资助的Stability.ai公司宣布公开发布AI创造的艺术作品。
你可能认为这只是AI在艺术领域的另一次尝试,但实际上远不止如此。
有两个原因。
首先,与DALL-E 2不同的是,Stable Diffusion是开源的。这意味着任何人都可以利用它的骨干,免费建立针对特定文本到图像创作任务的应用程序。
另外,Midjourney的开发者实施了一项功能,允许用户将其与Stable Diffusion结合起来,这导致了一些惊人的结果。
试想一下,在接下来的几个月里会出现什么。
第二,与DALL-E mini和Disco Diffusion不同,Stable Diffusion可以创造出惊人的逼真和艺术作品,对OpenAI或谷歌的模型没有什么可羡慕的。人们甚至声称它是「生成式搜索引擎」中新的SOTA。
(除非另有说明,本文所有图片都是通过Stable Diffusion创作的)。
Stable Diffusion 体现了人工智能艺术世界的最佳特征:它可以说是现有最好的人工智能艺术模型,而且是开源的。这简直是闻所未闻,将产生巨大的影响。
更有趣的是,关于这些服务的消息可能会通过最意想不到的来源到达你的手中。你的父母、你的孩子、你的伴侣、你的朋友或你的同事。
这些人往往是人工智能领域发生的事情的局外人,他们即将发现这个领域的最新趋势。艺术可能成为AI最终敲开那些对未来视而不见的人的大门的方式。这不是很有诗意吗?
不只是开源的DALL·E 2
Stability.ai的诞生是为
了创造「开放的AI工具,让我们发挥潜能」。
不仅仅是从未进入大多数人手中的研究模型,而是具有现实世界应用的工具,开放给我和你来使用和探索。
这是与其他科技公司不同的地方,比如OpenAI,它嫉妒地守护着它最好的系统(GPT-3和DALL-E 2)的秘密,或者谷歌,它甚至从未打算将自己的(PaLM、LaMDA、Imagen或Parti)作为私人测试版发布。
Stability.ai的这次公开发布不仅分享了模型权重和代码——虽然这对科学和技术的健康发展很关键,但大多数人并不关心它们。而且还为我们这些不想或不知道如何编码的人提供了一个无代码的即用型网站。
网站名叫DreamStudio Lite,可以免费使用,最多可生成200张图片。像DALL-E 2一样,它采用付费订阅模式,可以用10英镑获得1千张图片(OpenAI每月补充15个积分,但要获得更多的积分,你必须以15美元购买115个包)。
DALL-E的成本为0.03美元/图,而Stable Diffusion的成本为0.01英镑/图。
此外,还可以通过API大规模地使用Stable Diffusion(成本呈线性增长,所以你可以用1000英镑获得100K代)。除了图像生成,Stability.ai很快将宣布DreamStudio Pro(音频/视频)和Enterprise(工作室)。
DreamStudio可能很快会实现的另一个功能是,可以从其他图像生成图像,而不是通常的文本到图像的设置。就像下面这样:
在网站上,还有一个关于提示工程的资源,如果你是这方面的新手,你可能会用得上。
另外,与DALL-E 2不同,你可以控制参数来影响结果,并对其保留更多的代理权。
Stability.ai已经做了一切来促进人们对模型的访问。OpenAI是第一个,必须走得更慢,以评估模型固有的潜在风险和偏见,但他们不需要将模型保持在封闭测试阶段这么久,也不需要建立这样一个限制创造力的商业模式。
Midjourney和Stable Diffusion都已经证明了这一点。
安全+开源 > 隐私和控制
开源技术有其自身的局限性。
开放性应该走在隐私和严格控制之前,但不应该走在安全之前。
正如该公司在公告中解释的那样,它是「一个允许商业和非商业使用的许可」,重点是模型的开放和负责任的下游使用。它还强制要求衍生作品至少要受到同样的基于用户的限制。
开源模型本身是很好的模式,但如果我们不希望这项技术最终伤害人们,或以错误信息的形式为互联网增加更多的傲慢,建立合理的护栏也同样重要。
「由于这些模型是在广泛的互联网搜刮的图像-文本对上训练出来的,模型可能会重现一些社会偏见,产生不安全的内容,所以开放的缓解策略以及对这些偏见的公开讨论可以让大家参与到这个对话中来。」
在任何情况下,开放性+安全性>隐私和控制。
开源力量改变世界
凭借道德价值和开放性的坚实基础,Stable Diffusion承诺在现实世界的影响方面超越其竞争对手。
对于那些想下载它并在他们的电脑上运行它的人来说,你应该知道它需要6.9Gb的VRAM--这适合于高端消费级GPU,使它比DALL-E 2要轻,但对大多数用户来说仍然是遥不可及的。其余的人,像我一样,可以马上开始使用Dream Studio。
Stable Diffusion 被普遍认为是目前最好的AI艺术模型,它将成为无数应用程序、网络和服务的基础,重新定义我们如何创造和与艺术互动。
但现在,专门为不同使用情况设计的应用程序将从头开始建立,供所有人使用。人们正在增强儿童画,用外画+内画制作拼贴画,设计杂志封面,画漫画,创造变形和动画视频,从图像中生成图像,等等。
其中一些应用在DALL-E和Midjourney中已经成为可能,但Stable Diffusion可以推动当前的创意革命进入下一个阶段。用前特斯拉AI总监、李飞飞高徒Andrej Karpathy的话说,就是让「艺术创作进入了人类+AI合作的新时代。」
像Stable Diffusion这样的AI艺术模型涉及到一类新工具,应该用我们所处的新现实的新思维框架来理解。我们不能简单地与其他时代进行类比或平行对比,并期望能够准确地解释或预测未来。
有些事情会相似,有些则不会。我们必须把这个即将到来的未来当作未知的领域。
写在最后
毫无疑问,Stable Diffusion的公开发布是人工智能艺术模型领域有史以来最重要和最有影响的事件,而这只是一个开始。
作者之一的Emad Mostaque在Twitter上说:"随着我们发布更快、更好和具体的模型,预计质量将继续全面上升。不仅仅是图像,下个月是音频,然后转向3D、视频。语言、代码,以及更多训练。
我们正处于一场为期数年的革命的边缘,在我们互动、联系和理解艺术,特别是一般的创造力的方式。而且不仅仅是在哲学、知识领域,而是作为现在每个人都分享和体验的东西。
创意世界将永远改变,我们必须进行开放和尊重的对话,为所有人创造一个更好的未来。只有负责任地使用开源技术,才能创造我们希望看到的变化。
参考资料:
https://thealgorithmicbridge.substack.com/p/stable-diffusion-is-the-most-important
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
艺术
关注
7
艺术迄今依旧没有公认的定义,目前广义的艺术乃是由具有智能思考能力的动物,透过各种形式及工具以表达其情感与意识,因而产生的结果。艺术不只存在于人类社会中,也存在于其他相对高等的动物。
视觉的有效扩散模型综述
专知会员服务
92+阅读 · 2022年10月20日
AlphaFold、人工智能(AI)和蛋白变构
专知会员服务
10+阅读 · 2022年8月28日
不可错过!2022伯克利新课-《全栈深度学习2022》课程视频及ppt免费分享
专知会员服务
88+阅读 · 2022年8月19日
语言模型如何产品落地?《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操,151页pdf
专知会员服务
118+阅读 · 2022年8月15日
斯坦福大学首个Transformers专题讲座视频放出,NLP、CV和RL无所不包
专知会员服务
45+阅读 · 2022年7月12日
Geoff Hinton最新访谈视频:谈人工智能革命…再一次
专知会员服务
27+阅读 · 2022年6月2日
《人工智能是战争的未来(但并非是你想的那样)》,美国军事学院陆军网络研究所
专知会员服务
104+阅读 · 2022年5月5日
何为机器学习公平性?Tel-Aviv大学最新《机器学习公平性》综述论文阐述七大类公平机器学习算法
专知会员服务
54+阅读 · 2022年3月28日
元宇宙知识 | 如何在元宇宙中应用众多GAN模型???
专知会员服务
34+阅读 · 2022年1月29日
【大佬约架】Yoshua Bengio与Gary Marcus之圣诞AI论战「 AI 之道」,附视频地址与slides下载
专知会员服务
23+阅读 · 2019年12月25日
谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了
新智元
0+阅读 · 2022年11月3日
你输文字,它生成视频:这款新模型让LeCun也开始转梗图了
机器之心
2+阅读 · 2022年9月30日
1句话生成视频AI爆火!Meta最新SOTA模型让网友大受震撼
新智元
2+阅读 · 2022年9月30日
这个模型,竟成为网友的AI果照生成器
新智元
3+阅读 · 2022年9月1日
这个模型,让前特斯拉AI总监Andrej Karpathy沉迷了整整3天!
新智元
0+阅读 · 2022年8月21日
谷歌亮出 AI“王牌”,生成超逼真图片,网友:OpenAI DALL-E 要被碾压了?
AI前线
0+阅读 · 2022年6月9日
这张骑马的宇航员图片是AI感知世界的一个里程碑
大数据文摘
0+阅读 · 2022年4月27日
观点丨DALL-E 2、AI研究的未来以及OpenAI的商业前景
学术头条
1+阅读 · 2022年4月15日
无痕 PS、读得懂文字,OpenAI 的二代 DALL·E 惊艳亮相!
CSDN
0+阅读 · 2022年4月14日
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
新智元
0+阅读 · 2022年4月10日
高脂饮食作用于表观遗传调控基因HDAC3诱导心衰发生的分子机制研究
国家自然科学基金
0+阅读 · 2015年12月31日
用户生成内容情境下产品创新知识形成机制研究:基于情感的作用
国家自然科学基金
0+阅读 · 2013年12月31日
复杂数据下半参数双重回归模型的统计推断及其应用
国家自然科学基金
0+阅读 · 2013年12月31日
冠状动脉内皮细胞生成和再生的细胞及分子机制
国家自然科学基金
0+阅读 · 2013年12月31日
大数据时代新闻推荐模型与方法研究
国家自然科学基金
1+阅读 · 2013年12月31日
基于对象分析的图像/视频内容编辑
国家自然科学基金
2+阅读 · 2012年12月31日
图像压缩感知与图像加密融合算法研究
国家自然科学基金
0+阅读 · 2012年12月31日
在线多媒体协同对购买意愿的影响机理研究---基于广播与交互传播的视角
国家自然科学基金
0+阅读 · 2012年12月31日
番茄红素抗高脂血症致脑血管、神经元损伤机制研究
国家自然科学基金
0+阅读 · 2012年12月31日
肝细胞癌血管生成拟态的分子机制研究
国家自然科学基金
0+阅读 · 2009年12月31日
Estimation of a Causal Directed Acyclic Graph Process using Non-Gaussianity
Arxiv
0+阅读 · 2022年11月24日
Cyclability, Connectivity and Circumference
Arxiv
0+阅读 · 2022年11月24日
Protein structure generation via folding diffusion
Arxiv
0+阅读 · 2022年11月24日
Paint by Example: Exemplar-based Image Editing with Diffusion Models
Arxiv
0+阅读 · 2022年11月23日
Safe Control and Learning Using Generalized Action Governor
Arxiv
0+阅读 · 2022年11月22日
Controllable Data Generation by Deep Learning: A Review
Arxiv
15+阅读 · 2022年7月19日
The Conflict Between Explainable and Accountable Decision-Making Algorithms
Arxiv
31+阅读 · 2022年5月11日
Learning and Evaluating Graph Neural Network Explanations based on Counterfactual and Factual Reasoning
Arxiv
17+阅读 · 2022年2月17日
On Explainability of Graph Neural Networks via Subgraph Explorations
Arxiv
11+阅读 · 2021年5月31日
Graph Neural Networks: Taxonomy, Advances and Trends
Arxiv
49+阅读 · 2020年12月16日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
艺术
AI
OpenAI
视频
人工智能
特斯拉汽车 (Tesla Motors)
相关VIP内容
视觉的有效扩散模型综述
专知会员服务
92+阅读 · 2022年10月20日
AlphaFold、人工智能(AI)和蛋白变构
专知会员服务
10+阅读 · 2022年8月28日
不可错过!2022伯克利新课-《全栈深度学习2022》课程视频及ppt免费分享
专知会员服务
88+阅读 · 2022年8月19日
语言模型如何产品落地?《GPT-3:使用大型语言模型构建创新的NLP产品》新书带你实操,151页pdf
专知会员服务
118+阅读 · 2022年8月15日
斯坦福大学首个Transformers专题讲座视频放出,NLP、CV和RL无所不包
专知会员服务
45+阅读 · 2022年7月12日
Geoff Hinton最新访谈视频:谈人工智能革命…再一次
专知会员服务
27+阅读 · 2022年6月2日
《人工智能是战争的未来(但并非是你想的那样)》,美国军事学院陆军网络研究所
专知会员服务
104+阅读 · 2022年5月5日
何为机器学习公平性?Tel-Aviv大学最新《机器学习公平性》综述论文阐述七大类公平机器学习算法
专知会员服务
54+阅读 · 2022年3月28日
元宇宙知识 | 如何在元宇宙中应用众多GAN模型???
专知会员服务
34+阅读 · 2022年1月29日
【大佬约架】Yoshua Bengio与Gary Marcus之圣诞AI论战「 AI 之道」,附视频地址与slides下载
专知会员服务
23+阅读 · 2019年12月25日
热门VIP内容
开通专知VIP会员 享更多权益服务
《优化联合作战准备:日本视角》最新21页
《基于嵌入式导弹系统的自主防空系统以挫败巡航威胁的定量论证》90页
乌克兰首次完全依靠UGV 和 FPV 无人机全自动攻击俄罗斯部队
《中高度长航时遥控无人机自动定位和跟踪》190页
相关资讯
谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了
新智元
0+阅读 · 2022年11月3日
你输文字,它生成视频:这款新模型让LeCun也开始转梗图了
机器之心
2+阅读 · 2022年9月30日
1句话生成视频AI爆火!Meta最新SOTA模型让网友大受震撼
新智元
2+阅读 · 2022年9月30日
这个模型,竟成为网友的AI果照生成器
新智元
3+阅读 · 2022年9月1日
这个模型,让前特斯拉AI总监Andrej Karpathy沉迷了整整3天!
新智元
0+阅读 · 2022年8月21日
谷歌亮出 AI“王牌”,生成超逼真图片,网友:OpenAI DALL-E 要被碾压了?
AI前线
0+阅读 · 2022年6月9日
这张骑马的宇航员图片是AI感知世界的一个里程碑
大数据文摘
0+阅读 · 2022年4月27日
观点丨DALL-E 2、AI研究的未来以及OpenAI的商业前景
学术头条
1+阅读 · 2022年4月15日
无痕 PS、读得懂文字,OpenAI 的二代 DALL·E 惊艳亮相!
CSDN
0+阅读 · 2022年4月14日
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
新智元
0+阅读 · 2022年4月10日
相关基金
高脂饮食作用于表观遗传调控基因HDAC3诱导心衰发生的分子机制研究
国家自然科学基金
0+阅读 · 2015年12月31日
用户生成内容情境下产品创新知识形成机制研究:基于情感的作用
国家自然科学基金
0+阅读 · 2013年12月31日
复杂数据下半参数双重回归模型的统计推断及其应用
国家自然科学基金
0+阅读 · 2013年12月31日
冠状动脉内皮细胞生成和再生的细胞及分子机制
国家自然科学基金
0+阅读 · 2013年12月31日
大数据时代新闻推荐模型与方法研究
国家自然科学基金
1+阅读 · 2013年12月31日
基于对象分析的图像/视频内容编辑
国家自然科学基金
2+阅读 · 2012年12月31日
图像压缩感知与图像加密融合算法研究
国家自然科学基金
0+阅读 · 2012年12月31日
在线多媒体协同对购买意愿的影响机理研究---基于广播与交互传播的视角
国家自然科学基金
0+阅读 · 2012年12月31日
番茄红素抗高脂血症致脑血管、神经元损伤机制研究
国家自然科学基金
0+阅读 · 2012年12月31日
肝细胞癌血管生成拟态的分子机制研究
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Estimation of a Causal Directed Acyclic Graph Process using Non-Gaussianity
Arxiv
0+阅读 · 2022年11月24日
Cyclability, Connectivity and Circumference
Arxiv
0+阅读 · 2022年11月24日
Protein structure generation via folding diffusion
Arxiv
0+阅读 · 2022年11月24日
Paint by Example: Exemplar-based Image Editing with Diffusion Models
Arxiv
0+阅读 · 2022年11月23日
Safe Control and Learning Using Generalized Action Governor
Arxiv
0+阅读 · 2022年11月22日
Controllable Data Generation by Deep Learning: A Review
Arxiv
15+阅读 · 2022年7月19日
The Conflict Between Explainable and Accountable Decision-Making Algorithms
Arxiv
31+阅读 · 2022年5月11日
Learning and Evaluating Graph Neural Network Explanations based on Counterfactual and Factual Reasoning
Arxiv
17+阅读 · 2022年2月17日
On Explainability of Graph Neural Networks via Subgraph Explorations
Arxiv
11+阅读 · 2021年5月31日
Graph Neural Networks: Taxonomy, Advances and Trends
Arxiv
49+阅读 · 2020年12月16日
大家都在搜
洛克菲勒
palantir
大型语言模型
CMU博士论文
态势感知
无人艇
自主可控
人机混合智能
胡克
GANLab 将GA
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top