B站大谷新作:10天用AI画了一首爱情MV!瑰丽玄妙,宛如梦境

2022 年 6 月 27 日 THU数据派


  
  
    
来源:新智元

  本文为约2328字,建议阅读5分钟

本文介绍 了B站up主大谷用AI「画」了一首音乐MV。



【导读】耗时10天,B站up主大谷带着他的新作又来了!这次,他用AI「画」了一首音乐MV,配上动感音乐,简直太魔幻了。

B站up主大谷最近又整了一个新活儿:

用AI「画」了一首音乐MV

不如先看个视频,体验下这场视觉和听觉的盛宴。


怎么样,是不是整体很动感魔幻?

瑰丽玄妙,宛如梦境


据大谷介绍,这个视频自己耗时 10天 才完工。

这期间, 大谷全程负责「监工」,盯着AI干活 ,并提供给AI需要的摄像机镜头位移坐标,补充一点场景文字信息。

到后期再填上字幕和微调剪辑,就完成了这个作品。


而他做这个视频的动机很简单

想要研究一下AI的绘画潜力怎么样。

那么这个AI作画的能力究竟如何?我们来个「 慢镜头 」欣赏一下...

「转身那一刻,世界崩落」这句歌词一出, 开场画面中,粉色的童话世界瞬间变成了万丈深渊的魔域世界,让人有一种很大的视觉反差。


‍再来看,AI根据歌词「天空如同被雷鸣闪电划破、玫瑰盛开」填画的表现力也很不错。

其中像「 闪电 」和「 玫瑰 」这样的关键信息都在画面中生成了。


但是,当你仔细盯着这个动画不要眨眼睛时,是不是真有种自己吃了云南毒蘑菇的感觉。

天旋地转,简直太魔幻了...


‍Boom,Boom,Boom,Boom歌词一出,AI作画的风格就很诡异了...

很明显歌词中都在说的是, 心跳Boom

而AI却把炸弹、烟花、气球,白色框框杂糅到一个画面中。


这画风,这调调和整首歌的意境不太相融了。

可以说,AI的智商在理解句子上没问题,而理解整首歌词内涵还是不太够(doge)。

到了最后收尾,AI从前面很有意境的风格转化成了 赛博朋克风

星际飞船、行星、宇宙...


就比如下面这个场景很类似「黑客帝国」中尼奥从母体诞生周围环境的一幕。


可以看到,AI根据输入的文字歌词和场景描述生成了每一帧画面中的世界。

每一幅画面亦真亦幻,似梦非梦。

可是,你知道制作这个视频背后技术吗?

大谷表示,「使用了开源AI绘画项目Disco Diffusion」。

技术介绍:AI作画「卷」出新高度

在介绍这个工具之前,先来看两张图片。


看完这两张图片,你可能会觉得,这是哪个大牛插画师的作品。估摸着,这么精良的作品,放到市场上卖个几千不是啥大问题。

如果真是大牛画的,那还真没什么亮点了。虽然很好看,但也不是不能完成的。
可如果,这两幅画,还有一大堆别的一样好看的画,都出自AI之手呢?

你会不会觉得不可思议?

真相是:这两幅画的作者都是Liliia Sitailo。准确来讲,Sitailo只负责输入指令,作画部分完全交由AI完成。


如果你让我说,这么完美的构图、清晰的思路,还有身临其境的氛围、抓人眼球的色彩,都是AI完成的,我还真不一定信。

事实证明,这款谷歌开发的名为 Disco Diffusion 的AI作画工具非常之成功。目前,这个工具已经更新到了第五代,V5版本。


这是一款由谷歌Colab平台开发的,利用人工智能深度学习进行数字艺术创作的工具,基于MIT许可协议,目前已开源。

用户可以在谷歌Drive直接运行。

有了这个工具,不需要用户懂什么构图知识,也不需要有任何艺术细胞,只要想点子就可以了。

另外,大家熟知的DALL-E也同样在4月迎来了更新。

Open AI对画图界的扛把子DALL-E进行了2.0版的全面升级。让自然语言生成图像达到了全新的高度。

比如下面这幅很有穿越感的画。


还有之前占据AI画画老大哥地位的Imagen,做了一副「有点怪,我再看看」的画。


谷歌除了上面提到的Disco Diffusion,最近也有一款名叫Parti的画画AI问世了。

Parti,全名叫「Pathways Autoregressive Text-to-Image」,是谷歌大脑老大Jeff Dean提出的多任务AI大模型蓝图Pathway的一部分。

我们来看看Parti的作品:


看完后,是不是顿时感觉,会画画的AI都这么卷了...

大谷是谁?


提到大谷,你一定会立马想到「AI复活」系的专业户。


大谷1991年生于北京,获得了纽约视觉艺术学院电脑艺术硕士学位。

作为一个艺术家,音乐家,程序员和独立的游戏设计师,生产力真是爆炸。

此前,我们已经看到过很多由他创作的一些作品。

最出名的就是用AI修复100年前老北京影像。发布后,这段修复Vlog爆火,引来许多网友的关注。


另外,像他用AI修复让李大钊、陈延年等老先辈们露出笑容也得到网友一致好评。


还有AI还原宋明清三朝皇帝、泰戈尔、梅兰芳,百年前上海时装秀....


所以说称其为「AI复活专业户」也不为过。

不过,这次大谷却为我们带来了不一样的创作。

网友:AI吃毒蘑菇了

对于大谷新作,网友有好多话要说。

一位网友肯定了AI作画能力


然而有人反驳道,有审美疲劳的,而且很多随机离散的结果「艺术」其实是无意义的,因为人根本看不懂这个作品。


有小伙伴看完视频感觉像是吃了云南蘑菇中毒出现幻觉一样,还将其称为「云南AI」


还有网友给这个画音乐MV的AI一些建议:



看着害怕,像逃离不了的梦境


讲真,看过视频后的小伙伴们,有没有一种像是无法逃脱梦境的感觉?
欢迎评论区讨论。

参考资料:
https://www.bilibili.com/video/BV18v4y1M74U?spm_id_from=333.999.0.0
http://dgspitzer.my-style.in/gameportfolio/?page_id=2&i=1
https://www.bilibili.com/read/cv16525687/
https://36kr.com/p/1719274187848967
https://cloud.tencent.com/developer/article/2007432


——END——

登录查看更多
0

相关内容

Nature子刊:尝试利用多模态基础模型迈向通用人工智能
专知会员服务
45+阅读 · 2022年6月16日
[ICML2022] NeuroFluid: 流体仿真的人工智能新范式
专知会员服务
22+阅读 · 2022年6月8日
视觉知识:跨媒体智能进化的新支点
专知会员服务
27+阅读 · 2022年6月8日
人工智能AI中台白皮书(2021年),45页pdf
专知会员服务
280+阅读 · 2021年9月18日
专知会员服务
39+阅读 · 2021年7月4日
【ST2020硬核课】深度神经网络,57页ppt
专知会员服务
43+阅读 · 2020年8月19日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
30+阅读 · 2020年3月26日
时隔6年,周杰伦终于官宣新MV,盗版低至几毛钱?
创业邦杂志
0+阅读 · 2022年7月6日
调研了下 AI 作曲,顺便做了期视频...快进来听歌!
夕小瑶的卖萌屋
0+阅读 · 2021年12月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
GeomCA: Geometric Evaluation of Data Representations
Arxiv
11+阅读 · 2021年5月26日
VIP会员
相关VIP内容
Nature子刊:尝试利用多模态基础模型迈向通用人工智能
专知会员服务
45+阅读 · 2022年6月16日
[ICML2022] NeuroFluid: 流体仿真的人工智能新范式
专知会员服务
22+阅读 · 2022年6月8日
视觉知识:跨媒体智能进化的新支点
专知会员服务
27+阅读 · 2022年6月8日
人工智能AI中台白皮书(2021年),45页pdf
专知会员服务
280+阅读 · 2021年9月18日
专知会员服务
39+阅读 · 2021年7月4日
【ST2020硬核课】深度神经网络,57页ppt
专知会员服务
43+阅读 · 2020年8月19日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
30+阅读 · 2020年3月26日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员