新智元报道
编辑:拉燕
DALL-E 2又一次出现在了我们的眼前。
自打自媒体兴起了以后,传统的纸媒就日渐式微了。无论是报纸还是杂志,看的人都越来越少。人们纷纷转向了手机自媒体,以此获取最新的资讯和信息。
然而,最近国外的一个团队用人工智能模型DALL-E 2首次生成了一本杂志的封面。
效果好像...还不错。
传统纸媒和前端科技的结合,到底能迸发出什么样的火花?
思考20秒,光速出图
该团队由Cosmopolitan杂志的几名编辑,人工智能实验室OpenAI的几名专家,还有一名数字艺术家Karen X. Cheng组成。
就是这几个人,有一天聚到了一起,打算用人工智能做个杂志封面出来。
当然了,杂志封面说到底也是图片,而AI生成图片可不是什么新鲜事。
自打上个世纪50年代,到今天70来年的时间里,很多人都尝试过用AI来生成图片。
其实就在上周,经济学人还用AI机器人生成了一张图片,插到了一篇讲AI的文章里,然后顺手又拿这张照片当了封面插图。
而这次Cosmopolitan杂志,则更是把这件事做到了极致。
一开始,Cheng给模型输入了一些指令,要求生成上个世纪60年代的时尚女性的特写,要那种百科全书式的插图。
然后AI琢磨了20秒,就生成了如下这一组高质量的图片。
上图中,每一个女性的形象都是独一无二的。而且可以肯定地说,在AI搞出这些图片之前,这些图片压根不存在。纯纯是AI刚捏的。
而这就是最近活跃的不行的DALL-E 2。它能收集用户的需求,然后调动自己的「知识储备」,浏览人类历史中上亿张已有的图片,最终一张生成独一无二的图像。
甚至,每一个像素都是新的不能再新的。
是不是还不错?DALL-E 2自从4月限量发布以来,一直就饱受好评,人们被这个小模型的能力折服,看过的都说好。
The Verge甚至表示,DALL-E 2能掀起一场以创造力为主题的革命。
团队成员没一会儿就散会了。短短的不到一个小时的时间里,封面就这么敲定了。
从这么一张小小的封面背后,研究人员看到了更深层次的问题。即,AI和艺术的关系,和伦理的关系,以及,和我们未来的关系。
当然,上面6个女人的图片只是一个测试,最终的封面是一张航天员在月球表面探索的图片。
而如果仔细看看AI究竟是怎么生成的过程,你会觉得不可思议的。
不是真的艺术家
说回DALL-E。他的创造者其实不希望人们将这个模型过度拟人化,他们认为,如果承认AI是一个自主的实体会让人们招架不住。
看看之前谷歌LaMDA的新闻就知道了。
其实,DALL-E从根本上讲,还是在模仿人类。该模型由神经网络支持,而主要的算法就是模仿人脑工作。
它通过分析图像以及人们输入的文字,来「了解」对象,以及这些对象之间的关联。
DALL-E的产品经理Joanne Jang举了这么个例子:如果DALL-E看到了很多考拉的照片,而这些照片的标题就是考拉,那么这个模型就会知道考拉长什么样子。
而如果输入的是考拉骑摩托车,那么DALL-E就会结合它自己对考拉、摩托车,以及骑行的概念来对这三者之间的关系进行解释。
但其实,DALL-E还并没有达到最完美的地步。OpenAI表示,现在该模型还处于预览阶段。工程师会持续对其进行调整,并慢慢向用户开放。现在,DALL-E每周仅向1000名用户发布。
它的问题目前主要有两方面。第一是,虽说它渲染的大部分图像质量都很高,但是往往更精细的细节部分不那么尽如人意。要不就模糊,要不生成的东西就太抽象。
特别要指出的事是,DALL-E渲染人脸方面不太行。它会故意生成歪七扭八的眼部,或是扭曲的嘴唇。其实这是为了防止生成的图片用于造假,或是用作色情图片使用。
另一个问题是,DALL-E 2进行学习的模型其实是含有偏见的。最基本的,生成出来的图片基本都是白人。这显然是因为数据集里的人类白人巨多。
当然了,不管怎么说,专家们普遍认为。虽然DALL-E取代视觉艺术家这个说法,目前来看还是无稽之谈,但这项技术能创造新的机会,甚至全新的艺术形式应该是板上钉钉的了。
来自英国的独立AI艺术策展人Luba Elliott表示,她希望DALL-E能将更多的女性带入艺术领域。
我们还是应该持观望态度。不应该太过畏手畏脚,也不应该太过于激进。
总之,谨慎谨慎再谨慎。
参考资料:
https://www.cosmopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/