《哈利·波特》的赫敏本该长这样?DALL·E2「还原」小说人物形象

2022 年 7 月 30 日 极市平台
↑ 点击 蓝字  关注极市平台

来源丨机器之心
编辑丨极市平台

极市导读

 

原著党会更喜欢 AI 生成的结果吗? >>极市七夕粉丝福利活动:搞科研的日子是364天,但七夕只有一天!

DALL·E 是 OpenAI 推出的模型,以优秀的生成效果和艺术色彩著称。今年 4 月,OpenAI 发布了文字转图像新模型 DALL·E 2,为图像生成和处理领域树立了新的标杆。只需输入简短的文字 prompt,DALL·E 2 就可以生成符合描述的图像,其中多种对象以语义上合理的方式组合起来。

以往对于 DALL·E 2 的测试通常是把一些具体的物体组合成一幅图像,比如图像中包含「骑着马的宇航员」,DALL·E 2 轻松就能完成这个任务:


那么,在小说等文学作品抽象的笔触下,DALL·E 2 能生成怎样的角色形象呢?

一些小说已被成功改编成电影,角色形象深入人心,符合原著读者的心理预期。这是电影制作方的努力,如果让 AI 模型 DALL·E 2 创造角色形象,会是什么结果?

近期,一位名为 Jim Clyde Monge 的博主在 medium 上公开了自己对几部经典电影作品进行了实验,我们先来看一下生成结果。

例如,《哈利波特》原著中对赫敏的形容是这样的:「一个声音霸道的女孩,她有一头浓密的棕色头发和相当大的门牙。」电影形象和 DALL·E 2 生成结果如下:


或许你觉得这两个形象大相径庭,并且因为艾玛 · 沃特森的颜值偏爱电影版一些,但不得不说,DALL·E 2 的生成结果是符合原著描述的。

我们再来看看另外两位主角哈利和罗恩。原著中哈利 · 波特是「一个瘦脸、黑发的男孩,他戴着圆框眼镜,眼睛是绿色的,额头上有很浅的疤痕」。


原著描写罗恩是「一个高高瘦瘦的男生,脸上长有雀斑,有一个长鼻子,手脚都大」。


综合来看,DALL·E 2 的生成结果是符合原著文字描述的,但并不符合人们的审美。这可能是因为小说对人物形象的刻画不是完全具体的。反观电影的形象,倒是和原著描述有几分出入。

然而,如果用 DALL·E 2 生成的形象制作电影,观众可能不会买单,因为这不符合人们的审美观念。这也说明了 AI 和人类智能存在差距——AI 主要是根据文本数据生成关键要素。

仅凭《哈利 · 波特》一部电影还不足以说明这种情况,博客作者又对经典作品《指环王》进行了实验,其中佛罗多 · 巴金斯的对比结果是这样的:


这两个形象不仅是样貌不同,年龄上似乎也有很大差距。但这也不能怪 AI,毕竟佛罗多在原著中的设定就是 50 岁,只是书中的霍比特人比普通人更长寿,平均寿命 100 岁,33 岁才算成年。而 DALL·E 2 显然是不了解这个冷知识。

再看看另一个角色阿拉贡二世,不得不说,DALL·E 2 这次生成的形象俊朗了很多。原著对他的描写是:「蓬松的头发上点缀着些许银灰色,眼睛炯炯有神,与头发中的银色交相辉映。」


感兴趣的读者可以自己尝试用 DALL·E 2 生成电影角色,生成结果可能和电影形象差距很大。但我们不禁思考:这是由于 AI 存在缺陷,还是因为艺术创作本身的人文性?

参考链接:
https://medium.com/mlearning-ai/ai-reimagines-10-harry-potter-characters-based-on-book-descriptions-3e6b312720a7
https://medium.com/mlearning-ai/ai-reimagines-lord-of-the-rings-characters-as-described-in-book-36365bdc45e5


公众号后台回复“ECCV2022”获取论文分类资源下载~

△点击卡片关注极市平台,获取 最新CV干货

极市干货
算法项目: CV工业项目落地实战 目标检测算法上新!(年均分成5万)
实操教程 Pytorch - 弹性训练原理分析《CUDA C 编程指南》导读
极视角动态: 极视角作为重点项目入选「2022青岛十大资本青睐企业」榜单! 极视角发布EQP激励计划,招募优质算法团队展开多维度生态合作! 极市AI校园大使招募


点击阅读原文进入CV社区

收获更多技术干货

登录查看更多
0

相关内容

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
企业如何探索元宇宙,如何驾驭炒作和现实?(附报告)
【AAAI2022】上下文感知的词语替换与文本溯源
专知会员服务
17+阅读 · 2022年1月23日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
英国杜伦大学「深度生成建模」大综述论文,21页pdf
专知会员服务
48+阅读 · 2021年3月16日
还在修改博士论文?这份《博士论文写作技巧》为你指南
“我要做小小瑶大人的狗!”
夕小瑶的卖萌屋
0+阅读 · 2022年6月17日
请注意:这是真的机器人,不是合成动画
机器之心
0+阅读 · 2021年12月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年10月4日
Arxiv
0+阅读 · 2022年10月3日
Arxiv
0+阅读 · 2022年10月2日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Top
微信扫码咨询专知VIP会员