剧透预警!外国小哥用AI绘出美剧《巫师》网络图,还顺手发了篇论文

2022 年 3 月 1 日 新智元



  新智元报道  

编辑:桃子 拉燕

【新智元导读】《巫师》第二季,还没搞清人物关系?外国小哥Milán Janosov近日发了一篇论文专门研究这部剧。他通过AI对原著系列中的7本书进行梳理后,绘出了一张完美人物关系图。
 
一口气刷完《巫师》,人物情节乱如麻。
 
 
外国小哥Milán Janosov直接用AI对人物社交关系网络梳理了一遍。
 
下面2个节点中的连线,代表在小说中的5句话里同时出现的人物。
 
一个Geralt以为中心,另一个以Ciri为中心。
 
 
是不是看过后,只能用豁然开朗来形容。
 

追剧最高境界:写论文


在国内,大家听闻《猎魔人》的故事便是由波兰作家Andrzej Sapkowski编写的奇幻小说The Witcher。
 
这本书共包含3部短篇小说集、5部长篇小说,还有1篇前传。
 
 
要说这部奇幻著作的影响力,不亚于《权力的游戏》,甚至还有的一拼。
 
它先被做成了名声赫赫的《巫师》系列游戏,还被翻拍成了一部Netflix(网飞)电视剧。
 
其实早在游戏发售前,《巫师》小说在欧洲销量就已超过500万册,还曾被波兰总理用作国礼送给奥巴马。
 
作者本人「安大爷」也拿到了奇幻文学界最高奖项「世界奇幻大奖」。
 
 
2019年12月,《巫师》第一季上线就迎来了流量高峰。
 
目前,《巫师》已经更新到了第二季。2021年12月17日正式播出后,仅在首周就吸引了全球用户22亿分钟的观看时间。
 
 
为了帮助广大网友理清人物关系脉络,Datopolis首席科学家Milán Janosov专门为此写了一篇论文A Network Map of The Witcher
 
他绘制了一个可视化网络图,概述了这部奇幻著作中的故事情节和人物关系。
 
论文地址:https://arxiv.org/pdf/2202.00235.pdf
 
Milán Janosov表示,「当我迷上了Netflix拍的《巫师》剧集后,我在去年早些时候决定开始读原著,其故事情节把我深深吸引了进去。
 
这和几年前看《权力的游戏》的经历有点相似,为了从中获得更多信息,便激发起了我做研究的兴趣。」
 

如何研究?

 
Milán Janosov研究的第一步是收集数据,用于网络地图的构建。
 
一开始,他收集的对象只有Netflix剧集中的字幕,但他很快发现只有字幕是远远不够的。于是他就开始着手分析全系列原书的文本。
 
 
因此,作者选择将《巫师》系列中7本短篇/长篇小说作为主要的数据来源,总共大约2500页,超过100万字,这几本书分别是:
 
《白狼崛起》(The Last Wish)
《宿命之剑》(The Sword of Destiny)
《精灵之血》(The Blood of Elves)
《轻蔑时代》(The Time of Contempt)
《火之洗礼》(The Baptism of Fire)
《雨燕之塔》(The Tower of the Swallow)
《湖中女士》(The Lady of the Lake)
 
图中前7本
 
此外,Janosov还从《巫师》维基网站上收集了每本书中的角色列表,列出了这些书中690个有名字的角色。
 
其中《宿命之剑》(The Sword of Destiny) 是人数最少的一本,共有117个人物。《湖中女士》(The Lady of the Lake) 人物最多,有200人。
 
数据有了,接下来就是怎么做出这个社交网络图了。
 
 
Janosov写了个程序检索书里出现的所有句子,只要句子里出现角色的名字,就给记下来。
 
这就可以让他知道任意两个角色之间的关系远近。如果在同一部分的文本里经常同时出现两个角色,那么就可以推断出他们的关系比较近,反之亦然。
 
Janosov表示,「结果表明,出现距离上的相近性很好地反映了两个角色之间的关系。他们有没有相遇,有没有在同一个情节里同时出现,等等。」

「巫师」网络图

 
温馨提示:这部分有剧透。
 
在社交图中,角色用一个一个的节点来表示,节点的大小和角色的度中心性(degree centrality)相关,而节点的颜色则表示角色所属的网络社区。
 
两个节点之间的连线,和这2个角色在小说中5句话的范围内同时出现的次数,是相关且成比例的。其中,最重要的50个角色做上了标记。
 
网络节点链接的次数与小说中两个人物被提及的次数成正比
 
红色代表网飞改编《巫师》第一季的剧集中出现的人物,灰色代表书中有却没有出现在电视剧中的角色。
 
不难看出,这个网络包含两个主要的社区: 一个以Ciri为中心,另一个以Geralt为中心。
 
一方面,你可以从这个图表中读到,Geralt周围都是他的旅伴Dandelion (Jaskier) ,Regis,Milva和Cahir,他们一直在执行营救任务寻找Ciri。这是在电视剧前两季中完全消失的故事情节。
 
完整https://nightingaledvs.com/wp-content/uploads/2021/12/fig3_full-1.png
 
另一方面,除了Geralt,Ciri还与Yennefer和Triss的联系最紧密。
 
其实,小说中的大多数重要人物都已经在剧中出现了,但是仍然有一些没有提及。
 
如下,作者列出了第一栏只显示 Netflix 剧集中的人物,第二栏则涵盖了小说中的所有人物。
 
第二栏用红色显示了出现在小说排行榜上的人物,但在Netflix剧集中没有出现。
 
 
这意味着,一方面,接下来的几季可能会详细阐述已经开始的线索和人物发展,增加一些衍生情节,也可能会显示出与原著的一些显著差异,以不可预见的方式重新布局小说的网络。

作者介绍


论文作者Milán Janosov来自匈牙利,目前是Datapolis 的首席数据科学家,中欧大学的研究员,Maven7的资深数据科学家,以及欧盟委员会的数据科学专家。
 
他在2020年获得了网络和数据科学的博士学位,曾在布达佩斯的罗兰大学(ELTE)和中欧大学、波士顿的巴拉巴西实验室和剑桥的贝尔实验室学习和研究。
 
Janosov曾3次获得匈牙利共和国奖学金,在科学竞赛中多次获奖,在《自然》杂志等同行评议的期刊和会议上多次发表作品。
 
 
网络科学可以用于寻找大量没有结构可言的数据中深藏的规律,比如文本、小说、电影剧本等等。
 
Janosov的论文是一个珍贵的例子。在读完几千页的书,或者其它文本之后,人们可以大致了解一段故事的结构是怎么样的。但记住所有的角色和情节基本就不可能了。
 
如果让读者来画一张从故事中提取的导图,很大概率画出来的图并不准确。相对地,这件事如果交给网络科学来做,就可以用客观、量化的方法来总结一系列的书。
 
Janosov表示,「我很惊讶也很激动,看到不同的情节可以集中在网络社区里。有那么灵光乍现的一瞬间,就是那一刻你发现所有事情都合理了。谁遇见了谁,谁和谁在一起,主要的冲突是在哪里爆发的,支线情节又是在哪里展开的,等等,全部都有迹可循,就好像在看一部侦探电影一样。」

 

参考资料:

https://techxplore.com/news/2022-02-scientist-network-witcher.html

https://nightingaledvs.com/a-network-map-of-the-witcher/

https://arxiv.org/abs/2202.00235

https://post.smzdm.com/p/a839d6z7/

https://zh.wikipedia.org/wiki/%E7%8C%8E%E9%AD%94%E4%BA%BA


登录查看更多
1

相关内容

Netflix 是一家美国公司,在美国、加拿大提供互联网随选流媒体播放,定额制DVD、蓝光光碟在线出租业务(在加拿大仅提供流媒体播放)。
ICML 2021论文收录
专知会员服务
122+阅读 · 2021年5月8日
【WSDM2021】多交互注意力网络细粒度特征学习的CTR预测
专知会员服务
24+阅读 · 2020年12月27日
专知会员服务
82+阅读 · 2020年9月27日
2700篇+机器学习推理文献大全(1996-2019),附下载
专知会员服务
29+阅读 · 2020年9月6日
专知会员服务
109+阅读 · 2020年3月12日
网络作家的蜗居人生
36氪
0+阅读 · 2022年3月3日
一场APP年度报告大PK,已经开始预警
人人都是产品经理
0+阅读 · 2021年12月29日
吴恩达说,AI论文够多了,赶紧搞吧!
云头条
20+阅读 · 2017年11月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
VIP会员
相关VIP内容
ICML 2021论文收录
专知会员服务
122+阅读 · 2021年5月8日
【WSDM2021】多交互注意力网络细粒度特征学习的CTR预测
专知会员服务
24+阅读 · 2020年12月27日
专知会员服务
82+阅读 · 2020年9月27日
2700篇+机器学习推理文献大全(1996-2019),附下载
专知会员服务
29+阅读 · 2020年9月6日
专知会员服务
109+阅读 · 2020年3月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员