编辑:桃子 拉燕
【新智元导读】《巫师》第二季,还没搞清人物关系?外国小哥Milán Janosov近日发了一篇论文专门研究这部剧。他通过AI对原著系列中的7本书进行梳理后,绘出了一张完美人物关系图。
外国小哥Milán Janosov直接用AI对人物社交关系网络梳理了一遍。
下面2个节点中的连线,代表在小说中的5句话里同时出现的人物。
一个Geralt以为中心,另一个以Ciri为中心。
在国内,大家听闻《猎魔人》的故事便是由波兰作家Andrzej Sapkowski编写的奇幻小说The Witcher。
这本书共包含3部短篇小说集、5部长篇小说,还有1篇前传。
要说这部奇幻著作的影响力,不亚于《权力的游戏》,甚至还有的一拼。
它先被做成了名声赫赫的《巫师》系列游戏,还被翻拍成了一部Netflix(网飞)电视剧。
其实早在游戏发售前,《巫师》小说在欧洲销量就已超过500万册,还曾被波兰总理用作国礼送给奥巴马。
作者本人「安大爷」也拿到了奇幻文学界最高奖项「世界奇幻大奖」。
2019年12月,《巫师》第一季上线就迎来了流量高峰。
目前,《巫师》已经更新到了第二季。2021年12月17日正式播出后,仅在首周就吸引了全球用户22亿分钟的观看时间。
为了帮助广大网友理清人物关系脉络,Datopolis首席科学家Milán Janosov专门为此写了一篇论文A Network Map of The Witcher。
他绘制了一个可视化网络图,概述了这部奇幻著作中的故事情节和人物关系。
论文地址:https://arxiv.org/pdf/2202.00235.pdf
Milán Janosov表示,「当我迷上了Netflix拍的《巫师》剧集后,我在去年早些时候决定开始读原著,其故事情节把我深深吸引了进去。
这和几年前看《权力的游戏》的经历有点相似,为了从中获得更多信息,便激发起了我做研究的兴趣。」
Milán Janosov研究的第一步是收集数据,用于网络地图的构建。
一开始,他收集的对象只有Netflix剧集中的字幕,但他很快发现只有字幕是远远不够的。于是他就开始着手分析全系列原书的文本。
因此,作者选择将《巫师》系列中7本短篇/长篇小说作为主要的数据来源,总共大约2500页,超过100万字,这几本书分别是:
《宿命之剑》(The Sword of Destiny)
《精灵之血》(The Blood of Elves)
《轻蔑时代》(The Time of Contempt)
《火之洗礼》(The Baptism of Fire)
《雨燕之塔》(The Tower of the Swallow)
《湖中女士》(The Lady of the Lake)
此外,Janosov还从《巫师》维基网站上收集了每本书中的角色列表,列出了这些书中690个有名字的角色。
其中《宿命之剑》(The Sword of Destiny) 是人数最少的一本,共有117个人物。《湖中女士》(The Lady of the Lake) 人物最多,有200人。
Janosov写了个程序检索书里出现的所有句子,只要句子里出现角色的名字,就给记下来。
这就可以让他知道任意两个角色之间的关系远近。如果在同一部分的文本里经常同时出现两个角色,那么就可以推断出他们的关系比较近,反之亦然。
Janosov表示,「结果表明,出现距离上的相近性很好地反映了两个角色之间的关系。他们有没有相遇,有没有在同一个情节里同时出现,等等。」
在社交图中,角色用一个一个的节点来表示,节点的大小和角色的度中心性(degree centrality)相关,而节点的颜色则表示角色所属的网络社区。
两个节点之间的连线,和这2个角色在小说中5句话的范围内同时出现的次数,是相关且成比例的。其中,最重要的50个角色做上了标记。
网络节点链接的次数与小说中两个人物被提及的次数成正比
红色代表网飞改编《巫师》第一季的剧集中出现的人物,灰色代表书中有却没有出现在电视剧中的角色。
不难看出,这个网络包含两个主要的社区: 一个以Ciri为中心,另一个以Geralt为中心。
一方面,你可以从这个图表中读到,Geralt周围都是他的旅伴Dandelion (Jaskier) ,Regis,Milva和Cahir,他们一直在执行营救任务寻找Ciri。这是在电视剧前两季中完全消失的故事情节。
完整https://nightingaledvs.com/wp-content/uploads/2021/12/fig3_full-1.png
另一方面,除了Geralt,Ciri还与Yennefer和Triss的联系最紧密。
其实,小说中的大多数重要人物都已经在剧中出现了,但是仍然有一些没有提及。
如下,作者列出了第一栏只显示 Netflix 剧集中的人物,第二栏则涵盖了小说中的所有人物。
第二栏用红色显示了出现在小说排行榜上的人物,但在Netflix剧集中没有出现。
这意味着,一方面,接下来的几季可能会详细阐述已经开始的线索和人物发展,增加一些衍生情节,也可能会显示出与原著的一些显著差异,以不可预见的方式重新布局小说的网络。
论文作者Milán Janosov来自匈牙利,目前是Datapolis 的首席数据科学家,中欧大学的研究员,Maven7的资深数据科学家,以及欧盟委员会的数据科学专家。
他在2020年获得了网络和数据科学的博士学位,曾在布达佩斯的罗兰大学(ELTE)和中欧大学、波士顿的巴拉巴西实验室和剑桥的贝尔实验室学习和研究。
Janosov曾3次获得匈牙利共和国奖学金,在科学竞赛中多次获奖,在《自然》杂志等同行评议的期刊和会议上多次发表作品。
网络科学可以用于寻找大量没有结构可言的数据中深藏的规律,比如文本、小说、电影剧本等等。
Janosov的论文是一个珍贵的例子。在读完几千页的书,或者其它文本之后,人们可以大致了解一段故事的结构是怎么样的。但记住所有的角色和情节基本就不可能了。
如果让读者来画一张从故事中提取的导图,很大概率画出来的图并不准确。相对地,这件事如果交给网络科学来做,就可以用客观、量化的方法来总结一系列的书。
Janosov表示,「我很惊讶也很激动,看到不同的情节可以集中在网络社区里。有那么灵光乍现的一瞬间,就是那一刻你发现所有事情都合理了。谁遇见了谁,谁和谁在一起,主要的冲突是在哪里爆发的,支线情节又是在哪里展开的,等等,全部都有迹可循,就好像在看一部侦探电影一样。」
参考资料:
https://techxplore.com/news/2022-02-scientist-network-witcher.html
https://nightingaledvs.com/a-network-map-of-the-witcher/
https://arxiv.org/abs/2202.00235
https://post.smzdm.com/p/a839d6z7/
https://zh.wikipedia.org/wiki/%E7%8C%8E%E9%AD%94%E4%BA%BA