别样的芳华年代给了我们怎样的感受?

2018 年 1 月 6 日 Datartisan数据工匠 数析学院SDCry!!

2017年12月15日,由冯小刚执导的电影《芳华》在中国大陆上映,这部同年9月7日首映于多伦多电影节的影片根据严歌苓同名小说改编,讲述了上世纪七十到八十年代充满理想和激情的军队文工团,一群正值芳华的青春少年,经历着成长中的爱情萌发与充斥变数的人生命运。截至2018年1月2日,该影片的豆瓣评分7.8分,评价人数达247951人,其中5星评论占比24.2%、4星评论占比24.2%。

对于这样一部有些特别的电影,广大网友是如何评价的呢?为了探究这一问题,我们通过利用数析学院课程中的网络抓取技术获得了该影片在豆瓣上自2017年9月7日上映之后共计3999条网友影评,结合Python中的jieba与wordcloud库,我们对所有的影评进行了分句分词与词频统计分析,绘制了影评的整体词云图。

 

词云图输出:

词云——芳华影评(遮罩背景图:《芳华》海报)

从整体词云中可以看到,电影的时代背景以及主角刘峰成为了网友影评中集中探讨的主要话题。为了进一步挖掘影评中的关注焦点,我们通过tfidf特征提取与LDA主题模型对影评中的主题进行了挖掘,并基于K-means方法完成了影评内容的文本聚类,发掘了影评中的主要焦点。


LDA主题模型构建:

主题模型结果可视化:

基于K-means聚类结果,影评中的值得一提的五大焦点如下所示:


焦点一:刘峰与饰演者黄轩

在影评中《芳华》一片的选角颇受关注,剧中人物刘峰的一生令人唏嘘感叹,而演员黄轩对该角色的演绎也受到了大多数评论者的褒赏,该焦点涉及影评数1512条。


焦点二:文工团的解散

在影片《芳华》中,文工团作为一个重要的时代象征,承载着故事主人公的重要心路历程,一场文工团解散的剧情给一部分观影者带来了较深的感触,该焦点涉及影评数1054条。


焦点三:剧中人物的爱情关系

主人公之间的爱情,是影片《芳华》中的重要线索,刘峰、何小萍、林丁丁等几个重要角色之间的情感故事也成为了该片影评中谈论的重点之一,该焦点涉及的影评数达1072条。

 

焦点四:残酷的战争

除了爱情戏,《芳华》中描写的战争也成为了一部分影评中谈论的主要情节,大部分影评认为大概6分钟的长镜头炫技而不违和,突出了战争的残酷与真实,该焦点涉及影评数756条。


焦点五:怎样的人最懂善良

除了上述关于剧情与角色之间的探讨以外,影片《芳华》中的金句——“一个始终不被善待的人,最能识别善良,也最珍惜善良。”同样受到了一部分影评者的关注。焦点涉及的影评数达635条。


焦点六:青春

作为一部描写20世纪70年代生活的影片,《芳华》谈及了那个不为人熟知的年代中别样的青春故事,也引发了一部分影评中对“青春”一词的重新审视与探讨,焦点涉及的影评数达392条。

 

青春的芳华易逝,但往事并不如烟。基于主题模型与文本聚类,我们发现了《芳华》影评中的上述几大焦点,若想了解更多关于那个年代发生的故事,体验曾经属于过那个时代的艺术家对最初所有掺杂在“青春”里的朦胧的“情感”,不妨亲自走进影院一探究竟吧。


如果想学习文本数据分析、文本挖掘、自然语言处理等相关技能,扫描二维码关注「数析学院服务号」 



掌握课堂资讯


长按识别二维码关注


登录查看更多
2

相关内容

主题模型,顾名思义,就是对文字中隐含主题的一种建模方法。“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。   在这里,我们先定义一下主题究竟是什么。主题就是一个概念、一个方面。它表现为一系列相关的词语。比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“李彦宏”等词语就会以较高的频率出现,而如果涉及到“IBM”这个主题,那么“笔记本”等就会出现的很频繁。如果用数学来描述一下的话,主题就是词汇表上词语的条件概率分布 。与主题关系越密切的词语,它的条件概率越大,反之则越小。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
钱炜:与山同坐,成为灯塔
罗辑思维
15+阅读 · 2019年6月30日
听完了1000+首古风歌曲,我发现自己也能火
PingWest品玩
4+阅读 · 2019年6月2日
一套书看懂百年飞机史!
地球知识局
3+阅读 · 2019年5月4日
当你的头出现在A片演员的身体上
PingWest品玩
7+阅读 · 2019年1月6日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
4+阅读 · 2018年4月29日
VIP会员
相关VIP内容
少标签数据学习,54页ppt
专知会员服务
198+阅读 · 2020年5月22日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
相关资讯
Top
微信扫码咨询专知VIP会员