【会建模你也能当奥斯卡评委】机器学习预测奥斯卡6大奖项全中!

2018 年 3 月 6 日 新智元




   新智元编译  

来源:blog.bigml.com

编译:肖琴


【新智元导读】自去年成功预测第89届奥斯卡8项大奖后,机器学习和数据分析平台BigML再次公布今年的大奖预测结果。今年,利用新的Deepnet模型,BigML预测奥斯卡金像奖的最佳影片、最佳导演、最佳男主角、最佳女主角、最佳女配角和最佳男配角六大奖项,全部预测正确!



今年《水形物语》(The Shape of Water)获得13项提名,显然是最受欢迎的影片,但我们也看到一系列高质量的独立作品与大作之间的激烈竞争。不过,机器学习模型可不在乎这些,因为它们不仅仅跟随评论家的观点。相反,它们根据过去获奖的电影来搜索模式,然后对今年的提名进行预测。



那么,数据来自哪里?


数据


理论上,模型会随着数据增加而变得更好。因此,今年我们保留了去年的所有预测数据和特征。包括从2000年到2017年的共计1183部电影,每部电影有100多种特征,包括:

  • 电影的特点,例如持续时间,预算和流派。

  • IMDB中的电影评价数据,如投票、评级和Metascore。

  • 今年的20个主要电影奖项的提名和获奖者,包括金球奖、英国电影学院奖、美国演员工会奖和评论家选择奖。



今年数据的唯一重大变化是从IMDB中删除了全部用户评论,因为在去年的模型中,这些数据被证明是不重要的,需要花很多功夫获取评论数据。


模型


像去年一样,我们为每个奖项类别训练一个单独的模型。不同的一点是,今年我们使用Deepnet,这是一个深度神经网络,而不是去年使用的集成模型(ensembles)。使用BigML deepnet及其独特的强大自动优化选项(“自动网络搜索”)是确保构建性能最佳的分类器的最简单、最安全的方式。因为几十个不同的网络同时在后台训练,每个模型只需要大约30分钟的训练时间,但是因为最终的模型需要通过试错来优化,仍然需要大量时间。



deepnet创建好后,我们可以很容易地检查模型最重要的特性以及它们分别对预测的影响。例如,在预测最佳影片时,我们可以在高排名的候选里发现多个奖项,例如评论家选择奖、在线电影电视奖、好莱坞电影奖和英国电影学院奖。为了让DNN更易于解释,BigML提供了一个独特的deepnet可视化工具,即局部依赖图(Partial Dependence Plot),用以分析各个特征对预测的边际影响。

我们使用2000年到2012年间的电影来训练模型,然后使用2013年至2016年间的电影数据评估模型。在所有奖项类别中,我们得到超过0.98的ROC AUC,这意味着模型能够连续四年(2013年至2016年)预测获奖者,很少有错误。例如下方预测最佳女主角的混乱矩阵,它能准确预测出4个测试年份中的3个。



预测


接下来让我们预测2018年的奥斯卡获奖影片!


对于每个奖项,模型给出了获奖者和其他提名影片预测的分数。


《水形物语》以91分被预测为最佳影片。不过模型也给其他提名影片不错的分数,《三块广告牌》得到68分。


对于最佳导演奖,模型没有任何犹豫。 吉列尔莫·德尔·托罗( Guillermo del Toro )得到最接近获奖的75分,其他提名人的分数没有接近他的。



同样,对于最佳女主角奖项,似乎也不存在竞争。 Frances McDormand得到99分,毫无疑问是最受欢迎的。其他候选人的分数远远落后,Margot Robbie只得到5分。


加里·奥德曼(Gary Oldman)凭借在《黑暗时刻》中饰演的温斯顿·丘吉尔精彩表演,以88分的成绩被预测为最佳男主角得主。不过,在《请以你的名字呼唤我》(Call Me By Your Name)中饰演艾力奥的后起之秀提莫西 · 查拉梅(Timothée Chalament)得到72分。另一个强大的竞争对手是完美的职业选手丹尼尔·戴-刘易斯(Daniel Day-Lewis),他以在《魅影缝将》中饰演的角色得到51分。


最佳女配角的5名提名中,模型偏爱艾莉森·珍妮(Allison Janney),她因为在《我,花样女王》(I, Tonya)中扮演的角色得到64分。



最佳男配角的竞争更激烈,不过,山姆 · 洛克威尔(Sam Rockwell)在《三块广告牌》上的角色显然更受欢迎,得到95分。威廉·达福(Willem Dafoe)凭借《弗罗里达项目》(The Florida Project )得到61分。





以上就是BigML对2018年奥斯卡金像奖的预测,它只预测了6项大奖,毫无疑问,6大奖项全中!BigML是一个简单易用的开发机器学习模型的平台,提供API,你也可以在上面设置数据源、创建数据库、创建模型,并得到基于数据的预测。


原文:https://blog.bigml.com/2018/03/01/predicting-the-2018-oscar-winners/



【2018 新智元 AI 技术峰会倒计时 24 天】大会早鸟票已经售罄,现正式进入全额票阶段。


2017 年,作为人工智能领域最具影响力的产业服务平台——新智元成功举办了「新智元开源 · 生态技术峰会」和「2017AIWORLD 世界人工智能大会」。凭借超高活动人气及行业影响力,获得 2017 年度活动行 “年度最具影响力主办方” 奖项。


其中「2017AIWORLD 世界人工智能大会」创人工智能领域活动先河,参会人次超 5000;开场视频在腾讯视频点播量超 100 万;新华网图文直播超 1200 万;

2018 年的 3 月 29 日,新智元再汇 AI 之力,共筑产业跃迁之路,将在北京举办 2018 年中国 AI 开年盛典——2018 新智元 AI 技术峰会。本次峰会以 “产业 · 跃迁” 为主题,邀请谷歌、微软、亚马逊、BAT、科大讯飞、京东和华为等企业重量级嘉宾,共同研讨技术变革,助力领域融合发展。


新智元诚挚邀请关心人工智能行业发展的各界人士 3 月 29 日亲临峰会现场,共同参与这一跨领域的思维碰撞。


关于大会,请关注新智元微信公众号或访问活动行页面:http://www.huodongxing.com/event/8426451122400



【扫一扫或点击阅读原文抢购大会门票】

 2018 新智元 AI 技术峰会购票二维码: 



加入社群


新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号: aiera2015_1 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。


此外,新智元 AI 技术 + 产业领域社群 (智能汽车、机器学习、深度学习、神经网络等) 正在面向正在从事相关领域的工程师及研究人员进行招募。


加入新智元技术社群 共享 AI + 开放平台

登录查看更多
1

相关内容

【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
151+阅读 · 2020年6月27日
【哈佛大学】机器学习的黑盒解释性,52页ppt
专知会员服务
168+阅读 · 2020年5月27日
【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
【Google-CMU】元伪标签的元学习,Meta Pseudo Labels
专知会员服务
31+阅读 · 2020年3月30日
CMU博士论文:可微优化机器学习建模
专知会员服务
58+阅读 · 2019年10月26日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
15款免费预测分析软件!收藏好,别丢了!
七月在线实验室
10+阅读 · 2018年2月27日
推荐系统机器学习算法概览
论智
7+阅读 · 2017年12月14日
逻辑回归(Logistic Regression) 模型简介
全球人工智能
5+阅读 · 2017年11月1日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
视频 | 如何用 AI 预测股价?
AI研习社
5+阅读 · 2017年6月30日
Arxiv
7+阅读 · 2019年4月8日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
5+阅读 · 2017年12月29日
Arxiv
3+阅读 · 2017年12月18日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
相关资讯
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
15款免费预测分析软件!收藏好,别丢了!
七月在线实验室
10+阅读 · 2018年2月27日
推荐系统机器学习算法概览
论智
7+阅读 · 2017年12月14日
逻辑回归(Logistic Regression) 模型简介
全球人工智能
5+阅读 · 2017年11月1日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
视频 | 如何用 AI 预测股价?
AI研习社
5+阅读 · 2017年6月30日
相关论文
Arxiv
7+阅读 · 2019年4月8日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
5+阅读 · 2017年12月29日
Arxiv
3+阅读 · 2017年12月18日
Arxiv
5+阅读 · 2015年9月14日
Top
微信扫码咨询专知VIP会员