这届世界杯冠军是谁?来看看AI预测的结果

2018 年 6 月 15 日 雷锋网

▲点击上方 雷锋网 关注



文 | 张莉

来自雷锋网(leiphone-sz)的报道

2010年南非世界杯,神奇的章鱼保罗因成功连续预测了8场赛事而名扬世界。

八年,弹指一挥间(没忘记你,巴西世界杯)。这一届的世界杯冠军又将花落谁家?显然,章鱼保罗已然指望不上了,但新的技术已经迫不及待地登场,8年后的俄罗斯世界杯,人工智能登场了。



德国研究人员:西班牙机会最大,但可能被德国队反转


来自德国多特蒙德技术大学的 Andreas Groll 和他的同事给出了一个答案。

他们使用了一种结合机器学习和传统统计学的叫做“随机森林”(Random Forest) 的算法,来分析最有可能夺冠的球队。

随机森林算法可以分析大型数据集,同时避免了其他数据挖掘算法的缺陷。传统的数据挖掘算法假设未来事件可以由决策树决定,该决策树通过引用一组训练数据来计算每个分支的结果。然而,决策树有一个问题,即在分支过程的后一阶段,由于训练数据稀疏,容易产生巨大变化,从而导致决策严重扭曲,产生过度拟合问题。

随机森林算法则不同。它不是计算每个分支的结果,而是计算随机分支的结果,如此计算多次,每次都有不同的随机选择的分支,最终结果是所有这些随机建构的决策树的平均值。

这种方法有显著的优点。它不存在困扰普通决策树的过度拟合问题,并且可以显示关键变量。因此,如果一个特定的决策树包含许多参数,很容易看出哪些参数对结果的影响最大,而弱变量可以被忽略。

Groll 和他的同事正是用这种方法来模拟 2018 世界杯。他们对球队可能进行的每一场比赛的结果进行建模,并利用结果构建出最有可能的比赛进程。

Groll 和 co 选定了一系列可能决定结果的潜在因素进行建模:一国 GDP 和人口数、国际足联对国家队的排名、球队本身属性(比如队员平均年龄、拥有的欧冠球员的数量、是否有主场优势等)。

下图显示了球队在整个比赛中的赔率,包括最有可能获胜的球队。根据研究人员的计算,西班牙最有可能胜出,概率为 17.8%,略高于德国

雷锋网注:AI 预测的世界杯排名

如果德国队在小组赛阶段获胜,在 16 队淘汰赛阶段更有可能遭遇强敌,算法得出德国进入四分之一决赛的几率为 58%。相比之下,西班牙不太可能在最后的 16 强中面临强大的对手,因此有 73% 的机会进入四分之一决赛。

但是!在 Groll 和 co 对整个比赛进行了 10 万次模拟后发现,在比赛开始的时候,西班牙机会最大,但如果德国打进四分之一决赛,冠军就会易主

昨晚想必大家已经兴奋地看完了第一场比赛,东道主俄罗斯 5-0 完胜沙特阿拉伯,但遗憾的是,根据他们的预测,这两支球队都不可能进入四分之一决赛。

当然,有人对这些预测持怀疑态度。由于足球比赛随机性太强,这种精确的比赛过程在实际比赛中可能性太小。

此外,他们的机器学习算法显然没有预测到,西班牙会在球队首战前两天解雇并更换主教练。



高盛:巴西将夺冠


梅西曾经说过:“在足球中,如果没有严谨和精确,才能和优雅就没有意义。”

高盛在编制 2018 年世界杯的预测时,似乎把他的话放在了心上。

该公司使用机器学习来运行 200,000 个模型,挖掘团队和个人球员属性数据,以帮助预测特定的比赛得分。然后,高盛模拟了 100 万次比赛的变化分析,计算出每个球队的晋级概率。

下图显示了高盛如何看待世界杯比赛进程。每个国家旁边的数字代表该球队是否能超过对手,并利用机器学习算法进行比赛迭代。

雷锋网注:高盛预测图

以下是高盛得出的关键结论:

预计巴西将以 1.70:1.41 的比分击败德国,赢得第六次世界杯冠军

尽管法国举起奖杯的几率比德国高,但预计在半决赛中与巴西的对决将使其无法赢得冠军;

英格兰有望进入四分之一决赛阶段,高盛表示将输给德国;

西班牙和阿根廷预计将落后,都将在四分之一决赛中失利;

尽管俄罗斯是世界杯主办国,但预计不会从小组赛中出线;

沙特阿拉伯是黑马,在小组赛阶段会领先于俄罗斯(显然已经预测错了)

雷锋网注:俄罗斯进球,普京得意摊手

via: MIT Technology Review ;Business Insider ;Motherboard

- END -

雷锋网诚招编辑、运营、兼职外翻等岗位

详情点击招聘启事

登录查看更多
2

相关内容

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。 决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。 分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【ACL2020-Google】逆向工程配置的神经文本生成模型
专知会员服务
17+阅读 · 2020年4月20日
自回归模型:PixelCNN
专知会员服务
27+阅读 · 2020年3月21日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
金融时序预测中的深度学习方法:2005到2019
专知会员服务
167+阅读 · 2019年12月4日
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
AI Challenger 2017 奇遇记
AINLP
5+阅读 · 2018年6月10日
手把手教你用Python库Keras做预测(附代码)
数据派THU
14+阅读 · 2018年5月30日
人工智能可以预测女朋友什么时候生气吗?
中科院物理所
3+阅读 · 2017年11月22日
视频 | 如何用 AI 预测股价?
AI研习社
5+阅读 · 2017年6月30日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
5+阅读 · 2019年4月8日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
5+阅读 · 2016年12月29日
VIP会员
相关资讯
机器学习预测世界杯:巴西夺冠
新智元
5+阅读 · 2018年6月11日
AI Challenger 2017 奇遇记
AINLP
5+阅读 · 2018年6月10日
手把手教你用Python库Keras做预测(附代码)
数据派THU
14+阅读 · 2018年5月30日
人工智能可以预测女朋友什么时候生气吗?
中科院物理所
3+阅读 · 2017年11月22日
视频 | 如何用 AI 预测股价?
AI研习社
5+阅读 · 2017年6月30日
Top
微信扫码咨询专知VIP会员