新智元报道
说起2010年南非世界杯的最大网红,一定非「章鱼保罗」莫属!
不幸的是,保罗已经永远地离开了我们,但它的「遗产」却在人们预测足球比赛结果的尝试中持续存在。
在艾伦图灵研究所(The Alan Turing Institute),随着2022年卡塔尔世界杯的持续进行,三位研究员Nick Barlow、Jack Roberts和Ryan Chan决定用一种AI算法预测今年的冠军归属。
预测模型
图灵研究所的统计算法基于一款衍生于足球游戏《英超范特西》的模型「AIrsenal」(没错,从名字就能看出,该算法的发明者一定是阿森纳球迷)。
该模型借鉴了Dixon和Coles于1997年推出的足球预测经典模型。该模型将球队攻击强度、防守强度和主场优势考虑在内,并使用了贝叶斯统计计算比赛中最有可能得分的球队。
三位研究员调整了AIrsenal模型,使其更适合预测国际比赛的结果。
例如,每支国家队都最常与来自同一大洲的球队比赛,例如巴西自2019年之后就没有与任何欧洲球队比赛过。这可能会在预测来自不同大洲的球队之间的结果时产生偏差。
为了解决这个问题,研究员引入了不同大洲联合会间的「相对优势参数」,对模型进行了修正。
训练数据
为了精准预测2022年世界杯的冠军,首先需要用过去的数据对模型训练。
三位图灵院的研究员采用GitHub用户martj42编制的国际足球比赛综合数据库——该数据库记录了自1872年以来,每场足球比赛的详细结果。
在训练数据中,世界杯正赛(2002年之后)和近期比赛的权重,要依次大于洲际锦标赛、预选赛和友谊赛。研究员还将FIFA官方排名输入到模型中,以提供对球队表现的最新估计。
值得一提的是,研究员也在新闻稿中说明,他们的模型并没有将「球员」、「点球」和「地点/天气/其他」等因素考虑在内,却仍然成功预测了2014年和2018年世界杯的冠军德国和法国。
预测结果
最终,通过这个AI模型以及100,000次实验结果,艾伦图灵研究所分别对「最终冠军」以及「英格兰和威尔士队的成绩」进行了预测,最终给出了两份报告。
通过上表我们可以发现,在100,000次测试结果中,巴西有接近25,000次都赢得了最终的冠军,夺冠概率大约为25%。
比利时和阿根廷分别是夺冠的第2和第3大热门,概率分别为18%和13.5%。
此外,夺冠概率4-10位的球队分别是法国(11%)、英格兰(7.5%)、西班牙(4.5%)、荷兰(4.4%)、丹麦(3.1%)、葡萄牙(3.0%)和克罗地亚(2.2%)——清一色是欧洲球队。
根据AI模型对英格兰和威尔士队的成绩模拟,威尔士有超过一半的概率(52%)止步小组赛。
英格兰则情况稍好,只有20%的概率无缘小组出线,不过模型仍认为他们有70%的概率止步8强,并不看好「三狮军团」的夺冠前景。
不知这样的预测,远在英伦半岛的英格兰球迷,是否会同意呢。
其他模型同样看好巴西
无独有偶。
最近,来自卢森堡大学、慕尼黑工业大学和多特蒙德工业大学的联合研究团队,也利用2002、2006、2010、2014和2018五届世界杯的数据,结合各支球队的结构和各国GDP等参数对「随机森林模型」进行了训练,以此预测2022年世界杯的冠军归属。
最终结果显示,巴西队进入决赛的概率为23.5%,并有15%的概率最终夺冠,在32强中高居榜首。夺冠概率2-5位的球队分别是:阿根廷、荷兰、德国和法国。
联合研究团队AI模型对最终冠军的预测,与艾伦图灵研究所的研究结果如出一辙。由此看来,「桑巴军团」加冕第六颗星——还真是指日可待呢!
最后我们也必须承认,虽然利用AI去预测比赛结果具有一定科学性,巴西、比利时和阿根廷等球队也确实是本届大赛的最大热门,但模型绝对不可能将全部因素都涉及到。
无论AI模型有多精准,足球永远是一种随机游戏。
绿茵场上那波诡云谲的不可预测因素,或许才是我们喜欢、并深深热爱它的原因。
https://www.zeileis.org/news/fifa2022/
https://www.eurekalert.org/news-releases/971175
https://www.turing.ac.uk/blog/can-our-algorithm-predict-winner-2022-football-world-cup
https://www.iflscience.com/ai-has-run-100-000-simulations-and-predicted-the-2022-world-cup-winner-66314