即便不是足球迷,你也应该听说过章鱼保罗。2010 年南非世界杯,这条八爪鱼预测的比赛结果 8 猜全中,这一不可思议的神奇预测让它受到了全世界球迷的追捧,并赐封其为“预言帝”。
在这之后,各国都试图扶持动物界的新星上位,但阿猫阿狗都是“扶不起的阿斗”,预测准确性远不及“上古神兽”。此次的俄罗斯世界杯上官方也捧出白猫阿喀琉斯,来承担“预言帝”的重任,不过就其预测结果来看,还是乖乖当个吉祥物宣传国家形象就好。
今年的世界杯,(赌)球(徒)迷们开始指望起了人工智能预测以求发家致富,各大研究机构也基于自己的算法模型给出了预测赔率和结果,甚至还有专门的 AI 赌球 APP 上线,它们的预测不像动物那样玄乎,大数据分析看上去似乎都是“理性”的结果,但各家的预测结果也不尽相同。
即便如此,随着夺冠大热门德国在小组赛出局,以及西班牙止步 16 强,这些人工智能都被“打脸”了,几乎无一幸免。
先是俄罗斯彼尔姆国立研究大学,该校物理系的学生根据 2006 年、2010 年和 2014 年世界杯的数据资料,然后基于影响比赛的几条标准,将数据输入神经网络,综合各项参数后预测世界杯前三名将是德国队、巴西队和阿根廷队,而俄罗斯队则在 32 支队伍中排名 27,换言之,人工智能甚至不认为俄罗斯队能从小组赛中出线。当时彼尔姆国立研究大学称,这项预测的准确度超过 80%。
德国多特蒙德技术大学的 Andreas Groll 和团队甚至写了一篇预测比赛结果的论文(https://arxiv.org/abs/1806.03208),他们根据 2002 - 2014 年的四届世界杯的所有比赛数据,为了提升了预测能力,他们结合了机器学习和统计学的随机森林算法,然后对球队的每一场比赛结果都进行建模,利用结果构建出了可能的比赛进程。最后,该算法模型预测出了本届世界杯所有球队的获胜概率。
他们的算法模型预测,在小组赛还未开始时,最有可能夺冠的球队为西班牙、德国、和巴西,但当团队对比赛进行了 10 万次模拟后,发现如果德国和西班牙挺进四分之一决赛,则两者夺冠的胜率就会持平。但世事难料,他们的机器学习算法显然不会料到西班牙会在首战失利后更换主教练。
高盛也在赛前启动了机器学习预测的方式,使用的方法也是随机森林。它们运行了 20 万个模型,参考了 FIFA 排名、人口、GDP、球员个人以及团队等各项数据,随后模拟了 100 万种不同的比赛形式,计算出了每支球队获胜的概率。
高盛预测,巴西将赢得世界杯冠军,在决赛中以 1.70 比 1.41 的赔率击败德国队,而四分之一决赛将在法国和西班牙、巴西和比利时、葡萄牙和阿根廷、德国和英格兰之间进行。好吧,就只预测对了巴西和比利时这一场。
这还没完,高盛没有因为此前的预测结果而气馁,他们近期又利用模型重新折腾出了一个预测报告,显示巴西将在决赛中与克罗地亚对决,而其在小组赛结束后更改的预测结果为巴西将在决赛中对决英格兰。反正巴西是冠军没变。
除此之外,Alteryx,瑞银和德国的商业银行,还有游戏商 EA Sports 利用游戏《FIFA 18》推出的球员最新数据,提前就预演了一次世界杯的比赛,预测结果是,法国将干掉德国夺得世界杯冠军。
综上来看,除了冠军归属还是个未知数外,德国和西班牙的爆冷折戟几乎使得所有的 AI 预测结果全部宣告阵亡,但问题是,这是否意味着机器学习在预测世界杯冠军没用?
体育赛事天然具有庞大的数据,人们一直以来都会通过以前的数据统计来预估未来的比赛概况,而进行数据整合、特征建模和结果预测,这本身就属于机器学习的范畴。这也说明由机器学习驱动来预测赔率在一定程度上是可行的,只是在结果的准确性上效果较差。对于需要庞杂数据的 AI 而言,只有可用数据的质量和数量越好,准确预测的可能性才会越大。
对于体育比赛而言,预测结果显然不像 AlphaGo 预测棋局那样,完全处在一个固定场景规则之中。
尽管许多研究机构利用 AI 算法试图去捕捉比赛的随机性,让预测结果变得可控,但在比赛过程中,还有气温、裁判、球员和团队整体状态等不可控的变量,也就是所谓的“运气”成分,而任何模型和人为的预测在它面前都是无力的。正如高盛发表免责声明所称的它们即便使用了最高级的统计技术,但预测仍然高度不确定。
所以不妨把 AI 预测世界杯看做是一项娱乐游戏,享受比赛就好。
(顺便说一句,瓜子、啤酒准备好,法国和乌拉圭的 1/4 决赛要开始了。)
——【完】——
在线公开课NLP专场
◆
精彩继续
◆
时间:7月12日 20:00-21:00
扫描海报二维码,免费报名
添加微信csdnai,备注:公开课,加入课程交流群
点击 | 阅读原文 | 免费报名