This study develops a hierarchical Bayesian framework that integrates expert domain knowledge to quantify player-specific effects in expected goals (xG) estimation, addressing a limitation of standard models that treat all players as identical finishers. Using 9,970 shots from StatsBomb's 2015-16 data and Football Manager 2017 ratings, we combine Bayesian logistic regression with informed priors to stabilise player-level estimates, especially for players with few shots. The hierarchical model reduces posterior uncertainty relative to weak priors and achieves strong external validity: hierarchical and baseline predictions correlate at R2 = 0.75, while an XGBoost benchmark validated against StatsBomb xG reaches R2 = 0.833. The model uncovers interpretable specialisation profiles, including one-on-one finishing (Aguero, Suarez, Belotti, Immobile, Martial), long-range shooting (Pogba), and first-touch execution (Insigne, Salah, Gameiro). It also identifies latent ability in underperforming players such as Immobile and Belotti. The framework supports counterfactual "what-if" analysis by reallocating shots between players under identical contexts. Case studies show that Sansone would generate +2.2 xG from Berardi's chances, driven largely by high-pressure situations, while Vardy-Giroud substitutions reveal strong asymmetry: replacing Vardy with Giroud results in a large decline (about -7 xG), whereas the reverse substitution has only a small effect (about -1 xG). This work provides an uncertainty-aware tool for player evaluation, recruitment, and tactical planning, and offers a general approach for domains where individual skill and contextual factors jointly shape performance.


翻译:本研究开发了一种分层贝叶斯框架,通过整合专家领域知识来量化期望进球(xG)估计中的球员特异性效应,以解决标准模型将所有球员视为相同终结者的局限性。利用StatsBomb 2015-16赛季的9,970次射门数据和《足球经理2017》评分,我们将贝叶斯逻辑回归与信息先验相结合,以稳定球员层面的估计,特别是对于射门次数较少的球员。分层模型相较于弱先验降低了后验不确定性,并展现出强大的外部有效性:分层预测与基线预测的相关系数达R2 = 0.75,而基于StatsBomb xG验证的XGBoost基准模型达到R2 = 0.833。该模型揭示了可解释的球员专长特征,包括一对一终结(阿圭罗、苏亚雷斯、贝洛蒂、因莫比莱、马夏尔)、远射(博格巴)以及首次触球处理(因西涅、萨拉赫、加梅罗)。同时,模型识别出因莫比莱和贝洛蒂等表现未达预期球员的潜在能力。该框架支持通过在同一情境下重新分配球员射门机会进行反事实“假设”分析。案例研究表明,桑索内若获得贝拉尔迪的射门机会将产生+2.2 xG,这主要源于高压情境下的表现;而瓦尔迪与吉鲁的替换分析显示出强烈不对称性:用吉鲁替换瓦尔迪会导致xG大幅下降(约-7 xG),而反向替换仅产生微小影响(约-1 xG)。这项工作为球员评估、招募和战术规划提供了具备不确定性认知的工具,并为个体技能与情境因素共同影响绩效的领域提供了通用方法论。

0
下载
关闭预览

相关内容

FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
34+阅读 · 2019年10月18日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
163+阅读 · 2019年10月12日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员