Corporate carbon emissions data is disclosed by approximately 65\% of large and mid-sized companies globally, despite being a key indicator of corporate climate performance. With investors increasingly looking to integrate climate risk into their investment strategies and risk reporting, this creates demand for robust prediction models that can generate reliable estimates for missing carbon disclosures. However, these estimates lack transparency and are frequently used in the investment decisions process with the same confidence as corporate reported data. As disclosures remain mostly voluntary and the propensity to disclose is shaped by several factors (e.g. size, sector, geography), missing emissions data should be assumed to be \textit{missing not at random} (MNAR). However, widely used estimation methods (e.g. linear regression models) typically do not correct for MNAR bias and do not accurately reflect the uncertainty of estimated data. The objective of this paper is to address these issues: (1) account for the uncertainty of the missing data and thus obtain regression coefficients by multiple imputation (MI) (2) correct for potential bias by using MI algorithms based on Heckman's sample selection model introduced by Galimard et al. (3) estimate missing carbon disclosures with linear models based on MI and report on the uncertainty of predicted values, measured as the length of the prediction interval. In the simulation, our approach resulted in an accuracy gain based on root mean squared error of up to 30\%, and up to a 40\% higher coverage rate than the existing models. When applied to commercial data, the results suggested up to 20\% higher coverage for proposed methods.


翻译:全球大中大公司约65 % 披露公司碳排放数据,尽管这是公司气候绩效的一个关键指标。投资者越来越希望将气候风险纳入其投资战略和风险报告,这就要求制定可靠的预测模型,以得出碳披露缺失的可靠估计数;然而,这些估计数缺乏透明度,并经常用于投资决策过程,其可信度与公司报告的数据相同。由于披露大多是自愿的,而且披露的倾向取决于若干因素(例如规模、部门、地理),因此应该假设缺失的排放量数据不是随机的更高指标。然而,随着投资者越来越希望将气候风险纳入其投资战略和风险报告,因此,广泛使用的估算方法(如线性回归模型)往往不正确,无法产生对碳披露缺失的准确性估计;然而,这些估计数缺乏透明度,无法准确反映估算数据的不确定性,因此,通过多重估算(MI)(2) 纠正潜在偏差,根据Galimard 等人提出的40 % 样本选择模型,采用40 % (MNAR)。 然而,广泛使用的估算方法(如线性回归模型)通常不准确性,没有准确性模型基于IMI的预测结果,根据现有30度预测结果的不确定性,采用在线模型,采用现有模型,采用30级模型,根据模型测测测测测测测测测测测。

0
下载
关闭预览

相关内容

Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
ERROR: GLEW initalization error: Missing GL version
深度强化学习实验室
9+阅读 · 2018年6月13日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
lightgbm algorithm case of kaggle(上)
R语言中文社区
8+阅读 · 2018年3月20日
Arxiv
0+阅读 · 2022年2月18日
On Variance Estimation of Random Forests
Arxiv
0+阅读 · 2022年2月18日
Arxiv
0+阅读 · 2022年2月17日
Arxiv
0+阅读 · 2022年2月16日
VIP会员
相关VIP内容
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
ERROR: GLEW initalization error: Missing GL version
深度强化学习实验室
9+阅读 · 2018年6月13日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
lightgbm algorithm case of kaggle(上)
R语言中文社区
8+阅读 · 2018年3月20日
Top
微信扫码咨询专知VIP会员