In the November 2016 U.S. presidential election, many state level public opinion polls, particularly in the Upper Midwest, incorrectly predicted the winning candidate. One leading explanation for this polling miss is that the precipitous decline in traditional polling response rates led to greater reliance on statistical methods to adjust for the corresponding bias -- and that these methods failed to adjust for important interactions between key variables like education, race, and geographic region. Finding calibration weights that account for important interactions remains challenging with traditional survey methods: raking typically balances the margins alone, while post-stratification, which exactly balances all interactions, is only feasible for a small number of variables. In this paper, we propose multilevel calibration weighting, which enforces tight balance constraints for marginal balance and looser constraints for higher-order interactions. This incorporates some of the benefits of post-stratification while retaining the guarantees of raking. We then correct for the bias due to the relaxed constraints via a flexible outcome model; we call this approach Double Regression with Post-stratification (DRP). We characterize the asymptotic properties of these estimators and show that the proposed calibration approach has a dual representation as a multilevel model for survey response. We then use these tools to to re-assess a large-scale survey of voter intention in the 2016 U.S. presidential election, finding meaningful gains from the proposed methods. The approach is available in the multical R package.


翻译:在2016年11月的美国总统选举中,许多州一级的民意测验,特别是在上中西部州,错误地预测了获胜候选人。对本次投票空缺的一个主要解释是,传统投票响应率的急剧下降导致更多地依赖统计方法来调整相应的偏差,而这些方法未能适应教育、种族和地理区域等关键变量之间的重要互动。在传统调查方法中,许多州一级的民意测验,特别是在上中西部州,错误地预测了获胜候选人。许多州一级的民意测验,特别是在上中西部州,错误地预测了获胜候选人。这次投票空缺的一个主要解释是:传统调查方法仍然具有挑战性:通常只平衡差额,而完全平衡所有互动的州一级的民意测验后,只有一小部分变量才可行。在本文件中,我们建议多层次校准校准校准加权,对边际平衡和较松散的对更高级别互动的限制。这包括了批准后的一些好处,同时保留了萎缩的保证。我们随后纠正了由于通过灵活的结果模式放松限制而产生的偏差造成的偏差;我们称之为“双级回归”和“事后批准”的方法(DP)。我们将这些这些估定这些“偏差者”的“选择”的属性属性属性属性属性属性属性特性描述这些“衡量”的“衡量”的“衡量”的“衡量”和“时,并展示”的“选择”的“选择”的“选择”的“选举”的“选举”的“比例”是“结果”的“结果的“结果的“结果的“结果”的“结果”的“比例”方法,显示的“我们”是“我们”的“我们”的“我们”的“对”的“选择”的“选择”的“选择”的“选择”的“在”的“选择”的“选择”的“选择”的“在”的“选择”的“选择”的“在”的“选择”的“在”的“在”的“选择”的“在”的“在”的“在”的“在”的“在”的“在”的“在”的“在”中,在”的“在”的“在”的“在”中,在”的“在”的“在”的“在”中,在”的“在”的“在”中,在”中进行中的“在”中进行中的“

0
下载
关闭预览

相关内容

Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
已删除
将门创投
4+阅读 · 2019年8月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Arxiv
0+阅读 · 2022年1月18日
Arxiv
38+阅读 · 2021年8月31日
Arxiv
30+阅读 · 2021年7月7日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
相关资讯
已删除
将门创投
4+阅读 · 2019年8月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Top
微信扫码咨询专知VIP会员