"For how many days during the past 30 days was your mental health not good?" The responses to this question measure self-reported mental health and can be linked to important covariates in the National Health and Nutrition Examination Survey (NHANES). However, these count variables present major distributional challenges: the data are overdispersed, zero-inflated, bounded by 30, and heaped in five- and seven-day increments. To meet these challenges, we design a semiparametric estimation and inference framework for count data regression. The data-generating process is defined by simultaneously transforming and rounding (STAR) a latent Gaussian regression model. The transformation is estimated nonparametrically and the rounding operator ensures the correct support for the discrete and bounded data. Maximum likelihood estimators are computed using an EM algorithm that is compatible with any continuous data model estimable by least squares. STAR regression includes asymptotic hypothesis testing and confidence intervals, variable selection via information criteria, and customized diagnostics. Simulation studies validate the utility of this framework. STAR is deployed to study the factors associated with self-reported mental health and demonstrates substantial improvements in goodness-of-fit compared to existing count data regression models.


翻译:“在过去30天里,你的精神健康状况如何?” 这个问题的回答是衡量自我报告的精神健康状况,可以与国家健康和营养检查调查(NHANES)中的重要共变体联系起来。然而,这些计数变量提出了主要的分布挑战:数据过于分散,零充气,受30个约束,加压5天和7天。为了迎接这些挑战,我们设计了一个计算数据回归的半参数估计和推论框架。数据生成过程的定义是通过同时转换和舍入一个潜值回归模型(STAR)来界定的。这种转换是非对称性的,圆形操作员确保了对离散和受约束数据的正确支持。最大可能性的估算是使用与任何持续数据模型相容的EM算法来计算,这种算法与最小方可以估计的任何连续数据模型相容。STRATAR的回归包括无症状的假设测试和信任间隔,通过信息标准进行变量选择,以及定制的诊断。模拟研究验证了这个框架的效用。STRATAR将部署用于研究与现有回归模型相关的因素,以便比较现有数据回归模型。

0
下载
关闭预览

相关内容

FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
28+阅读 · 2019年10月18日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
神器Cobalt Strike3.13破解版
黑白之道
12+阅读 · 2019年3月1日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
ACL 2018 计算语言学协会接受论文列表
专知
3+阅读 · 2018年4月27日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年12月3日
Arxiv
0+阅读 · 2021年12月3日
A Survey on Data Augmentation for Text Classification
Arxiv
6+阅读 · 2018年3月28日
Arxiv
9+阅读 · 2018年3月28日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
3+阅读 · 2017年12月1日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
神器Cobalt Strike3.13破解版
黑白之道
12+阅读 · 2019年3月1日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【NIPS2018】接收论文列表
专知
5+阅读 · 2018年9月10日
ACL 2018 计算语言学协会接受论文列表
专知
3+阅读 · 2018年4月27日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Arxiv
0+阅读 · 2021年12月3日
Arxiv
0+阅读 · 2021年12月3日
A Survey on Data Augmentation for Text Classification
Arxiv
6+阅读 · 2018年3月28日
Arxiv
9+阅读 · 2018年3月28日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
3+阅读 · 2017年12月1日
Top
微信扫码咨询专知VIP会员