预计医疗数据量的增长速度将超过任何其他行业。这为开发严格的分析和机器学习方法以应用于大型健康数据集创造了需求。这些包含个人身份信息的数据集带有隐私保护,对数据的可见性及其发布进行了限制。此外,病人数据往往包含复杂的关系,如非线性关系和异质性。这些特点会给医疗数据的分析带来独特的复杂性,并限制了开箱即用的解决方案的使用。值得注意的是,医疗保健研究具有令人难以置信的高风险,它可能是生命和死亡之间的区别,对个人的生活质量和医疗有重大影响。由于这些原因,开发严格的解决方案就显得更为关键。这篇论文的重点是应用分析学和机器学习来解决基于医疗数据的应用研究问题

第一章是对论文的介绍。它介绍了每个研究的研究目标和贡献。本章还讨论了每个研究中使用的方法的价值和使用行政索赔数据的好处。

在第二章中,我们讨论了确定疾病控制和预防中心(CDC)新建议对患有高危慢性病的妇女避孕医疗索赔的影响的研究。该研究包括14个州在建议发布前两年和发布后两年参加医疗补助的妇女。我们重点关注两个结果指标。(1)总体避孕措施的使用和(2)CDC推荐的避孕措施的使用(即那些具有最高效力的避孕措施)。我们对整个研究人群和健康状况的每个结果进行了评估。建议后的比率与建议前的比率之比被用来确定接受新建议的统计学上的意义。结果发现,在有这些健康状况的妇女中,以及在每种状况下,避孕方法的总体使用都有增加。然而,结果也显示,最高效能的方法的使用总体上有所增加,但并非每种情况都有增加。本章最后提出了在这一人群中进一步提高最高功效方法使用率的建议。

在第三章中,我们评估了青少年母亲所生婴儿的健康和保健结果。我们的全国性研究评估了青春期怀孕对婴儿出生后第一年的健康和保健的影响。研究组中的每个婴儿(青少年母亲所生的婴儿)与对照组(成年母亲所生的婴儿)根据其母亲的人口统计资料进行匹配。评估的结果是:低出生体重、药物暴露、寄养、健康状况、死亡率、急诊室就诊和健康就诊。结果表明,两组之间存在差异,特别是在低出生体重和急诊科就诊方面。然而,这些差异并不像以前的研究所发现的那样剧烈--这表明一个有希望的结果,即这两个群体之间的差距可能正在缩小。本章还包括关于如何支持青少年母亲的建议。

在第四章中,我们将统计学习方法应用于差异研究(DID)环境中。常用的DID方法依赖于参数化的统计模型,这些模型对数据的未知基础函数形式做出了强有力的假设。在这项研究中,我们扩展了现有的统计机器学习方法,以非参数化定义的DID参数为目标,同时考虑了一个更大的非参数化模型空间,使其假设更少。我们为DID设计开发了一个通用框架,允许研究人员使用机器学习来估计因果或统计效应量,同时提供统计推断。我们通过模拟来证明其性能,在模拟中我们将其与更传统的方法进行比较。  该研究的激励性例子估计了基于发作的捆绑支付对围产期支出的影响。本章最后提出了所提出的估算器的局限性和对未来工作的建议。

第五章将机器学习应用于社会网络的边缘权重估计问题。社会网络分析被用来可视化、量化和评估两个实体之间的关系。在医疗卫生领域,社交网络在各种场合下都有助于量化某种关系对医疗结果、干预措施或医生治疗决定的影响。算法已经被用来预测社会网络的信息,如边缘的存在,或相似性措施,如共同邻居。然而,很少有研究关注加权图,对其边缘权重的估计工作就更少。准确的权重估计可以作为一种数据质量工具来检查数据中的权重是否正确,以及我们预期接下来会在哪里出现新的更强(或更弱)的关系。这项研究评估了三种估算器的性能,包括一种集合机器学习方法,以预测加权社会网络的边缘权重。我们用一个教师招聘的例子来比较这三种方法的准确性,最后提出了对未来工作的建议。

第六章是本论文的结论。它包括讨论研究对卫生保健政策的总体影响以及为行政索赔数据开发的技术。提出了未来的工作以及更多的卫生保健应用。

成为VIP会员查看完整内容
23

相关内容

智慧医疗英文简称WIT120,是最近兴起的专有医疗名词,通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步达到信息化。
斯坦福HAI:刑法中机器学习的新方向
专知会员服务
23+阅读 · 2022年7月3日
【MIT博士论文】数据高效强化学习,176页pdf
机器学习中的数据级联
TensorFlow
0+阅读 · 2021年7月15日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年9月14日
Arxiv
12+阅读 · 2022年4月30日
Arxiv
22+阅读 · 2021年12月19日
Arxiv
12+阅读 · 2021年8月19日
Arxiv
14+阅读 · 2020年12月17日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员