我们研究了几个与因果推断中参数识别和高效估计有关的问题。在本论文的第一部分,我们考虑了如何对观察性研究中无未测混淆变量假设进行敏感性分析的问题。大致来说,混淆变量是影响治疗接受和结果的变量。要估计因果效应,必须测量所有这些变量,并在统计分析中适当考虑。这是我们在这里考虑的问题中无法测试的假设,因为治疗并未由实验者随机分配。因此,在这些情境中,衡量这个假设的偏离对因果效应估计的影响具有很大的实践重levance。在一个项目中,我们开发了一个新颖的框架,将平均治疗效果(ATE)限定为治疗结果关联受混淆的单位比例的函数。在另一个工作中,我们提出并分析了一组模型,用于在假设边际结构模型时获取对某些因果效应的限制。
在本论文的第二部分,我们研究了两个流行的因果参数的高效估计:剂量-反应函数(DRF)和条件平均治疗效果(CATE)曲线的水平集。DRF测量的是如果人群中的每个人都接受给定的治疗水平,预期的结果是什么。当治疗是连续的时,这个参数是一条曲线,可以看作是无穷多治疗值的函数。我们研究了几种估计DRF的方法,并推导出一个估计器,根据我们的了解,这个估计器在一定条件下可以达到文献中已知的最低均方误差。在第二篇论文中,我们推导出了CATE水平集的最小最大优估计器,并提供了其他更简单的估计方法的风险上界。CATE水平集在许多应用中是一个有用的计算量,因为它们确定了有大的治疗效果的单位,这是优化分配治疗所需的关键信息。
最后,在本论文的第三部分,我们研究了减少流动性对Covid-19死亡人数的影响。我们通过指定一个由流行病模型激发的边际结构模型来解决这个问题。我们的分析发现,在许多美国州和大流行病开始时,流动性的减少导致了显著更少的死亡。