The split-plot design assigns different interventions at the whole-plot and sub-plot levels, respectively, and induces a group structure on the final treatment assignments. A common strategy is to use the OLS fit of the outcome on the treatment indicators coupled with the robust standard errors clustered at the whole-plot level. It does not give consistent estimator for the causal effects of interest when the whole-plot sizes vary. Another common strategy is to fit the linear mixed-effects model of the outcome with Normal random effects and errors. It is a purely model-based approach and can be sensitive to violations of parametric assumptions. In contrast, the design-based inference assumes no outcome models and relies solely on the controllable randomization mechanism determined by the physical experiment. We first extend the existing design-based inference based on the {\htf} estimator to the Hajek estimator, and establish the finite-population central limit theorem for both under split-plot randomization. We then reconcile the results with those under the model-based approach, and propose two regression strategies, namely (i) the WLS fit of the unit-level data based on the inverse probability weighting and (ii) the OLS fit of the aggregate data based on whole-plot total outcomes, to reproduce the Hajek and {\htf} estimators from least squares, respectively. This, together with the asymptotic conservativeness of the corresponding cluster-robust covariances for estimating the true design-based covariances as we establish in the process, justifies the validity of regression-based estimators for design-based inference. In light of the flexibility of regression formulation with covariate adjustment, we further extend the theory to the case with covariates and demonstrate the efficiency gain by regression-based covariate adjustment via both asymptotic theory and simulation.
翻译:displiot 设计在整颗粒和子粒子水平上分别指定不同的干预, 并在最终处理任务上引入一个群落结构。 一个共同的战略是使用 OSL 匹配处理指标结果的 OLS, 加上在整个笔点水平上分类的强力标准错误。 它没有给整个笔点大小不同时利息的因果关系提供一致的估算。 另一个共同的战略是匹配结果的线性混合效应模型, 带有正常随机效应和错误。 这是一个纯粹基于模型的方法, 对违反参数假设的情况具有敏感性。 相比之下, 基于 设计 的推断没有结果模型, 并且完全依赖物理实验确定的可控制性随机化机制。 我们首先将基于 ~ htf} 估计值的当前设计偏差推算扩展到 Hajek 估量, 并且为基于分裂随机随机随机随机随机调节的结果和基于模型的方法, 并且提议基于 IMLS 的两次回归战略, 将基于 IMLS 的准确性 和 水平 数据 的共振值调整, 以我们基于 方向值 数据 的计算结果 和 方向 的计算结果, 根点的共振值, 根部位点 和 根点 根点, 和基数据 根点 根点 根点 和基数据 根点 根点 根点 根点 根点 根点 的 的 的 的 根数据 调的 根数据 的 根点的 根点的计算 调的 和基数据 调算算算算算算算算算算算算算算算算算算算算算算算算算算算算算算算的 和基数据 和基数据 调调算的 调的 调算算算算算算算算的 调的 调的 调的 调的 调的 调的 调的 调的 和基数据 调算的 和基数据 和基数据 和基数据 调算的 调算的精确算的 调的 和基的 调的 调的 和基数据 调算算算算算算算算的 调算的 和基数据 和基数据 调的 调的