Ordinary supervised learning is useful when we have paired training data of input $X$ and output $Y$. However, such paired data can be difficult to collect in practice. In this paper, we consider the task of predicting $Y$ from $X$ when we have no paired data of them, but we have two separate, independent datasets of $X$ and $Y$ each observed with some mediating variable $U$, that is, we have two datasets $S_X = \{(X_i, U_i)\}$ and $S_Y = \{(U'_j, Y'_j)\}$. A naive approach is to predict $U$ from $X$ using $S_X$ and then $Y$ from $U$ using $S_Y$, but we show that this is not statistically consistent. Moreover, predicting $U$ can be more difficult than predicting $Y$ in practice, e.g., when $U$ has higher dimensionality. To circumvent the difficulty, we propose a new method that avoids predicting $U$ but directly learns $Y = f(X)$ by training $f(X)$ with $S_{X}$ to predict $h(U)$ which is trained with $S_{Y}$ to approximate $Y$. We prove statistical consistency and error bounds of our method and experimentally confirm its practical usefulness.
翻译:当我们将投入美元和产出美元的培训数据与投入美元和产出美元相配时,受监督的普通普通学习是有用的。然而,这种配对数据在实践中可能很难收集。在本文中,我们考虑在没有对一数据时,从美元预测美元美元(在没有对美元数据时)中预测美元美元美元美元,但我们有两套单独的独立数据集,分别为美元和美元,每套美元,这是两套单独的独立数据集,每套美元和美元美元,用一些介介质变量美元观察到的美元,即,我们有两套S_X美元=美元(x_一,U_一)美元和美元(Y=(U__美元,Y_j) 美元)美元。为了克服这一困难,我们建议采用一种新方法,避免用美元SX美元对美元(美元)美元(美元)的汇率预测,而我们用美元(美元)培训的美元(美元)和美元(美元)比实际预测美元(美元(美元)美元(美元)美元(美元)的美元(美元)的美元(美元)的美元(美元)的美元(美元)的美元)的美元(美元)和美元(美元)的美元(美元)的美元(美元)的美元)的美元(美元)的美元(美元)的美元)的美元(美元)的美元)的美元)的美元)的美元(实际值值值值值和(实际的美元)的美元)的美元)的美元值值值值值值值值值值值和(美元)的美元(美元)的美元(美元)的美元)的美元的美元(美元)的美元)的美元值值值值值值值值的美元(美元(美元)的美元)的美元)的美元,是比较。。。。。为了避免这一困难。的难度的难度的难度,为了避免这一困难,为了避免困难的难度的难度,我们建议,我们建议避免困难,我们建议,我们提出一种新的的方法,用避免的困难,用避免困难,用的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的確的