[参数方法] 最小二乘

问题：给定一些样本，给定输出和输出，怎么通过回归模型讲数值输出写成输入的函数？

在模型、策略、算法三层中，最小二乘属于策略，是做高斯假设后最大似然估计的做法

——————————————————————————————————————————

假设输出是输入的确定性函数与随机噪声的和：

y = f(x) + e

假设噪声e服从均值为0，方差为d^2的高斯分布：

f(x)我们不知道，替换成估计g(x | theta)，则p(y | x)也服从均值为g(x | theta)，方差为d^2的高斯分布

联合概率密度为p(x, y) = p(y | x)p(x)，计算其对数似然，忽略掉无关项后，得到

E(theta | X) = 0.5*∑[y - g(x | theta)]²（1）

——————（1）式是最常用的误差函数，最小化（1）式的过程就是所谓的最小二乘法 —————

假设是线性模型，故有估计g(x | theta) = g(x | w1, w0) = w1*x + w0

然后通过求w1的导数和w0的导数，得到两个方程，求解得到w1, w0的值；多项式回归类似。

故在最开始假设的是高斯分布误差，则最大似然对应于最小化误差的平方和∑[y - g(x | theta)]。

另外，相对平方误差(relative square error, RSE)，则由

E_RSE= ∑[y - g(x | theta)] / ∑[y - y']

这个指标代表着回归是否很好地拟合了，更常用的是下面一个度量，即决定系数(coefficient of determination)

R² = 1 - E_RSE

R²为1表明E_RSE趋近0，则表明函数拟合得很好，y与x很线性（多项式）相关；为0则相反。

posted @ 2016-03-03 17:04 CarlGoodman 阅读(575) 评论(0) 编辑收藏举报

刷新页面返回顶部

小尾巴君