已知输入
回归 regression:输出的结果
分类 classification:输出的结果
已知输入
分类 classification:分类到各不知名的聚类中
输入的
(图片来源:台湾大学林轩田的《机器学习基石》3-2)
例子:房价预测 - 给出房子的各种特征,如面积、位置等,以及该房子对应的价格。学习一个模型,当输出其他房子的特征时,能够预测出新房子的价格。
明显这是一个回归模型。
数据说明:
(
|
训练集中的第
|
---|---|
|
输入数据 |
|
输出数据,数据
|
|
第
|
|
训练集中数据的个数 |
|
学习得到的模型 |
|
模型对输入数据
|
由于一开始我们并不知道
于是提出模型的错误公式,loss/cost function来定义这个错误。
最简单的错误评估,就是将预测出来的结果同真实的结果做一个平方差:
因为有
再者,为了接下来模型根据这个error进行学习的以后更加方便,再除以2(因为平方项在求导的时候可以与这个分母2抵消):
而最终的目的就是让这个error最小,只要error最小了,那就说明这个
学习目标:
接下来通过几个例子来了解一下cost function是怎么工作的,
下面的图中,红色叉叉表示训练数据,黑色直线代表
当theta1 = 0.5的时候,计算得到
当theta1=0的时候,计算得到
4. 以此类推,再画出一些点,然后连接起来
cost function取最小值的时候就是凹陷处,数学意义上梯度为0的地方。
更新过程可视化如下,从上面的点一直沿着一定的方向下降到下面的点:
下面来看看这个步长
如果
如果
另外,如果这个
转自:机器学习算法与自然语言处理
完整内容请点击“阅读原文”