虽然现在深度学习非常火,端到端的方法更加是非常流行,虽然在这些方法中特征工程显得没有那么重要,但是如果把特征理解成先验知识的话,如何在各自的任务将先验知识编码进去,现在仍然是一个比较火的问题。
但是对于传统的机器学习来说,特征工程可能是整个系统最最重要的部分。好的特征工程直接决定最后系统的效果,那么所说的特征到底是什么呢?
特征其实是对一个事物的客观属性描述!!
这里我说一点自己的理解用于备忘。
假如我们有一个机器学习系统需要对人的性别进行分类。
这属于经典的模式分类问题,处理步骤如下:
1)信息获取
2)预处理:对获取信号进行规范化等各种处理
3)特征提取与选择:将识别样本构造成便于比较、分析的描述量即特征向量
4)分类器设计:由训练过程将训练样本提供的信息变为判别事物的判别函数
5)分类决策:对样本特征分量按判别函数的计算结果进行分类
而第三步的特征选择的好坏直接决定最后的性能!
转自:机器学习算法与自然语言处理
完整内容请点击“阅读原文”