BAT题库 | 机器学习面试1000题系列（第206~210题）

2017 年 11 月 21 日 七月在线实验室 七月在线

206.以下哪个是常见的时间序列算法模型
　　A.RSI
　　B.MACD
　　C.ARMA
　　D.KDJ

　　正确答案：C
　　解析：自回归滑动平均模型(ARMA) ，其建模思想可概括为：逐渐增加模型的阶数，拟合较高阶模型，直到再增加模型的阶数而剩余残差方差不再显著减小为止。
　　其他三项都不是一个层次的。
　　A.相对强弱指数 (RSI, Relative Strength Index) 是通过比较一段时期内的平均收盘涨数和平均收盘跌数来分析市场买沽盘的意向和实力 , 从而作出未来市场的走势 .
　　B.移动平均聚散指标 (MACD, Moving Average Convergence Divergence), 是根据均线的构造原理 , 对股票价格的收盘价进行平滑处理 , 求出算术平均值以后再进行计算 , 是一种趋向类指标 .
　　D. 随机指标 (KDJ) 一般是根据统计学的原理 , 通过一个特定的周期 ( 常为 9 日 ,9 周等 ) 内出现过的最高价 , 最低价及最后一个计算周期的收盘价及这三者之间的比例关系 , 来计算最后一个计算周期的未成熟随机值 RSV, 然后根据平滑移动平均线的方法来计算 K 值 , D 值与 J 值 , 并绘成曲线图来研判股票走势 .

207.下列不是SVM核函数的是：
　　A.多项式核函数
　　B.logistic核函数
　　C.径向基核函数
　　D.Sigmoid核函数

　　正确答案：B
　　@刘炫320，本题题目及解析来源：http://blog.csdn.net/column/details/16442.html
　　SVM核函数包括线性核函数、多项式核函数、径向基核函数、高斯核函数、幂指数核函数、拉普拉斯核函数、ANOVA核函数、二次有理核函数、多元二次核函数、逆多元二次核函数以及Sigmoid核函数.
　　核函数的定义并不困难，根据泛函的有关理论，只要一种函数 K ( x i , x j ) 满足Mercer条件，它就对应某一变换空间的内积．对于判断哪些函数是核函数到目前为止也取得了重要的突破，得到Mercer定理和以下常用的核函数类型：
　　(1)线性核函数：K ( x , x i ) = x ⋅ x i
　　(2)多项式核：K ( x , x i ) = ( ( x ⋅ x i ) + 1 ) d
　　(3)径向基核（RBF）：K ( x , x i ) = exp ( − ∥ x − x i ∥ 2 σ 2 )
　　Gauss径向基函数则是局部性强的核函数，其外推能力随着参数 σ 的增大而减弱。多项式形式的核函数具有良好的全局性质。局部性较差。
　　(4)傅里叶核：K ( x , x i ) = 1 − q 2 2 ( 1 − 2 q cos ( x − x i ) + q 2 )
　　(5)样条核：K ( x , x i ) = B 2 n + 1 ( x − x i )
　　(6)Sigmoid核函数：K ( x , x i ) = tanh ( κ ( x , x i ) − δ )
　　采用Sigmoid函数作为核函数时，支持向量机实现的就是一种多层感知器神经网络，应用SVM方法，隐含层节点数目(它确定神经网络的结构)、隐含层节点对输入节点的权值都是在设计(训练)的过程中自动确定的。而且支持向量机的理论基础决定了它最终求得的是全局最优值而不是局部最小值，也保证了它对于未知样本的良好泛化能力而不会出现过学习现象。
　　在选取核函数解决实际问题时，通常采用的方法有：
　　一是利用专家的先验知识预先选定核函数；
　　二是采用Cross-Validation方法，即在进行核函数选取时，分别试用不同的核函数，归纳误差最小的核函数就是最好的核函数．如针对傅立叶核、RBF核，结合信号处理问题中的函数回归问题，通过仿真实验，对比分析了在相同数据条件下，采用傅立叶核的SVM要比采用RBF核的SVM误差小很多．
　　三是采用由Smits等人提出的混合核函数方法，该方法较之前两者是目前选取核函数的主流方法，也是关于如何构造核函数的又一开创性的工作．将不同的核函数结合起来后会有更好的特性，这是混合核函数方法的基本思想．

208.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是()
　　A.主分量分析的最佳准则是对一组数据进行按一组正交基分解, 在只取相同数量分量的条件下,以均方误差计算截尾误差最小
　　B.在经主分量分解后,协方差矩阵成为对角矩阵
　　C.主分量分析就是K-L变换
　　D.主分量是通过求协方差矩阵的特征值得到

　　正确答案：C
　　解析：K-L变换与PCA变换是不同的概念，PCA的变换矩阵是协方差矩阵，K-L变换的变换矩阵可以有很多种（二阶矩阵、协方差矩阵、总类内离散度矩阵等等）。当K-L变换矩阵为协方差矩阵时，等同于PCA。

209.在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()
　　A.将负样本重复10次,生成10w样本量,打乱顺序参与分类
　　B.直接进行分类,可以最大限度利用数据
　　C.从10w正样本中随机抽取1w参与分类
　　D.将负样本每个权重设置为10,正样本权重为1,参与训练过程

　　正确答案:ACD
　　解析：1. 重采样。 A可视作重采样的变形。改变数据分布消除不平衡，可能导致过拟合。
　　2. 欠采样。 C的方案提高少数类的分类性能，可能丢失多数类的重要信息。
　　如果1：10算是均匀的话，可以将多数类分割成为1000份。然后将每一份跟少数类的样本组合进行训练得到分类器。而后将这1000个分类器用assemble的方法组合位一个分类器。A选项可以看作此方式，因而相对比较合理。
　　另：如果目标是预测的分布跟训练的分布一致，那就加大对分布不一致的惩罚系数。
　　3. 权值调整。 D方案也是其中一种方式。
当然，这只是在数据集上进行相应的处理，在算法上也有相应的处理方法。

210.在统计模式识分类问题中，当先验概率未知时，可以使用()?

　　A.最小损失准则

　　B.N-P判决

　　C.最小最大损失准则

　　D.最小误判概率准则

　　正确答案:BC

　　@刘炫320，本题题目及解析来源：http://blog.csdn.net/column/details/16442.html
　　选项 A ,最小损失准则中需要用到先验概率

　　选项B ,在贝叶斯决策中，对于先验概率p(y)，分为已知和未知两种情况。
　　1. p(y)已知，直接使用贝叶斯公式求后验概率即可；
　　2. p(y)未知，可以使用聂曼-皮尔逊决策(N-P决策)来计算决策面。
　　聂曼-皮尔逊决策（N-P判决）可以归结为找阈值a，即：
　　如果 p（x|w1）/p（x|w2）>a，则 x属于w1；
　　如果 p（x|w1）/p（x|w2）<a，则 x属于w 2；