新型深度学习模型的研究
深度学习是近年来机器学习领域中的热点研究领域。深度森林模型是一 种新型深度学习模型,扩展了深度学习的内涵和适用范围。本文开展深度森 林方面的相关研究工作,主要取得了以下创新结果:
1.基于森林的多层分布表示。多层分布式表示学习被认为是神经网络独有的 特性,本文提出了基于森林的多层模型 mGBDT,第一次显示出多层分布 式表示通过森林模型也能进行。在表格数据和混合数据等各类建模任务 上,mGBDT 展示了其兼具表示学习和离散数据建模的能力。
2.基于森林的自编码器模型。自编码器被认为是只能通过神经网络实现的独 有模型,本文工作提出了第一个基于森林的自编码器 eForest,在多类数 据上均取得了优异的性能体现。与此同时,还利用 Intel 众核芯片 KNL, 通过多进程,向量化和编译器优化等技术,获得了近线性加速比,为大规 模应用提供了基础。