项目名称: 基于相依数据的梯度学习理论研究
项目编号: No.11626107
项目类型: 专项基金项目
立项/批准年度: 2016
项目学科: 数理科学和化学
项目作者: 宋必芹
作者单位: 华中农业大学
项目金额: 3万元
中文摘要: 大数据背景下“去粗取精”的过程包括“下采样学习”减少数据个数和“子空间学习”降低数据维数两方面。一方面,经典的学习理论及算法往往假设数据独立同分布,但实际应用中该假设是非常强或不满足的,研究相依数据下的学习理论及算法不仅是对学习理论的推广和完善,也可为下采样学习提供采样理论基础和依据,进而为解决实际问题提供更加合理的方法。另一方面,梯度学习在进行分类、回归经典任务的同时还可进行变量选择和坐标协方差分析,为子空间学习提供新的方法。为此,本项目拟在学习理论的基础上利用逼近论和混合序列分析理论及方法,对相依数据下梯度学习算法的稳定性和推广误差等理论进行研究。旨在建立数据相依下梯度学习正则化算法的稳定性理论框架;建立具有较好学习性能(推广性、稳定性)的正则化梯度学习算法,并将其用到实际应用中的数据挖掘问题中,特别是为海量数据的挖掘提供新的研究思路。
中文关键词: 学习理论;推广误差;正则化算法;;
英文摘要: Discarding the dross and selecting the essential for big data include down-sampling learning and subspace learning two aspects. On one hand, classical learning theory and algorithm tend to assume that the data is i.i.d., however, the assumption is not hol
英文关键词: learning theory;generalization error;regularized algorithm;;