项目名称: 基于包间距离、直接以包为学习对象的多示例学习维数约减问题研究
项目编号: No.61403273
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 柴晶
作者单位: 太原理工大学
项目金额: 25万元
中文摘要: 多示例学习的一个显著特点在于其训练样本是一系列示例的集合(通常被称作一个“包”)且只有包的类别标记是已知的,被认为是一种新的学习机制且广泛应用于众多机器学习领域。在现有的多示例学习维数约减算法中,从示例层面设计的间接学习算法很难体现出多示例学习以包为基本学习对象的特点,从包的层面设计的直接学习算法也存在一些不足,例如通用性较差(学习性能易受某种特定分类器制约),未充分考虑包内每个示例在构建包间距离时所起的不同作用,等等。本项目拟通过构建新的包间距离以弥补现有包间距离的不足,并基于此来系统地设计直接以包为学习对象、具有较强通用性的多示例学习维数约减算法。通过本项目的研究,将能够提取出多示例学习数据中蕴含的有效判别信息,滤除噪声和冗余分量,降低学习过程的时间和空间复杂度,弱化在处理高维数据时“维数灾难”问题给识别带来的不利影响,最终实现利用低维数据提高识别精度的研究目的。
中文关键词: 多示例学习;维数约减;包间距离;特征提取;特征加权/选择
英文摘要: Multiple-instance learning, of which each training example is a set of instances (usually termed as a bag) and only the class labels of bags are known in advance, has been treated as a new branch of machine learning and applied in many different domains.
英文关键词: multiple-instance learning;dimensionality reduction;bag-level distance;feature extraction;feature weighting/selection