项目名称: 面向多类图像分类的众包主动学习方法研究
项目编号: No.61402311
项目类型: 青年科学基金项目
立项/批准年度: 2014
项目学科: 自动化技术、计算机技术
项目作者: 吴健
作者单位: 苏州大学
项目金额: 26万元
中文摘要: 主动学习可以有效降低需标注样本的数量,但其需由专家标注,标注代价很高。将众包理念引入到主动学习中,利用大众网络用户替代专家进行标注,可解决专家标注代价高的问题。然而,大众网络用户与专家相比,其标注质量较低,特别是当标注类别较多时。本项目拟开展面向多类图像分类的众包主动学习方法研究,其研究内容主要包括:①研究最大分类优化的样本信息含量度量方法,从分类器优化的角度挑选最具信息含量的样本,提高分类器的泛化性能;②研究结合预测概率和期望误差的图像样本对主动选择策略,将多类标注问题转化为二元标注问题,通过大众网络用户对图像样本对的二元反馈来简化多类标注问题;③研究基于用户偏置建模和贝叶斯估计的标签集成方法,采用敏感性和特异性表征大众网络用户的标注偏置程度,解决众包标注结果的偏置性问题。并设计实现基于众包主动学习的多类图像分类原型系统,验证上述方法和模型的有效性。
中文关键词: 图像分类;主动学习;众包;二元反馈;高信息含量样本
英文摘要: Active learning can effectively reduce the number of examples to be labeled. However, these examples should be labeled by experts, which causes high labelling cost. This problem can be resolved by introducing the crowdsourcing concept to active learning a
英文关键词: Image Classification;Active Learning;Crowdsourcing;Binary Feedback;High-Informative Example