项目名称: 基于区分型码本的图像表示的研究与应用

项目编号: No.61503145

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 王兴刚

作者单位: 华中科技大学

项目金额: 22万元

中文摘要: 基于特征集的图像表示是计算机视觉中十分核心且具有挑战性的问题,在诸多应用中发挥着重要作用。本项目拟提出一种新颖的基于区分型码本的图像表示方法,它具有三个主要优点:(1)采用了一种新的数据空间划分方式,使得图像表示更加简洁;(2)区分型码本自动学习样本各维度的权重,可以有效融合不同种类的特征;(3)能够在码本中融入人工标注的高层语义,使得图像表示更加高效。本课题研究焦点在于区分型码本的性质、学习方法、编码方法、图像表示、以及解决大规模数据下的图像分类、物体检测等应用问题。本课题中的研究有助于解决区分型聚类、弱监督学习、物体识别等机器学习、计算机视觉领域中的任务。另外,区分型码本是一种通用的码本表示方法,可以应用于文本、音频等多媒体数据的表示,并推动相关领域的研究发展。

中文关键词: 码本学习;区分型学习;图像表示;物体识别

英文摘要: Feature set based image representation is an important yet challenging problem in computer vision and machine learning, which plays a critical role in a wide spectrum of applications. In this project, we propose a novel image representation method based on discriminative codebook. Comparing to the state-of-the-art data representation methods using generative codebook, main advantages of discriminative codebook lie in the following three aspects: (1) it uses a new space partition strategy, which makes our codebook more compact; (2) it learns weights for each dimension of data, which helps to fuse different kinds of features; and (3) it contains high-level semantics. We focus on studying the characteristics of discriminative codebook, discriminative codebook learning approaches, coding approaches of discriminative codebook, image representation using discriminative codebook, and how to apply the proposed image representation for large-scale image classification, object detection etc. The research in this project helps to solve the fundamental problems in machine learning and computer vision, such as discriminative clustering, weakly supervised learning and object recognition. Besides, the flexibility of our discriminative codebook learning method makes it possible to be widely applied to text, audio and other types of data, and thus promotes the development in the related areas.

英文关键词: Codebook Learning;Discriminative Learning;Image Representation;Object Recognition

成为VIP会员查看完整内容
1

相关内容

专知会员服务
82+阅读 · 2021年10月15日
专知会员服务
92+阅读 · 2021年8月29日
专知会员服务
88+阅读 · 2021年8月8日
专知会员服务
41+阅读 · 2021年7月24日
专知会员服务
19+阅读 · 2021年5月16日
专知会员服务
124+阅读 · 2021年4月29日
专知会员服务
48+阅读 · 2021年4月15日
专知会员服务
79+阅读 · 2020年12月6日
专知会员服务
46+阅读 · 2020年12月4日
深度学习目标检测方法综述
专知会员服务
276+阅读 · 2020年8月1日
基于深度学习的图像目标检测算法综述
专知
2+阅读 · 2022年4月16日
对比学习在NLP和多模态领域的应用
专知
6+阅读 · 2022年2月25日
基于深度学习的小目标检测方法综述
专知
2+阅读 · 2021年4月29日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
38+阅读 · 2019年4月18日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
一文读懂图像压缩算法
七月在线实验室
17+阅读 · 2018年5月2日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Simple and Effective Unsupervised Speech Synthesis
Arxiv
2+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
21+阅读 · 2020年10月11日
Arxiv
12+阅读 · 2018年1月12日
小贴士
相关VIP内容
专知会员服务
82+阅读 · 2021年10月15日
专知会员服务
92+阅读 · 2021年8月29日
专知会员服务
88+阅读 · 2021年8月8日
专知会员服务
41+阅读 · 2021年7月24日
专知会员服务
19+阅读 · 2021年5月16日
专知会员服务
124+阅读 · 2021年4月29日
专知会员服务
48+阅读 · 2021年4月15日
专知会员服务
79+阅读 · 2020年12月6日
专知会员服务
46+阅读 · 2020年12月4日
深度学习目标检测方法综述
专知会员服务
276+阅读 · 2020年8月1日
相关资讯
基于深度学习的图像目标检测算法综述
专知
2+阅读 · 2022年4月16日
对比学习在NLP和多模态领域的应用
专知
6+阅读 · 2022年2月25日
基于深度学习的小目标检测方法综述
专知
2+阅读 · 2021年4月29日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
38+阅读 · 2019年4月18日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
一文读懂图像压缩算法
七月在线实验室
17+阅读 · 2018年5月2日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员