项目名称: 基于格式塔法则的图像分析与抽象

项目编号: No.61272293

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 黄田津

作者单位: 香港中文大学深圳研究院

项目金额: 82万元

中文摘要: 图像的抽象化简化了不必要的图像细节,精确地保留下重要的视觉内容,被广泛地运用到了卡通,漫画,插图,以及简化地图等应用中。但是,现有大多数高质量的抽象结果都是人工完成的。随着互联网上海量的图像和视频数据激增,自动的图像抽象化方法变得越来越重要,可令用户更有效地从图像中搜寻需要的信息。现有算法主要是基于低阶的图像特征,效果不能满足要求。心理学家已经证实人们的视觉感知不仅基于低阶的图像特征,更依赖于众多图像元素的复杂交互。格式塔心理学描述了人们综合认知一组表面上没有关联视觉元素,识别结构形状的现象。我们相信,通过对格式塔现象进行计算建模,可以识别中阶的图像特征并将之应用到相关的图像抽象化中。本项目计划将之转化成一个多标签图割分组问题,并用优化算法来求解。本项目的研究成果终将会令该领域许多潜在应用获益良多,包括图像抽象化和概括化,图像尺寸调整,计算漫画,以及依赖于简化地图的诸多基于位置的服务。

中文关键词: 格式塔法则;图像分析;图像抽象;感知计算;

英文摘要: Visual abstraction simplifies unnecessary details and precisely presents prominent visual content in the image. It has been widely adopted from cartoon and manga production, illustration, or even simplified map production, etc. With the overwhelming visual data (photo and video) available over the internet, automatic visual abstraction becomes even more crucial for users to efficiently identify the desired information. However, most existing high-quality abstraction results are manually prepared. This demonstrates the ineffectiveness of existing automatic abstraction methods which mainly based on low-level features. In fact, the success of abstraction is highly related to human visual perception. Psychologists already proved that human visual perception does not solely rely on low-level features, but on more complex interaction among various stimuli. In particular, gestalt psychology describes the phenomenon of the human perception in recognizing "form" (gestalt), instead of a set of unrelated primitive points or segments (low-level features). For instance, we perceive a set of collinearly and equally spaced line segments as a continuous line, instead of a set of unrelated dashes. We believe, by computationally modeling the gestalt phenomena, we may identify the middle-level features (gestalts) which in turn sho

英文关键词: Gestalt laws;Image analysis;Image abstraction;Perception computing;

成为VIP会员查看完整内容
0

相关内容

「计算机视觉」2022 年 5 大趋势
专知会员服务
73+阅读 · 2022年3月27日
【博士论文】基于深度学习的单目场景深度估计方法研究
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
28+阅读 · 2021年11月8日
专知会员服务
69+阅读 · 2021年3月29日
「深度图像检索: 2012到2020」大综述论文,21页pdf
专知会员服务
41+阅读 · 2021年1月30日
专知会员服务
77+阅读 · 2020年12月6日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
当心!洗脑神曲在你的耳朵里种了一只“耳虫”
学术头条
0+阅读 · 2022年1月16日
不仅是观众!2021 Google 开发者大会听你说
谷歌开发者
0+阅读 · 2021年9月27日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
基于TensorFlow和Keras的图像识别
Python程序员
16+阅读 · 2019年6月24日
图像美学质量评价技术发展趋势
科技导报
18+阅读 · 2018年6月25日
【机器视觉】表面缺陷检测:机器视觉检测技术
产业智能官
25+阅读 · 2018年5月30日
没错!卷积神经网络实现图像识别,就这么简单!
全球人工智能
20+阅读 · 2017年8月15日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
UNITER: Learning UNiversal Image-TExt Representations
Arxiv
23+阅读 · 2019年9月25日
小贴士
相关VIP内容
「计算机视觉」2022 年 5 大趋势
专知会员服务
73+阅读 · 2022年3月27日
【博士论文】基于深度学习的单目场景深度估计方法研究
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
28+阅读 · 2021年11月8日
专知会员服务
69+阅读 · 2021年3月29日
「深度图像检索: 2012到2020」大综述论文,21页pdf
专知会员服务
41+阅读 · 2021年1月30日
专知会员服务
77+阅读 · 2020年12月6日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
相关资讯
当心!洗脑神曲在你的耳朵里种了一只“耳虫”
学术头条
0+阅读 · 2022年1月16日
不仅是观众!2021 Google 开发者大会听你说
谷歌开发者
0+阅读 · 2021年9月27日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
基于TensorFlow和Keras的图像识别
Python程序员
16+阅读 · 2019年6月24日
图像美学质量评价技术发展趋势
科技导报
18+阅读 · 2018年6月25日
【机器视觉】表面缺陷检测:机器视觉检测技术
产业智能官
25+阅读 · 2018年5月30日
没错!卷积神经网络实现图像识别,就这么简单!
全球人工智能
20+阅读 · 2017年8月15日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员