项目名称: 视觉媒体的结构感知处理与分析模型研究

项目编号: No.61502541

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 计算机科学学科

项目作者: 苏卓

作者单位: 中山大学

项目金额: 22万元

中文摘要: 结构感知滤波模型是针对现有的边缘感知滤波方式的新拓展,并从根本上突破了传统滤波方法的局限性。最近,结构感知滤波成为视觉媒体处理与分析方法研究中的热点,原因在于它能有效获取视觉媒体数据中的边界、轮廓、形状和细节信息。然而,当前的边缘或结构感知滤波均存在一定的局限性,限制了其在视觉媒体中的应用。本项目致力于研究结构感知滤波的理论与实践方法,主要研究:(1)显式稀疏边缘控制的优化滤波模型。在稀疏梯度范数最小化的优化框架中,结合显式的稀疏边缘信息,构造具有结构感知特性的滤波结果。(2)基于局部全变分的自适应核回归模型。在核回归理论中,结合局部全变分理论对结构和纹理信息的表达能力,构建具有结构感知效果的滤波方法。(3)基于结构感知滤波的视觉媒体处理与与分析质量优化策略。通过探索结构感知滤波与视觉媒体内容处理过程的结合方式,发掘提高处理质量的新方法。最终的研究成果将在数字家庭媒体平台上加以推广应用。

中文关键词: 图像滤波;图像视频的结构分析;图像增强;图像视频编辑;图像缩放

英文摘要: Structure-aware filtering model is an extension to current edge-preserving smoothing models, and essentially breaks the limitations in the traditional filters. Recent yeas, the structure-aware filter becomes a significant way to the processing and analysis of the visual media, since it effectively separetes the media data to obtain the boundaries, contours, shapes and details. However, there exists some defects in the state-of-the-art models. In this project, we devote ourselves to explore the fundamental theories and the practical methods of the new structure-aware filter. The main points are as follows. (1) Explicit sparse edge control optimization filtering model. It exploits the sparse edges to construct the structure-aware property in the sparse gradient-norms minimization framework. (2) Local total variation based adaptive kernel regression model. Under the kernel regression theory, it exploits the powerful structure-texture expression ability of the local total variation to establish the structure-aware filter. (3) The schemes for the visual media processing and analysis by structure-aware filtering. It studies the effective combination patterns for raising the visual media processing and analysis quality. All the research achievements will be promoted to the visual applications in the digital home environment.

英文关键词: Image Filtering;Structure Analysis for Image/Video;Image Enhancement;Image/Video Editing;Image Retargeting

成为VIP会员查看完整内容
1

相关内容

【NeurIPS 2021】流形上的注意力机制:规范等变的Transformer
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
63+阅读 · 2021年12月1日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
72+阅读 · 2021年11月18日
CIKM2021 | 用于链接预测的主题感知异质图神经网络
专知会员服务
25+阅读 · 2021年11月3日
专知会员服务
13+阅读 · 2021年9月13日
专知会员服务
36+阅读 · 2021年2月20日
专知会员服务
79+阅读 · 2020年12月6日
好的媒体处理框架都具备这三点特征
InfoQ
0+阅读 · 2022年4月13日
微软亚洲研究院多模态模型NÜWA:以自然语言创造视觉内容
微软研究院AI头条
0+阅读 · 2022年3月3日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
【新书】感知和行动的贝叶斯模型,348页pdf
别用Attention了,用GNN来解释NLP模型吧
图与推荐
1+阅读 · 2021年3月10日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
Invertible Mask Network for Face Privacy-Preserving
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
13+阅读 · 2021年10月22日
小贴士
相关VIP内容
【NeurIPS 2021】流形上的注意力机制:规范等变的Transformer
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
63+阅读 · 2021年12月1日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
72+阅读 · 2021年11月18日
CIKM2021 | 用于链接预测的主题感知异质图神经网络
专知会员服务
25+阅读 · 2021年11月3日
专知会员服务
13+阅读 · 2021年9月13日
专知会员服务
36+阅读 · 2021年2月20日
专知会员服务
79+阅读 · 2020年12月6日
相关资讯
好的媒体处理框架都具备这三点特征
InfoQ
0+阅读 · 2022年4月13日
微软亚洲研究院多模态模型NÜWA:以自然语言创造视觉内容
微软研究院AI头条
0+阅读 · 2022年3月3日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
【新书】感知和行动的贝叶斯模型,348页pdf
别用Attention了,用GNN来解释NLP模型吧
图与推荐
1+阅读 · 2021年3月10日
红外弱小目标处理研究获进展
中科院之声
17+阅读 · 2017年11月19日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员