论文摘要:随着数码相机、智能手机等数码设备的普及,用户可以随时随地拍摄各种感兴趣的场景。然而,在成像过程的曝光时间内存在难以避免的相机抖动、物体运动、场景深度变化等原因,使拍摄的图片和视频中往往存在一些模糊现象,影响对图片内容的理解。因此对这些低质量图片的恢复将有助于人们更好的理解图像内容。本文拟对模糊图片和视频的还原进行研究,分别利用不同的结构先验知识对模糊图像和视频内容进行恢复。本文的主要研究内容和贡献如下:

  1. 针对场景文字图片中文字笔画宽度不同的特性,提出了一种基于文字特有多尺度字典的场景文字去模糊方法。并且统计了场景文字图像中笔画宽度的分布规律,通过该统计规律分别训练得到不同尺度的场景文字字典。然后利用该文字特有多尺度字典对文字图片中的文字区域建模先验知识。本文提出的文字特有多尺度字典可以有效处理场景中不同笔画宽度的场景文字。

  2. 根据图像中相似图像块之间的低秩结构特性,本文提出了一种基于低秩先验的图像去模糊方法,观察到在模糊图像中使用低秩约束可以在一定程度上减少图像的模糊效应,同时保留图像的主要结构信息,而这一现象在图像的梯度域上更加明显。基于此本文提出基于低秩近似的图像去模糊方法,分别在图像的灰度域和梯度域增加低秩约束,保留图像的主要边缘结构达到去模糊的效果。

  3. 由于视频中存在复杂的相机抖动,物体运动和场景深度变化等多种原因,传统的基于均匀模糊核或全局非均匀模糊核的视频去模糊方法不能满足真实视频的特性。基于此,提出了一种基于像素级非线性模糊核的视频去模糊方法。通过对视频双向光流构造二次方程,来近似求解每个像素的非线性模糊核,可以反映出视频中更真实的模糊核。此外,为了提高光流的准确性,将语义分割引入到视频去模糊中,通过不同物体信息对光流进行不同的建模,得到更好的光流估计结果从而进一步提高视频去模糊的效果。

关键词: 图像去模糊,文字图像去模糊,视频去模糊,稀疏表达,低秩表示,像素级非线性模糊核,光流,语义分割

作者介绍:他目前是天津大学计算机科学与技术学院和美国加州大学默塞德分校电子工程与计算机科学联合培养的博士研究生,他的博士生导师是操晓春,他的研究兴趣包括图像去模糊,图像/视频分析和增强,以及相关的视觉问题,相关研究成果发表在权威期刊和会议上,如IEEE TIP, CVPR, ECCV等。

成为VIP会员查看完整内容
46

相关内容

他目前是天津大学计算机科学与技术学院和美国加州大学默塞德分校电子工程与计算机科学联合培养的博士研究生,他的博士生导师是操晓春,他的研究兴趣包括图像去模糊,图像/视频分析和增强,以及相关的视觉问题,相关研究成果发表在权威期刊和会议上,如IEEE TIP, CVPR, ECCV等。
【CVPR2020-Oral】用于深度网络的任务感知超参数
专知会员服务
25+阅读 · 2020年5月25日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
深度学习之视频图像压缩
论智
13+阅读 · 2018年6月15日
使用CNN生成图像先验实现场景的盲图像去模糊
统计学习与视觉计算组
10+阅读 · 2018年6月14日
一文读懂图像压缩算法
七月在线实验室
15+阅读 · 2018年5月2日
基于GAN的极限图像压缩框架
论智
11+阅读 · 2018年4月15日
Arxiv
4+阅读 · 2019年8月7日
Arxiv
6+阅读 · 2019年7月11日
Precise Detection in Densely Packed Scenes
Arxiv
3+阅读 · 2019年4月8日
Arxiv
3+阅读 · 2019年3月29日
Arxiv
11+阅读 · 2018年4月8日
VIP会员
相关资讯
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
深度学习之视频图像压缩
论智
13+阅读 · 2018年6月15日
使用CNN生成图像先验实现场景的盲图像去模糊
统计学习与视觉计算组
10+阅读 · 2018年6月14日
一文读懂图像压缩算法
七月在线实验室
15+阅读 · 2018年5月2日
基于GAN的极限图像压缩框架
论智
11+阅读 · 2018年4月15日
微信扫码咨询专知VIP会员