【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦 - 专知VIP

会员服务 ·

2

任文琦 · 图像 · 图像处理 · 计算机图形学 · CCF优秀博士学位论文奖 ·

2019 年 11 月 8 日

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

论文摘要：随着数码相机、智能手机等数码设备的普及，用户可以随时随地拍摄各种感兴趣的场景。然而，在成像过程的曝光时间内存在难以避免的相机抖动、物体运动、场景深度变化等原因，使拍摄的图片和视频中往往存在一些模糊现象，影响对图片内容的理解。因此对这些低质量图片的恢复将有助于人们更好的理解图像内容。本文拟对模糊图片和视频的还原进行研究，分别利用不同的结构先验知识对模糊图像和视频内容进行恢复。本文的主要研究内容和贡献如下：

针对场景文字图片中文字笔画宽度不同的特性，提出了一种基于文字特有多尺度字典的场景文字去模糊方法。并且统计了场景文字图像中笔画宽度的分布规律，通过该统计规律分别训练得到不同尺度的场景文字字典。然后利用该文字特有多尺度字典对文字图片中的文字区域建模先验知识。本文提出的文字特有多尺度字典可以有效处理场景中不同笔画宽度的场景文字。
根据图像中相似图像块之间的低秩结构特性，本文提出了一种基于低秩先验的图像去模糊方法，观察到在模糊图像中使用低秩约束可以在一定程度上减少图像的模糊效应，同时保留图像的主要结构信息，而这一现象在图像的梯度域上更加明显。基于此本文提出基于低秩近似的图像去模糊方法，分别在图像的灰度域和梯度域增加低秩约束，保留图像的主要边缘结构达到去模糊的效果。
由于视频中存在复杂的相机抖动，物体运动和场景深度变化等多种原因，传统的基于均匀模糊核或全局非均匀模糊核的视频去模糊方法不能满足真实视频的特性。基于此，提出了一种基于像素级非线性模糊核的视频去模糊方法。通过对视频双向光流构造二次方程，来近似求解每个像素的非线性模糊核，可以反映出视频中更真实的模糊核。此外，为了提高光流的准确性，将语义分割引入到视频去模糊中，通过不同物体信息对光流进行不同的建模，得到更好的光流估计结果从而进一步提高视频去模糊的效果。

关键词：图像去模糊，文字图像去模糊，视频去模糊，稀疏表达，低秩表示，像素级非线性模糊核，光流，语义分割

作者介绍：他目前是天津大学计算机科学与技术学院和美国加州大学默塞德分校电子工程与计算机科学联合培养的博士研究生，他的博士生导师是操晓春，他的研究兴趣包括图像去模糊，图像/视频分析和增强，以及相关的视觉问题，相关研究成果发表在权威期刊和会议上，如IEEE TIP, CVPR, ECCV等。

成为VIP会员查看完整内容

论文-任文琦.pdf

48

相关内容

任文琦

他目前是天津大学计算机科学与技术学院和美国加州大学默塞德分校电子工程与计算机科学联合培养的博士研究生，他的博士生导师是操晓春，他的研究兴趣包括图像去模糊，图像/视频分析和增强，以及相关的视觉问题，相关研究成果发表在权威期刊和会议上，如IEEE TIP, CVPR, ECCV等。

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

【CVPR2020-斯坦福】知识蒸馏时空图的视频描述，Spatio-Temporal Graph

【CVPR2020-斯坦福】知识蒸馏时空图的视频描述，Spatio-Temporal Graph

专知会员服务

34+阅读 · 2020年4月2日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】基于属性图挖掘的职业流动行为研究，西北工业大学胥皇

【CCF优秀博士学位论文奖-2019提名】基于属性图挖掘的职业流动行为研究，西北工业大学胥皇

专知会员服务

27+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

专知会员服务

39+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】基于路径依赖关系的循环分析技术研究，天津大学谢肖飞

【CCF优秀博士学位论文奖-2019】基于路径依赖关系的循环分析技术研究，天津大学谢肖飞

专知会员服务

20+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

极市平台

15+阅读 · 2019年6月5日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

基于视频的目标检测的发展【附PPT与视频资料】

基于视频的目标检测的发展【附PPT与视频资料】

人工智能前沿讲习班

19+阅读 · 2018年12月14日

深度学习之视频图像压缩

深度学习之视频图像压缩

论智

13+阅读 · 2018年6月15日

使用CNN生成图像先验实现场景的盲图像去模糊

使用CNN生成图像先验实现场景的盲图像去模糊

统计学习与视觉计算组

10+阅读 · 2018年6月14日

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

机器之心

10+阅读 · 2018年5月30日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

CVPR 2018 | 华中科技大学提出多向文本检测方法：基于角定位与区域分割

CVPR 2018 | 华中科技大学提出多向文本检测方法：基于角定位与区域分割

机器之心

5+阅读 · 2018年3月1日

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Arxiv

12+阅读 · 2020年2月27日

Scene-based Factored Attention for Image Captioning

Arxiv

4+阅读 · 2019年8月7日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Arxiv

3+阅读 · 2019年7月11日

Precise Detection in Densely Packed Scenes

Precise Detection in Densely Packed Scenes

Arxiv

3+阅读 · 2019年4月8日

Object Hallucination in Image Captioning

Arxiv

3+阅读 · 2019年3月29日

Improving Image Captioning by Leveraging Knowledge Graphs

Arxiv

8+阅读 · 2019年1月25日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning

Arxiv

5+阅读 · 2018年4月3日

Object Detection in Videos by Short and Long Range Object Linking

Arxiv

6+阅读 · 2018年1月30日

VIP会员

相关主题

计算机图形学

CCF优秀博士学位论文奖

相关VIP内容

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

【CVPR2020-斯坦福】知识蒸馏时空图的视频描述，Spatio-Temporal Graph

【CVPR2020-斯坦福】知识蒸馏时空图的视频描述，Spatio-Temporal Graph

专知会员服务

34+阅读 · 2020年4月2日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】基于属性图挖掘的职业流动行为研究，西北工业大学胥皇

【CCF优秀博士学位论文奖-2019提名】基于属性图挖掘的职业流动行为研究，西北工业大学胥皇

专知会员服务

27+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

【CCF优秀博士学位论文奖-2019提名】增广信息学习，南京大学朱越

专知会员服务

39+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】基于路径依赖关系的循环分析技术研究，天津大学谢肖飞

【CCF优秀博士学位论文奖-2019】基于路径依赖关系的循环分析技术研究，天津大学谢肖飞

专知会员服务

20+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

极市平台

15+阅读 · 2019年6月5日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

基于视频的目标检测的发展【附PPT与视频资料】

基于视频的目标检测的发展【附PPT与视频资料】

人工智能前沿讲习班

19+阅读 · 2018年12月14日

深度学习之视频图像压缩

深度学习之视频图像压缩

论智

13+阅读 · 2018年6月15日

使用CNN生成图像先验实现场景的盲图像去模糊

使用CNN生成图像先验实现场景的盲图像去模糊

统计学习与视觉计算组

10+阅读 · 2018年6月14日

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

机器之心

10+阅读 · 2018年5月30日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

CVPR 2018 | 华中科技大学提出多向文本检测方法：基于角定位与区域分割

CVPR 2018 | 华中科技大学提出多向文本检测方法：基于角定位与区域分割

机器之心

5+阅读 · 2018年3月1日

相关论文

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Total3DUnderstanding: Joint Layout, Object Pose and Mesh Reconstruction for Indoor Scenes from a Single Image

Arxiv

12+阅读 · 2020年2月27日

Scene-based Factored Attention for Image Captioning

Arxiv

4+阅读 · 2019年8月7日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Activitynet 2019 Task 3: Exploring Contexts for Dense Captioning Events in Videos

Arxiv

3+阅读 · 2019年7月11日

Precise Detection in Densely Packed Scenes

Precise Detection in Densely Packed Scenes

Arxiv

3+阅读 · 2019年4月8日

Object Hallucination in Image Captioning

Arxiv

3+阅读 · 2019年3月29日

Improving Image Captioning by Leveraging Knowledge Graphs

Arxiv

8+阅读 · 2019年1月25日

Single-Shot Object Detection with Enriched Semantics

Arxiv

11+阅读 · 2018年4月8日

Bidirectional Attentive Fusion with Context Gating for Dense Video Captioning

Arxiv

5+阅读 · 2018年4月3日

Object Detection in Videos by Short and Long Range Object Linking

Arxiv

6+阅读 · 2018年1月30日

微信扫码咨询专知VIP会员