Digitized documents such as scientific articles, tax forms, invoices, contract papers, and historic texts, are widely used nowadays. These images could be degraded or damaged due to various reasons including poor lighting conditions when capturing the image, shadow while scanning them, distortion like noise and blur, aging, ink stain, bleed through, watermark, stamp, etc. Document image enhancement and restoration play a crucial role in many automated document analysis and recognition tasks, such as content extraction using optical character recognition (OCR). With recent advances in deep learning, many methods are proposed to enhance the quality of these document images. In this paper, we review deep learning-based methods, datasets, and metrics for different document image enhancement problems. We provide a comprehensive overview of deep learning-based methods for six different document image enhancement tasks, including binarization, debluring, denoising, defading, watermark removal, and shadow removal. We summarize the main state-of-the-art works for each task and discuss their features, challenges, and limitations. We introduce multiple document image enhancement tasks that have received no to little attention, including over and under exposure correction and bleed-through removal, and identify several other promising research directions and opportunities for future research.


翻译:科学文章、税务表格、发票、合同文件和历史文本等数字化文件如今被广泛使用,这些图像可能由于各种原因被退化或损坏,其中包括在捕捉图像时光亮条件差、扫描时的阴影、噪音和模糊等扭曲、老化、墨迹污、流血、水印、印章等。文件图像的增强和恢复在许多自动文件分析和识别任务中发挥着关键作用,例如利用光学特征识别(OCR)进行内容提取。随着最近深层次学习的进展,提出了许多方法来提高这些文件图像的质量。在本文件中,我们审查了基于深层学习的方法、数据集和不同文件图像增强问题的衡量标准。我们全面概述了基于深层学习的方法,用于六种不同的文件图像增强任务,包括二元化、拆除、去除、去除、去除、去除、去除水标记和清除阴影。我们总结了每项任务的主要艺术品状况,并讨论了其特征、挑战和限制。我们介绍了许多基于文件的改进任务,但很少引起注意,包括暴露过后和流血式清除,并确定了其他有希望的机会。

0
下载
关闭预览

相关内容

Automator是苹果公司为他们的Mac OS X系统开发的一款软件。 只要通过点击拖拽鼠标等操作就可以将一系列动作组合成一个工作流,从而帮助你自动的(可重复的)完成一些复杂的工作。Automator还能横跨很多不同种类的程序,包括:查找器、Safari网络浏览器、iCal、地址簿或者其他的一些程序。它还能和一些第三方的程序一起工作,如微软的Office、Adobe公司的Photoshop或者Pixelmator等。
多标签学习的新趋势(2020 Survey)
专知会员服务
42+阅读 · 2020年12月6日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
ICRA 2019 论文速览 | 基于Deep Learning 的SLAM
计算机视觉life
41+阅读 · 2019年7月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Reinforcement Learning: An Introduction 2018第二版 500页
CreateAMind
12+阅读 · 2018年4月27日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Deep Learning for Computational Cytology: A Survey
Arxiv
0+阅读 · 2022年2月10日
Arxiv
16+阅读 · 2021年1月27日
Arxiv
13+阅读 · 2020年8月3日
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Image Segmentation Using Deep Learning: A Survey
Arxiv
45+阅读 · 2020年1月15日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
5+阅读 · 2018年10月11日
VIP会员
相关资讯
ICRA 2019 论文速览 | 基于Deep Learning 的SLAM
计算机视觉life
41+阅读 · 2019年7月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Reinforcement Learning: An Introduction 2018第二版 500页
CreateAMind
12+阅读 · 2018年4月27日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
相关论文
Deep Learning for Computational Cytology: A Survey
Arxiv
0+阅读 · 2022年2月10日
Arxiv
16+阅读 · 2021年1月27日
Arxiv
13+阅读 · 2020年8月3日
A Survey on Bayesian Deep Learning
Arxiv
63+阅读 · 2020年7月2日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Image Segmentation Using Deep Learning: A Survey
Arxiv
45+阅读 · 2020年1月15日
Arxiv
53+阅读 · 2018年12月11日
Arxiv
5+阅读 · 2018年10月11日
Top
微信扫码咨询专知VIP会员