Recent research on super-resolution (SR) has witnessed major developments with the advancements of deep convolutional neural networks. There is a need for information extraction from scenic text images or even document images on device, most of which are low-resolution (LR) images. Therefore, SR becomes an essential pre-processing step as Bicubic Upsampling, which is conventionally present in smartphones, performs poorly on LR images. To give the user more control over his privacy, and to reduce the carbon footprint by reducing the overhead of cloud computing and hours of GPU usage, executing SR models on the edge is a necessity in the recent times. There are various challenges in running and optimizing a model on resource-constrained platforms like smartphones. In this paper, we present a novel deep neural network that reconstructs sharper character edges and thus boosts OCR confidence. The proposed architecture not only achieves significant improvement in PSNR over bicubic upsampling on various benchmark datasets but also runs with an average inference time of 11.7 ms per image. We have outperformed state-of-the-art on the Text330 dataset. We also achieve an OCR accuracy of 75.89% on the ICDAR 2015 TextSR dataset, where ground truth has an accuracy of 78.10%.


翻译:最近对超分辨率(SR)的研究目睹了随着深层进化神经网络的进步而取得的重大进展。 需要从设备上提取精美文本图像甚至文档图像的信息, 其中大部分是低分辨率( LR) 图像。 因此, SR成为了重要的预处理步骤, 因为在智能手机中常见的比比比比比立( Bicubic) 抽取( Bicubic) 抽取( Bicubibic), 在远程图像上表现不佳。 让用户对其隐私有更大的控制, 并通过减少云计算和GPU使用时间的间接和减少碳足迹, 在边缘实施SR模型是近些时候必须的。 在运行和优化像智能手机这样的资源限制的平台模型方面存在各种挑战。 在本文中,我们展示了一个全新的深度神经网络, 重建更清晰的字符边缘, 从而提升了 OCR信心。 拟议的结构不仅使PSNR( PSNR) 大大改进了对各种基准数据集的检查, 而且还以11.7 mms的平均值运行。 我们在2015年的O- CD- Refrial 3 数据中实现了一个2015 的精确。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
MIT-深度学习Deep Learning State of the Art in 2020,87页ppt
专知会员服务
61+阅读 · 2020年2月17日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
FastText的内部机制
黑龙江大学自然语言处理实验室
5+阅读 · 2018年7月25日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
Simple Recurrent Unit For Sentence Classification
哈工大SCIR
6+阅读 · 2017年11月29日
【推荐】树莓派/OpenCV/dlib人脸定位/瞌睡检测
机器学习研究会
9+阅读 · 2017年10月24日
已删除
将门创投
3+阅读 · 2017年9月12日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Arxiv
0+阅读 · 2021年1月8日
Arxiv
12+阅读 · 2020年8月3日
Arxiv
20+阅读 · 2020年6月8日
Arxiv
3+阅读 · 2017年10月1日
VIP会员
相关VIP内容
Python图像处理,366页pdf,Image Operators Image Processing in Python
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
MIT-深度学习Deep Learning State of the Art in 2020,87页ppt
专知会员服务
61+阅读 · 2020年2月17日
相关资讯
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
FastText的内部机制
黑龙江大学自然语言处理实验室
5+阅读 · 2018年7月25日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
Simple Recurrent Unit For Sentence Classification
哈工大SCIR
6+阅读 · 2017年11月29日
【推荐】树莓派/OpenCV/dlib人脸定位/瞌睡检测
机器学习研究会
9+阅读 · 2017年10月24日
已删除
将门创投
3+阅读 · 2017年9月12日
最佳实践:深度学习用于自然语言处理(三)
待字闺中
3+阅读 · 2017年8月20日
Top
微信扫码咨询专知VIP会员