For successful scene text recognition (STR) models, synthetic text image generators have alleviated the lack of annotated text images from the real world. Specifically, they generate multiple text images with diverse backgrounds, font styles, and text shapes and enable STR models to learn visual patterns that might not be accessible from manually annotated data. In this paper, we introduce a new synthetic text image generator, SynthTIGER, by analyzing techniques used for text image synthesis and integrating effective ones under a single algorithm. Moreover, we propose two techniques that alleviate the long-tail problem in length and character distributions of training data. In our experiments, SynthTIGER achieves better STR performance than the combination of synthetic datasets, MJSynth (MJ) and SynthText (ST). Our ablation study demonstrates the benefits of using sub-components of SynthTIGER and the guideline on generating synthetic text images for STR models. Our implementation is publicly available at https://github.com/clovaai/synthtiger.


翻译:对于成功的现场文本识别模型,合成文本图像生成器减轻了现实世界缺少附加说明文本图像的情况。 具体地说, 合成文本图像生成器生成了具有不同背景、 字体样式和文本形状的多文本图像, 使STR模型能够学习可能无法从手动附加说明数据中获得的视觉模式。 在本文中, 我们引入了新的合成文本图像生成器, 合成TIGER, 方法是分析用于文本图像合成的技术, 并将有效图像整合到一个单一的算法中。 此外, 我们提出了两种技术, 缓解培训数据长度和字符分布方面的长尾问题。 在我们的实验中, 合成TIGER 取得了比合成数据集、 MJSynth (MJ) 和 SynthText (ST) 相结合的更好的STRS 性能。 我们的减缩研究展示了使用合成文本图像的子构件和关于生成合成文本图像的指南的好处。 我们的实施工作可以在 https://github. com/ cloovaai/ synthtiger 上公开查阅 。

0
下载
关闭预览

相关内容

专知会员服务
26+阅读 · 2021年9月2日
Python编程基础,121页ppt
专知会员服务
49+阅读 · 2021年1月1日
最新【深度生成模型】Deep Generative Models,104页ppt
专知会员服务
71+阅读 · 2020年10月24日
Python图像处理,366页pdf,Image Operators Image Processing in Python
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
深度学习医学图像分析文献集
机器学习研究会
19+阅读 · 2017年10月13日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Generative Adversarial Text to Image Synthesis论文解读
统计学习与视觉计算组
13+阅读 · 2017年6月9日
Slimmable Generative Adversarial Networks
Arxiv
3+阅读 · 2020年12月10日
Arxiv
4+阅读 · 2019年11月21日
VIP会员
相关VIP内容
相关资讯
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
深度学习医学图像分析文献集
机器学习研究会
19+阅读 · 2017年10月13日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Generative Adversarial Text to Image Synthesis论文解读
统计学习与视觉计算组
13+阅读 · 2017年6月9日
Top
微信扫码咨询专知VIP会员