上百份文字的检测与识别资源,包含数据集、code和paper

2017 年 12 月 7 日 数据挖掘入门与实战 要学习更多点这→

 向AI转型的程序员都关注了这个号👇👇👇


大数据挖掘DT数据分析  公众号: datadw


每一项均有对应的链接,请查看原文

http://blog.csdn.net/u010183397/article/details/56497303


【数据集(datasets)】

I. For scene text detection

1. COCO-Text [Homepage]

 63,686 images, 173,589 text instances, 3 fine-grained text attributes.

2.Synth-Text [Homepage]

800k thousand images; 8 million synthetic word instances

3. MSRA-TD500[Homepage]

500 (300 training + 200 testing) natural images that their resolution of the image vary 1296x864~1920x1280; Chinese , English or mixture of both

4. SVT[Homepage]

 350 high resolution images (average size 1260 × 860) (100 images for training and250 images for testing ) Only word level bounding boxes are provided with case-insensitive labels

5. KAIST [Homepage]

3000 images of indoorand outdoor scenes containing text Korean,English (Number), and Mixed (Korean + English + Number) Task:text location, segmentation and recognition

6. ICDAR系列

-ICDAR 2015 (1000 training images + 500 testing images)[Homepage]

-ICDAR2013 (229 + 233)  [Homepage]

-ICDAR2011 (229 + 255)  [Homepage]

-ICDAR2005 (1001 + 489)[Homepage]

-ICDAR2003 (181 + 251)   [Homepage]

II. For Scene Text Recognition

1.  IIIT-5K [Homepage]

5000 imagesfrom Scene Texts and born-digital (2k training and 3k testing images)Each image is a cropped word image of scene text with case-insensitive labels

2. Synth-Word[Homepage]

9 million images covering 90k English words (2014 Oxford; VGG)

3. StanfordSynth[Homepage]

Smallsingle-character images of 62 characters (0-9, a-z, A-Z). (2012 Stanford, AI Group)

4.SVHN[Homepage]

SVHN is obtained from house numbers in Google Street View images.(over 600,000 digit images)

5. KAIST

6. Chars74K [Homepage]

 Over 74K images from natural images, as well as a set of synthetically generated characters .mall single-character images of 62 characters (0-9, a-z, A-Z).



【自然场景中的文字识别(Scene Text Recognition)】

[2016-NIPS] Generative Shape Models: Joint Text Recognition and Segmentation with Very Little Training Data [paper]

[2016-AAAI] Reading Scene Text in Deep Convolutional Sequences [paper]

[2016-CVPR] Recursive Recurrent Nets with Attention Modeling for OCR in the Wild [paper]

[2016-CVPR] Robust Scene Text Recognition with Automatic Rectification[paper]

[2015-CoRR] An End-to-End Trainable Neural Network for Image-based Sequence Recognition and It's Application to Scene Text Recognition [paper][code]

[2015-ICDAR] Automatic Script Identification in the Wild [paper]

[2015-ICLR] Deep structured output learning for unconstrained text recognition [paper]

[2014-NIPS] Synthetic Data and Artificial Neural Networks for Natural Scene Text Recognition [paper] [homepage][model]

[2014-TIP] A unified Framework for Multi-Oriented Text Detection and Recognition [paper]

[2013-CVPR]Scene Text Recognition using Part-based Tree-structured Character Detection [paper]

[2012-CVPR]top-down and bottom-up cues for scene text recognition [paper]

[2012-ICPR] End-to-End Text Recognition with CNN [pager][code]


【嵌入型文字的检测与识别(Embedded Text Detection and Recognition)】

[201704-TPAMI]  A Unified Framework for Tracking based Text Detection and Recognition from Web Videos[paper]

[2017-AAAI] Detection and Recognition of Text Embedding in Online Images via Neural Context Models [paper][code]


【手写体识别(Handwriting Recognition)】

[201704-TPAMI] Drawing and Recognizing Chinese Characters with RNN [paper]

[201610-arXiv]Learning Spatial-Semantic Context with Fully Convolutional Recurrent Network for Online Handwritten Chinese Text Recognition [paper]

[201610-arXiv] Stroke Sequence-Dependent Deep Convolutional Neural Network for Online Handwritten Chinese Character Recognition [paper]

[201606-arXiv] Drawing and Recognizing  Chinese Characters with RNN [paper]

201604-arXiv] Scan,Attend and Read: End-to-End Handwritten Paragraph Recognition with MDLSTM Attention [paper][video]

[2015-ICDAR] High Performance Offline Handwritten Chinese Character Recognition Using GoogLeNet and Directional Feature Maps[paper][code][code2]


【综述( Survey)】

[2016-TIP] Text Detection Tracking and Recognition in Video:A Comprehensive Survey [paper]

[2015-PAMI] Text Detection and Recognition in Imagery: A Survey [paper]

[2014-FCS] Scene Text Detection and Recognition: Recent Advances and Future Trends[paper]


【场景文字检测(Scene Text Detection)】

[201703-arXiv] Deep Direct Regression for Multi-Oriented Scene Text Detection[paper]

[201703-arXiv]Arbitrary-Oriented Scene Text Detection via Rotation Proposal [paper]

[201702-arXiv] Improving Text Proposal for Scene Images with Fully Convolutional Networks [paper]

[2017-CVPR]EAST: An Efficient and Accurate Scene Text Detector[paper]

[2017-CVPR] Deep Matching Prior Network: Toward Tighter Multi-oriented Text Detection [paper]

[2017-CVPR] Detecting Oriented Text in Natural Images by Linking Segments [paper]

[2017-AAAI] TextBoxes: A Fast TextDetector with a Single Deep Neural Network [paper][code]

[2016-ECCV] CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network[paper][code]

[2016-PHD-Thesis] Context Modeling for Semantic Text Matching and Scene Text Detection[paper]

[2016-IJCAI] Scene Text Detection in Video by Learning Locally and Globally [paper]

[201606-arXiv] Scene Text Detection via Holistic, Multi-Channel Prediction [paper]

[2016-CVPR] Accurate Text Localization in Natural Image with Cascaded Convolutional TextNetwork [paper]

[2016-CVPR] Synthetic Data for Text Localization in Natural Images [paper] [data][code]

[2016-CVPR] CannyText Detector: Fast and Robust Scene Text Localization Algorithm[paper]

[2016-CVPR] Multi-oriented text detection with fully convolutional network[paper][code]

[2016-IJCV] Reading Text in the Wild with Convolutional Neural Networks[paper][demo][homepage]

[2016-TIP] Text-Attentional Convolutional Neural Networks for scene Text Detection[paper]

[2016-IJDAR] TextCatcher: a method to detect curved and challenging text in natural scenes[paper]

[201605-arXiv] DeepText: A Unified Framework for Text Proposal Generation and Text Detection in Natural Images[paper][data]

[201601-arXiv] TextProposals: a Text-specific Selective Search Algorithm for Word Spotting in the Wild [paper][code]

[2015-TPAMI] Real-time Lexicon-free Scene Text Localization and Recognition[paper]

[2015-CVPR] Symmetry-Based Text Line Detector in Natural Scenes [paper][code]

[2015-ICCV] FASText: Efficient unconstrained scene text detector[paper][code]

[2015-ICDAR] Object Proposal for Text Extraction in the Wild[paper][code]

[2015-PHD-Thesis] Deep Learning for Text Spotting [paper]

[2014-ECCV] Deep Features for Text Spotting [paper][code][Homepage]

[2014-TPAMI] Robust Text Detection in Natural Scene Images[paper]

[2014-ECCV] Robust Text Detection with Convolution Neural Network Induced MSER Trees [paper]

[2013-ICCV] Photo OCR:Reading Text in Uncontrolled Conditions[paper]

[2012-CVPR] Real-time scne text localization and recognition[paper][code]

[2010-CVPR] SWT: Detecting Text in Natural Scenes with Stroke Width Transform [paper] [code][code2]


人工智能大数据与深度学习

搜索添加微信公众号:weic2c

长按图片,识别二维码,点关注



大数据挖掘DT数据分析

搜索添加微信公众号:datadw


教你机器学习,教你数据挖掘

长按图片,识别二维码,点关注



登录查看更多
17

相关内容

ICDAR是一个非常成功的旗舰会议系列,是文献分析界研究人员、科学家和实践者的最大和最重要的国际会议。该会议得到了IAPR-TC 10/11的认可,成立于近30年前。第15届文件分析与识别国际会议(ICDAR 2019)由澳大利亚悉尼科技大学(UTS)主办,并在悉尼国际会议中心(ICC)举行。接受的论文由会议出版服务(CPS)出版,并提交给IEEE Xplore数字图书馆。官网链接:http://icdar2019.org/
专知会员服务
61+阅读 · 2020年3月19日
专知会员服务
110+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
36+阅读 · 2020年1月10日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
95+阅读 · 2019年12月23日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
92+阅读 · 2019年10月16日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
19+阅读 · 2019年10月9日
BERT相关论文、文章和代码资源汇总
AINLP
19+阅读 · 2018年11月17日
资源 | 开源数据集
AI研习社
8+阅读 · 2018年9月25日
keras实战︱人脸表情分类与识别:人脸检测+情绪分类
数据挖掘入门与实战
21+阅读 · 2017年12月16日
福利 | 最全面超大规模数据集下载链接汇总
AI研习社
26+阅读 · 2017年9月7日
资源|各领域公开数据集
七月在线实验室
5+阅读 · 2017年8月25日
【推荐】SLAM相关资源大列表
机器学习研究会
10+阅读 · 2017年8月18日
Arxiv
5+阅读 · 2018年12月18日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关VIP内容
专知会员服务
61+阅读 · 2020年3月19日
专知会员服务
110+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
36+阅读 · 2020年1月10日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
95+阅读 · 2019年12月23日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
92+阅读 · 2019年10月16日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
19+阅读 · 2019年10月9日
相关资讯
BERT相关论文、文章和代码资源汇总
AINLP
19+阅读 · 2018年11月17日
资源 | 开源数据集
AI研习社
8+阅读 · 2018年9月25日
keras实战︱人脸表情分类与识别:人脸检测+情绪分类
数据挖掘入门与实战
21+阅读 · 2017年12月16日
福利 | 最全面超大规模数据集下载链接汇总
AI研习社
26+阅读 · 2017年9月7日
资源|各领域公开数据集
七月在线实验室
5+阅读 · 2017年8月25日
【推荐】SLAM相关资源大列表
机器学习研究会
10+阅读 · 2017年8月18日
Top
微信扫码咨询专知VIP会员