Pytorch场景文字识别工具箱

2020 年 7 月 11 日 专知

【导读】Vedastr 是一个基于Pytorch的开源场景文字识别工具箱。


特性

模块化设计

我们将场景文本识别框架分解为不同的组件,并且可以通过组合不同的模块轻松构建定制的场景文本识别框架。


灵活性

Vedastr具有足够的灵活性,能够轻松更改模块中的组件。


模块扩展性

将新模块集成到vedastr项目中很容易。


支持多种框架

该工具箱支持几种流行的场景文本识别框架,例如CRNN,TPS-ResNet-BiLSTM-Attention,Transformer等。


很棒的性能

我们在深层文本识别基准中重新实现了最佳模型,并获得了更好的平均准确性。而且,我们实现了一个简单的基准(ResNet-FC),性能是可以接受的。


安装

系统要求

  • Linux

  • Python 3.6+

  • PyTorch 1.2.0 or higher

  • CUDA 9.0 or higher

安装Vedastr

1.  新建一个conda虚拟环境

conda create -n vedastr python=3.6 -yconda activate vedastr

2. 安装Pytorch与torchvision

conda install pytorch torchvision -c pytorch

3. 下载vedastr库

git clone https://github.com/Media-Smart/vedastr.gitcd vedastrvedastr_root=${PWD}

4. 安装依赖

pip install -r requirements.txt

数据准备

  1. 从下列网站下载数据

    https://github.com/clovaai/deep-text-recognition-benchmark

  2. 新建数据文件夹

    cd ${vedastr_root}
    mkdir ${vedastr_root}/data
  3. 按下列结构组织下载好的数据

    data└── data_lmdb_release    ├── evaluation    ├── training    │   ├── MJ    │   │   ├── MJ_test    │   │   ├── MJ_train    │   │   └── MJ_valid    │   └── ST    └── validation

训练

python tools/trainval.py configs/clova.py

测试

python tools/test.py configs/clova.py path_to_clova_weights

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源


登录查看更多
2

相关内容

手写实现李航《统计学习方法》书中全部算法
专知会员服务
48+阅读 · 2020年8月2日
【干货书】高级应用深度学习,294页pdf
专知会员服务
151+阅读 · 2020年6月20日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
119+阅读 · 2019年12月31日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
开源OCR文本检测器,基于TextBoxes++和RetinaNet
专知
11+阅读 · 2019年11月15日
Pytorch视频分类教程
专知
6+阅读 · 2019年5月25日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
机器学习可解释性工具箱XAI
专知
11+阅读 · 2019年2月8日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
TensorFlow.js 实例上手指南
专知
3+阅读 · 2018年12月10日
Pytorch作者Adam Paszke-53页Pytorch教程PPT
专知
34+阅读 · 2018年10月27日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Rapid Customization for Event Extraction
Arxiv
7+阅读 · 2018年9月20日
Arxiv
5+阅读 · 2018年5月10日
Arxiv
5+阅读 · 2017年7月23日
VIP会员
相关VIP内容
手写实现李航《统计学习方法》书中全部算法
专知会员服务
48+阅读 · 2020年8月2日
【干货书】高级应用深度学习,294页pdf
专知会员服务
151+阅读 · 2020年6月20日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
179+阅读 · 2020年1月1日
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
119+阅读 · 2019年12月31日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
开源OCR文本检测器,基于TextBoxes++和RetinaNet
专知
11+阅读 · 2019年11月15日
Pytorch视频分类教程
专知
6+阅读 · 2019年5月25日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
机器学习可解释性工具箱XAI
专知
11+阅读 · 2019年2月8日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
TensorFlow.js 实例上手指南
专知
3+阅读 · 2018年12月10日
Pytorch作者Adam Paszke-53页Pytorch教程PPT
专知
34+阅读 · 2018年10月27日
Top
微信扫码咨询专知VIP会员