成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别
2020 年 7 月 5 日
机器之心
机器之心报道
参与:路
Easy OCR 支持 40 多种语言,所需的 GPU 内存为 2GB+,并且支持在 CPU 模式中运行。
OCR(光学字符识别)是是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。目前,这项技术在拍照搜题、拍照翻译等应用中得到广泛使用。
今天,我们来介绍一个支持 40 多种语言的 OCR 库:Easy OCR。
GitHub 地址:https://github.com/JaidedAI/EasyOCR
该 OCR 库使用深度神经网络构建而成:CNN+LSTM+CTC loss,包含三个解码器可选项:贪心搜索、束搜索和词束搜索(word-beam search)。
据介绍,Easy OCR 的性能可与商业 API 解决方案媲美,且已开源,支持本地运行,因此适合关注数据隐私和适应性的人使用。
作者表示:与标准的开源 OCR 工具 Tesseract 相比,Easy OCR 的准确率更高,不过速度稍慢。
支持 40+ 种语言,识别效果优秀
Easy OCR 支持对 42 多种语言执行 OCR 识别,包括简繁中文、日语、韩语、英语、德语、乌兹别克语、越南语、斯瓦希里语等。
Easy OCR 支持的语言清单。
下图展示了 Easy OCR 的识别效果:
Easy OCR 的识别结果
此外,Easy OCR 所需的 GPU 内存为 2GB+,并且支持在 CPU 模式中运行,因此具备较强的实用性。
Easy OCR 的原理
如前所述,Easy OCR 利用 CNN+LSTM+CTC loss 构建而成,包括三个解码器可选项:贪心搜索、束搜索和词束搜索(word-beam search)。其中检测部分基于 CRAFT 算法预训练得到,识别部分则基于作者自有数据集训练得到。
CRAFT 是一个字符级别的文本检测网络,使用分水岭算法生成 label,采用 heatmap 得到激活值最大的目标区域。
Easy OCR 使用了 CRAFT 文本检测器的官方 Pytorch 实现。
CRAFT 实现地址:https://github.com/clovaai/CRAFT-pytorch
在处理过程中,Easy OCR 对输入图像中的每一行文字提供 [location, text, model confident] 结果,如下图所示:
对于给定图像,Easy OCR 分别对图像中的每一行文字提供 [location, text, model confident] 结果。
此外,使用者还可以在不同的数据集上对模型进行重新训练,不过目前项目作者尚未放出训练脚本。开发者可以参考该库 https://github.com/clovaai/deep-text-recognition-benchmark 进行模型重训练。
关于 Easy OCR 的更多细节及代码详情,参见 GitHub 项目地址。
本
文为机器之心报道,
转载请联系本公众号获得授权
。
✄------------------------------------------------
加入机器之心(全职记者 / 实习生):
hr@jiqizhixin.com
投稿或寻求报道:content
@jiqizhixin.com
广告 & 商务合作:
bd@jiqizhixin.com
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
光学字符识别
关注
43
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
【文献综述】Text Detection and Recognition in the Wild: A Review 自然文本检测与识别
专知会员服务
44+阅读 · 2020年6月11日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
最新TensorFlow2.0机器学习实用指南—第二版(附279页pdf下载)
专知会员服务
277+阅读 · 2020年6月9日
【干货书】R语言书: 编程和统计的第一课程,
专知会员服务
111+阅读 · 2020年5月9日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
C++17是什么?看这本最新指南书册《C++17标准语言新特性》109页pdf
专知会员服务
68+阅读 · 2020年2月23日
【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习,561页pdf
专知会员服务
103+阅读 · 2020年2月4日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
【实战电子书+代码】自然语言处理的实战,545页pdf,使用Python理解、分析和生成文本
专知会员服务
262+阅读 · 2019年12月28日
【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源,附787页pdf
专知会员服务
209+阅读 · 2019年12月15日
开源OCR文本检测器,基于TextBoxes++和RetinaNet
专知
11+阅读 · 2019年11月15日
用Now轻松部署无服务器Node应用程序
前端之巅
16+阅读 · 2019年6月19日
Python中文分词工具大合集:安装、使用和测试
AINLP
11+阅读 · 2019年5月13日
Github项目推荐 | NeuronBlocks:微软发布的模块化深度学习NLP工具集
AI科技评论
3+阅读 · 2019年4月26日
支持多标签页的Windows终端:Fluent 终端
Python程序员
7+阅读 · 2019年4月15日
40行Python代码,实现卷积特征可视化
机器之心
5+阅读 · 2019年1月31日
北大开源全新中文分词工具包:准确率远超THULAC、结巴分词
机器之心
6+阅读 · 2019年1月9日
教程 | 如何使用TensorFlow实现音频分类任务
机器之心
5+阅读 · 2017年12月16日
TensorFlow实现神经网络入门篇
AI研习社
11+阅读 · 2017年12月11日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
Zero-Resource Cross-Lingual Named Entity Recognition
Arxiv
5+阅读 · 2019年11月22日
Meta Learning for End-to-End Low-Resource Speech Recognition
Arxiv
20+阅读 · 2019年10月26日
Towards Open-Domain Named Entity Recognition via Neural Correction Models
Arxiv
5+阅读 · 2019年9月13日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Pre-trained Language Model Representations for Language Generation
Arxiv
5+阅读 · 2019年4月1日
Unsupervised Multilingual Word Embeddings
Arxiv
4+阅读 · 2018年9月6日
End-to-end Speech Recognition with Word-based RNN Language Models
Arxiv
3+阅读 · 2018年8月8日
OpenNMT: Neural Machine Translation Toolkit
Arxiv
3+阅读 · 2018年5月28日
Joint Recognition of Handwritten Text and Named Entities with a Neural End-to-end Model
Arxiv
6+阅读 · 2018年3月22日
Baselines and test data for cross-lingual inference
Arxiv
3+阅读 · 2018年3月2日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
光学字符识别
束搜索
OCR(光学字符识别)
CRAFT
贪心搜索
搜索
相关VIP内容
【文献综述】Text Detection and Recognition in the Wild: A Review 自然文本检测与识别
专知会员服务
44+阅读 · 2020年6月11日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
最新TensorFlow2.0机器学习实用指南—第二版(附279页pdf下载)
专知会员服务
277+阅读 · 2020年6月9日
【干货书】R语言书: 编程和统计的第一课程,
专知会员服务
111+阅读 · 2020年5月9日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
C++17是什么?看这本最新指南书册《C++17标准语言新特性》109页pdf
专知会员服务
68+阅读 · 2020年2月23日
【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习,561页pdf
专知会员服务
103+阅读 · 2020年2月4日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
69+阅读 · 2020年1月17日
【实战电子书+代码】自然语言处理的实战,545页pdf,使用Python理解、分析和生成文本
专知会员服务
262+阅读 · 2019年12月28日
【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源,附787页pdf
专知会员服务
209+阅读 · 2019年12月15日
热门VIP内容
开通专知VIP会员 享更多权益服务
资源受限的大模型高效迁移学习算法研究
中国信通院发布《边缘计算产业发展研究报告(2024年)》报告
腾讯语音合成技术:模型优化与推理加速实践
【NeurIPS2024】训练计算最优的蛋白质语言模型
相关资讯
开源OCR文本检测器,基于TextBoxes++和RetinaNet
专知
11+阅读 · 2019年11月15日
用Now轻松部署无服务器Node应用程序
前端之巅
16+阅读 · 2019年6月19日
Python中文分词工具大合集:安装、使用和测试
AINLP
11+阅读 · 2019年5月13日
Github项目推荐 | NeuronBlocks:微软发布的模块化深度学习NLP工具集
AI科技评论
3+阅读 · 2019年4月26日
支持多标签页的Windows终端:Fluent 终端
Python程序员
7+阅读 · 2019年4月15日
40行Python代码,实现卷积特征可视化
机器之心
5+阅读 · 2019年1月31日
北大开源全新中文分词工具包:准确率远超THULAC、结巴分词
机器之心
6+阅读 · 2019年1月9日
教程 | 如何使用TensorFlow实现音频分类任务
机器之心
5+阅读 · 2017年12月16日
TensorFlow实现神经网络入门篇
AI研习社
11+阅读 · 2017年12月11日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
相关论文
Zero-Resource Cross-Lingual Named Entity Recognition
Arxiv
5+阅读 · 2019年11月22日
Meta Learning for End-to-End Low-Resource Speech Recognition
Arxiv
20+阅读 · 2019年10月26日
Towards Open-Domain Named Entity Recognition via Neural Correction Models
Arxiv
5+阅读 · 2019年9月13日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Pre-trained Language Model Representations for Language Generation
Arxiv
5+阅读 · 2019年4月1日
Unsupervised Multilingual Word Embeddings
Arxiv
4+阅读 · 2018年9月6日
End-to-end Speech Recognition with Word-based RNN Language Models
Arxiv
3+阅读 · 2018年8月8日
OpenNMT: Neural Machine Translation Toolkit
Arxiv
3+阅读 · 2018年5月28日
Joint Recognition of Handwritten Text and Named Entities with a Neural End-to-end Model
Arxiv
6+阅读 · 2018年3月22日
Baselines and test data for cross-lingual inference
Arxiv
3+阅读 · 2018年3月2日
大家都在搜
palantir
智能推荐
武器目标分配
学习方法
兵棋推演
MoE
大模型
PRML
笛卡尔
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top