开源OCR文本检测器，基于TextBoxes++和RetinaNet- 专知

开源OCR文本检测器，基于TextBoxes++和RetinaNet

【导读】OCR由文本定位和文本识别组件构成。本文介绍Github上的一个开源文本定位组件Text_Detector，它使用了RetinaNet的结构和textboxes++中的一些技术。

OCR由文本定位和文本识别组件构成，文本定位组件寻找文本所在的位置，文本识别组件识别每个字符。本文介绍一个开源文本位置探测器Text_Detector，它的Github地址为：

https://github.com/qjadud1994/Text_Detector

Text_Detector使用了RetinaNet和textboxes++中的一些技术：

Text_Detector的Github页给出了一些较好的识别结果和较差的识别结果。

较好的识别结果如下：

在一些垂直文本或长文本等情况下，Text_Detector的效果不太理想：

Text_Detector依赖的环境如下：

更多关于Text_Detector的细节可以在它的Github主页上找到。

参考链接：

更多关于“OCR文字识别”的论文知识资料，请登录专知网站www.zhuanzhi.ai查看，或者点击“阅读原文”查看：

https://www.zhuanzhi.ai/topic/2001932433033143/awesome

-END-

专 · 知

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取更多AI知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程视频资料和与专家交流咨询！

请加专知小助手微信（扫一扫如下二维码添加），获取专知VIP会员码，加入专知人工智能主题群，咨询技术商务合作~

点击“阅读原文”，了解注册使用专知

展开全文