扫描文件、批量识别、翻译、表格识别,这款 App 都能帮你做到

2018 年 5 月 2 日 少数派 Tolecen

白描是一款高效准确的 OCR 文字识别与翻译软件,从今天开始,他的 Title 就得改成:「白描 - 高效的文字识别与文件扫描软件」。

下面就来详细介绍一下白描的文件扫描功能。

长按二维码关注少数派,在后台回复「白描」即可获得下载链接。

自动文件扫描

让白描生成文件的扫描件,可以从相册选择图片裁剪,再切换颜色生成扫描件,也可以用一个更方便的方法,那就是自动扫描文件。

打开白描的拍照界面,在拍照按钮上方会有两个切换按钮,左侧的按钮就是扫描文件,在这个模式下就可以完成文件的自动扫描,无需点击拍照按钮,白描会自动检测文档边界自动拍照并进行扫描件处理。默认处理成黑白扫描件。

白描自动扫描界面

文件扫描支持多张扫描,「扫描文件」按钮上方的「单张」、「多张」的按钮切换即可切换不同的扫描模式,如果要一次扫描多张文件,可选择「多张」,以提高效率,每扫描完一张,在右下角就显示扫描件的缩略图以及已经扫描的数量,点击缩略图即可进入批量处理页面进行下一步处理。

扫描件色彩

白描提供了多种扫描件色彩的选择,以便于选择更适合文件的色彩。主要色彩有彩色文档、黑白文档、灰阶文档、原图增强、原图灰度、原图图片共 6 种色彩,各种颜色效果图如下:

其中,彩色文档、黑白文档、灰阶文档,是强化内容,弱化背景,基本全部将底色扣掉的处理方式,灰阶文档的字体比黑白文档的字体又细一些,灰度淡一些。而原图增强和原图灰度,是在原图的基础上进行的简单色彩处理,不会滤掉底色。

下面再来几张黑白处理过的图片的示意,对于过滤不相干的底色有不错的效果。

批量处理功能

白描之前就包含批量文字识别功能,因而文件扫描功能也同样需要批量处理功能,在批量处理功能页面,可以对图片进行排序、删除、增加等操作。基本界面如下图:

批量处理

批量处理页面除了普通的图片排序、删除、添加之外,也可以直接批量文字识别和导出 PDF,导出的 PDF 可以自由分享到其他软件。从批量页面进入某张图的处理页面,左下角会显示切换图片按钮,方便逐个处理。

识别页面优化

此次更新也对识别页面的 UI 和功能做了一些优化,比如按钮的优化,比如加入了自动识别边界功能,对文字识别的速度和准确度以及分段逻辑都做了相应的优化。

识别页面优化

进步的路漫漫而修远,白描一直会向着更好的方向发展。

关注少数派回复关键词,看更多精选文章 📱

iOS限免摄影WindowsApp壁纸音乐

ChromeAndroid小工具生活方式iPhone X游戏

登录查看更多
6

相关内容

利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,50年代开始探讨一般文字识别方法,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
90+阅读 · 2020年6月28日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
面向司法案件的案情知识图谱自动构建
专知会员服务
125+阅读 · 2020年4月17日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
67+阅读 · 2020年2月29日
【经典书】Python计算机视觉编程,中文版,363页pdf
专知会员服务
139+阅读 · 2020年2月16日
【综述】视频摘要最新综述文章,附45页综述全文下载
专知会员服务
33+阅读 · 2019年9月20日
7 款实用到哭的App,只说一遍
高效率工具搜罗
84+阅读 · 2019年4月30日
已删除
架构文摘
3+阅读 · 2019年4月17日
文本分析与可视化
Python程序员
9+阅读 · 2019年2月28日
自动文本摘要
AI研习社
21+阅读 · 2018年10月27日
深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)
数据挖掘入门与实战
16+阅读 · 2017年11月25日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
Arxiv
12+阅读 · 2018年9月15日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关资讯
7 款实用到哭的App,只说一遍
高效率工具搜罗
84+阅读 · 2019年4月30日
已删除
架构文摘
3+阅读 · 2019年4月17日
文本分析与可视化
Python程序员
9+阅读 · 2019年2月28日
自动文本摘要
AI研习社
21+阅读 · 2018年10月27日
深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)
数据挖掘入门与实战
16+阅读 · 2017年11月25日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
Top
微信扫码咨询专知VIP会员