知名OCR软件被曝泄露超过20万份客户文件

2018 年 8 月 30 日 FreeBuf

前言

知名OCR软件ABBYY FineReader软件开发商的MongoDB服务器因配置错误导致超过20万份客户文件泄露。

ABBYY在文档识别、数据捕获和语言技术的开发领域中占据一定的领先地位,ABBYY FineReader是其主打的OCR及文档转换软件,可提供一条龙的PDF解决方案。

得益于较早的起步时间和全面的服务支持,其客户涵盖国内外的企业和个人,这也是本次文档泄露事件发生之后引起各大厂商注意的原因。

事件回溯

独立安全研究员Bob Diachenko于8月19日在AWS上发现了该数据库,大小为142GB,无需登录即可访问。

客户扫描数据并将其保留在云中,该数据库包括敏感的扫描文件,包括合同、保密协议、内部信件和备忘录等,还有一些文件名包含“documentRecognition”和“documentXML”这样的字段,可能是某些数据识别公司基础数据库的一部分。

数据库属于ABBYY的证据来自另一组文档,该文档包含公司电子邮件地址和经过加密的密码字段。

Bob发现给问题后即通知了Abbyy安全团队,两天后对该数据库的访问通道才被切断。

从什么时候开始存在这个问题以及多少人访问了这个数据库目前尚不清楚,但这个数据库可谓是价值连城。

ABBYY的客户涵盖来自各个领域的知名企业,如大众汽车、德勤、普华永道、百事可乐、Sberbank和麦当劳,这还只是冰山一角。

*参考来源:Bleeping Computer,Freddy编译整理,转载请注明来自FreeBuf.COM。

登录查看更多
1

相关内容

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
专知会员服务
54+阅读 · 2020年7月4日
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
116+阅读 · 2020年5月10日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
212+阅读 · 2020年2月21日
【新书】Java企业微服务,Enterprise Java Microservices,272页pdf
最新版本开源情报工具和资源手册(一)
黑白之道
9+阅读 · 2019年6月23日
【专题】Facebook遭德国反垄断调查及其影响分析
蚂蚁金服评论
17+阅读 · 2019年4月1日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
已删除
生物探索
3+阅读 · 2018年2月10日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
用python和Tesseract实现光学字符识别(OCR)
Python程序员
7+阅读 · 2017年7月18日
安全牛发布《威胁情报市场指南》报告
安全牛
12+阅读 · 2017年7月10日
Arxiv
3+阅读 · 2018年12月18日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
5+阅读 · 2018年1月30日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关VIP内容
相关资讯
最新版本开源情报工具和资源手册(一)
黑白之道
9+阅读 · 2019年6月23日
【专题】Facebook遭德国反垄断调查及其影响分析
蚂蚁金服评论
17+阅读 · 2019年4月1日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
已删除
生物探索
3+阅读 · 2018年2月10日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
用python和Tesseract实现光学字符识别(OCR)
Python程序员
7+阅读 · 2017年7月18日
安全牛发布《威胁情报市场指南》报告
安全牛
12+阅读 · 2017年7月10日
Top
微信扫码咨询专知VIP会员