Github高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源

2020 年 12 月 17 日 新智元



  新智元报道  

编辑:keyu

【新智元导读】继修复涂鸦图片之后,厚码文字也不再安全了?近日,名为Depix的Github项目火爆全网,一切故意而为之的“文字密码”,在这一AI技术的处理下,瞬间就“暴露于光天之下”。


“来P个图吧!”  “好呀,不过这段话得打码,不然就麻烦了!”
 
如果现在告诉你,”打码“已经不再安全,你所想保护的信息,已然如”皇帝的新衣“,你会作何想?
 
不,这不是耸人听闻, 最近 一个名为Depix的GitHub项目火了,上线仅仅三天,star量就已经高达7K。 截止发文,此项目已经火速达到1w+的star量:




而就是这项技术,能够解码被打上马赛克的文字,你的所有努力,甚至有了”欲盖弥彰“的效果。


手机涂鸦如同“徒劳”,外行也能轻易恢复隐藏信息


前段时间,网络上爆出,使用手机涂鸦对图片所进行的操作,其实可以轻易被恢复:
 
简单拿微信聊天截屏的文字涂鸦来说:



我们身边太多的人,都可能会用这种涂鸦技术,遮盖自己想保密的信息。
 
看似很安全,对不对?
 
其实在有心人看来,你的操作可以马上成为徒劳:
 
只需要再次利用手机的图片编辑功能, 将曝光、鲜明度、高光、阴影、亮度等参数全部调至+100,然后再将对比度参数调至-100 ,然后,神奇的事情发生了:




行家都知道,相比于涂鸦,马赛克却无法被修复和逆转,令人非常的安心。
 
可是,放在现在,在AI面前,修复厚码图片中隐藏的内容,也成为了可能:



Depix——修复厚码文字内容,现已开源

 

Depix的主要功能,就是利用AI算法,将被像素化的文本内容从马赛克中还原出来。其适用于用线性盒过滤器创建的像素化图像。
 
其目的不是去马赛克,而是做文字恢复使用 虽说这可能令一些宅男失望,但其作用依旧强大且有意义。
 
此项目是由信息安全顾问Sipke Mellema 开发的,目前仅支持英文字母、数字和英文标点符号
 
而任何此个开源项目的使用者,简简单单使用以下指令,就可以恢复你想“窥探”的文字内容:
python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png
 
完整操作如下:
 
从截图中剪出像素化的方块,作为一个矩形。
将De Bruijn序列粘贴到编辑器中,使用相同的字体设置(文本大小、字体、颜色、hsl)。
制作序列的截屏。如果可能的话,使用同样的截图工具来创建像素化的图像。
运行 run python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

 

算法原理简单:分割小块,德布鲁因序列字符库助力像素匹配


Depix的原理是将马赛克区域的内容分割成许多个小块,然后将每个小块都和预先设置好的字符库(德布鲁因序列(De Bruijn sequence))进行像素匹配。




具体算法流程如下:
 
该算法利用了 线性盒滤波器 ,来分别处理每个块的特性。对于每个块,它对搜索图像中的所有块进行像素化,以检查是否直接匹配。
 
对于大多数像素化的图像,Depix设法找到单一匹配的结果。它假设这些都是正确的。然后,将周围的多匹配块的匹配在几何上与像素化图像中的相同距离进行比较。匹配也被视为正确。这个过程要重复几次。
 
当正确的块没有几何匹配时,它将直接输出所有正确的块 。对于多匹配块,它输出所有匹配的平均值。
 
开发这个AI项目,Mellema并不是为了窃取信息,而是 利用ECB和明文攻击的模式,提高信息保护技术
 
在他看来,不知道如何破坏当前的保护模式,是信息安全中的常见陷阱。
 
Depix主要是针对打码文字的处理,而说到修复马赛克像素级别图片的技术,我们不得不提杜克大学的AI算法PULSE:


宅男福利?渣画质修复还要看杜克PULSE

 
杜克大学的AI算法PULSE(Photo Upsampling via Latent Space Exploration), 可以将像素渣到马赛克级别的图片修复




该算法 可以将模糊、无法识别的人脸图像转换成计算机生成的图像,并且具有比之前任何时候都更加精细、逼真的细节
 
按照之前的方法,想要把一张模糊的大头照变清晰,最多只能将这张照片缩放到原始分辨率的八倍。
 
而PULSE,可以仅在几秒钟内,就可以把 16x16 像素的低分辨率小图,放大 64 倍,变成 1024 x 1024 像素的高分辨率图像。
 
这种将像素放大 64 倍级别的,绝对是业界首次



原本低分辨率照片中无法看到的细节,比如毛孔、细纹、睫毛、头发和胡茬等,经过PULSE算法处理后,都能看得一清二楚:



涉及到实际应用方向上,论文的共同作者 Sachit Menon 介绍称:
 
「在这些研究中,我们只是用面部作为概念验证。
 
但从理论上讲,该技术是通用的,从医学、显微镜学到天文学和卫星图像,都可以通过该技术改善画质。」
 
与此类似的,还有谷歌的超强像素递归方案,感兴趣的朋友可以自行探索。
 
最后附上Depix,PULSE的项目链接:
 
Depix项目地址 https://github.com/beurtschipper/Depix
PULSE项目地址 https://github.com/adamian98/pulse
 
参考链接:
https://www.maxiaobang.com/6570.html
https://github.com/beurtschipper/Depix
https://github.com/adamian98/pulse






登录查看更多
0

相关内容

GitHub.com 使用 Git 作为版本控制系统(version control system)提供在线源码托管的服务,同时是个有社交功能的开发者社区。 国外类似服务: Bitbucket.com
Gitlab.com
国内类似服务:
Coding.net
【干货书】C++实战编程指南,附549页pdf与Slides
专知会员服务
84+阅读 · 2021年4月23日
百页Python编程指南
专知会员服务
70+阅读 · 2021年2月16日
必须收藏!MIT-Gilbert老爷子《矩阵图解》,一张图看透矩阵
专知会员服务
82+阅读 · 2020年9月28日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
70+阅读 · 2020年1月17日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
36+阅读 · 2019年12月15日
换脸算什么?现在AI都能一键“脱衣”了
腾讯科技
12+阅读 · 2019年6月30日
10 快好用的下载工具,终于和迅雷说拜拜了
高效率工具搜罗
4+阅读 · 2019年4月4日
Python图片马赛克工具:photomosaic
Python程序员
3+阅读 · 2018年12月24日
polyglot:Pipeline 多语言NLP工具
AINLP
4+阅读 · 2018年12月11日
用OpenCV创建GIFs,给你的照片戴上墨镜
论智
8+阅读 · 2018年11月8日
Tplmap - 扫描服务器端模板注入漏洞的开源工具
黑白之道
6+阅读 · 2018年9月11日
别@微信团队了,我用Python给自己戴上了圣诞帽!
Arxiv
0+阅读 · 2021年6月18日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Arxiv
15+阅读 · 2019年9月30日
Arxiv
6+阅读 · 2018年3月31日
VIP会员
相关VIP内容
【干货书】C++实战编程指南,附549页pdf与Slides
专知会员服务
84+阅读 · 2021年4月23日
百页Python编程指南
专知会员服务
70+阅读 · 2021年2月16日
必须收藏!MIT-Gilbert老爷子《矩阵图解》,一张图看透矩阵
专知会员服务
82+阅读 · 2020年9月28日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
70+阅读 · 2020年1月17日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
36+阅读 · 2019年12月15日
相关资讯
换脸算什么?现在AI都能一键“脱衣”了
腾讯科技
12+阅读 · 2019年6月30日
10 快好用的下载工具,终于和迅雷说拜拜了
高效率工具搜罗
4+阅读 · 2019年4月4日
Python图片马赛克工具:photomosaic
Python程序员
3+阅读 · 2018年12月24日
polyglot:Pipeline 多语言NLP工具
AINLP
4+阅读 · 2018年12月11日
用OpenCV创建GIFs,给你的照片戴上墨镜
论智
8+阅读 · 2018年11月8日
Tplmap - 扫描服务器端模板注入漏洞的开源工具
黑白之道
6+阅读 · 2018年9月11日
别@微信团队了,我用Python给自己戴上了圣诞帽!
相关论文
Arxiv
0+阅读 · 2021年6月18日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Arxiv
15+阅读 · 2019年9月30日
Arxiv
6+阅读 · 2018年3月31日
Top
微信扫码咨询专知VIP会员