隐私保护的第一道防线:破解马赛克有多「容易」?(7)
2023-04-22 来源:飞速影视
先放大再对比猜测,PULSE 算法可谓另辟蹊径。不过,靠猜测得到的图案毕竟不是原图,在还原过程往往得到清晰但跟原图大相径庭的图案。比如,我们将奥巴马的图像打码,再通过PULSE 算法还原,得到的居然是一张白人面孔。
对此,PULSE 算法创始人解释道:「结果的偏差,原因在于数据的偏差。为什么 PULSE 会出现奥巴马被洗白的情况?因为它是在 FlickFaceHQ 上进行预训练,这个数据集里基本都是白人照片。如果换成来自塞内加尔的数据集,训练完全相同的系统,那必然是每个人都看起来像非洲人。」
PULSE 解码生成的始终不是真实的原图。如果你打开 PULSE 的 Github 链接,在项目描述的第一段就有着清晰的描述:「我们已经注意到很多人担心 PULSE 将被用于识别面部被模糊化的个人。我们想强调的是,这是不可能的。PULSE 制作的是不存在的人的虚构面孔,不应该与真实的人混淆。它不会帮助识别或重建原始图像。」
Depix
除了识别人脸并去除马赛克,对于文字马赛克的处理也有对应的解码思路提出。
2022 年横空出世的 Depix 就是能够从像素化截图中恢复密码的工具。该项目适用于使用线性方框滤波器(linear box filter)创建的像素化图像。如下图所示,项目作者给出了像素化图像、恢复之后的效果和原图的对比结果:
该算法利用了线性盒式滤波器分别处理每个块,对于每个块,它将对搜索图像中的所有块进行像素化以检查直接匹配。对于大多数像素化图像,Depix 设法找到单匹配结果。假设这些是正确的。然后,将周围的多匹配块的匹配进行比较,以在几何上与像素化图像中的距离相同的距离进行比较。匹配也被视为正确。重复此过程几次。正确的块不再具有几何匹配之后,它将直接输出所有正确的块。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号