深度学习助力数据压缩,一文读懂相关理论(11)
2023-05-02 来源:飞速影视
图 5. Bit-Swap 过程示意。
本文在 ImageNet 的 32×32 像素随机块上训练分层潜变量模型。为了测试,独立于测试集拍摄了 100 幅图像。100 幅图像的压缩比见表 1。这 100 幅图像被裁剪成每边 32 像素的倍数,这样就可以用 32 个像素块来拟合一个网格。网格被视为一个数据集,必须按顺序处理才能被压缩。作者在基线方案中使用相同的裁剪图像,而不是先将图像分成 32 x 32 像素的块。
表 1. ImageNet 100 幅图像的压缩比(未缩放和裁剪)。
关于深度学习在数据压缩中的应用,作者单独建立了研究主页,更新相关的研究成果并提供代码、视频下载等,感兴趣的可以访问 https://bair.berkeley.edu/blog/2019/09/19/bit-swap/。
3、基于深度学习的数据压缩应用前景展望
由上文的分析和具体论文实例的结果可以看出,深度学习方法在处理数据压缩问题时,不再像传统方法一样尝试找到数据自身的统计特征、数值特征等,而是自动挖掘复杂结构的数据内在特征。深度学习的数据挖掘和重构能力使得其能够在保持数据特征、保证编码效果的同时获得较高的压缩比。
尽管应用效果很好,但深度学习方法还是存在自身局限性:
当数据量大、数据结构复杂时,深度学习的整体结构也会变得非常复杂,当进行较深层次的训练时,模型所需要的时间会急速增长。由本文选择的两篇实例可以看到,作者在实验中都将图像进行了缩小处理,例如 32×32、64x64 大小的图片,作者也在讨论中提到,如果使用原始大小的图片,计算时间和成本都会非常巨大;深度学习方法还是缺少对内在机理的分析,在不同的数据压缩应用中还是以「黑盒」的方式使用,主要方法就是通过调整训练层、参数等改进压缩效果。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号