深度|2017CV技术报告之图像分割、超分辨率和动作识别(6)

2024-07-04 来源:飞速影视
着色(Colourisation)是指将单色图像转换成全彩的过程。最初这样工作是由人工操作完成的,人们会花非常多的精力去选择每幅图中特定像素应该使用的颜色。长久以来,让画面变得真实一直是人类着色家的专利,但是到 2016 年,技术的进步让机器也可能办到这一点。虽然人类可能无法精准地还原图像中事物的真实颜色,但是他们可以凭借自己对真实世界的知识来让自己的着色在某种程度上看起来是连贯且不奇怪的。
在着色的过程中,网络会根据其对物体位置、纹理与环境的理解来选择最可能的颜色添加到图像上。比如它会学习到皮肤是略带血色的,天空是带些蓝色的。
下面是年度三项影响力最大的工作:
Zhang 等人 [83] 提出了一个方法,该方法以 32% 的概率成功欺骗了人类测试者,这是一个着色视觉的图灵测试。
Larsson 等人 [84] 通过使用深度学习来进行直方图预测,他们让系统实现了全自动着色功能。
Lizuka, Simo-Serra 和 Ishikawa[85] 展示了一个基于卷积神经网络的着色模型。该项工作达到了目前最先进的水平。在我们看来,他们的系统表现从质量上来看是最好的,同时其结果看起来也是最真实的,图 10 提供了对比图。

深度|2017CV技术报告之图像分割、超分辨率和动作识别


图 10:着色研究成果对比,来源 Lizuka et al. 2016[86]。上图从上到下,第一列包含的是等待着色的原始单色图像输入。其他的几列展示了 2016 年多个不同研究生成的着色结果。从左到右看,分别是第二列 Larsson et al.[84]、第三列 Zhang et al.[83]、以及 Lizuka, Simo-Serra 和 Ishikawa[85] 的研究成果,也就是图中被作者称为「ours」的那个团队。纵观整个比较,第三行(图中有一群男孩)的着色差异是最明显的。对此我们相信 Lizuka 等人的工作(第 4 列)在着色结果上看是领先于其对手的。
相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号