当前位置：首页 > 资讯 >

AI凭什么超越人类修图师？万字长文看懂美图云修AI修图解决方案(8)

2023-05-04 来源:飞速影视

图 10. 全局分支网络结构
判别器设计
为了能够获得更加逼近真实结果的图像，此处采用了对抗性损失来最小化实际光分布和输出正态光分布之间的距离。但是一个图像级的鉴别器往往不能处理空间变化的图像，例如输入图像是在室内复杂光源场景下获取的，受到室内光源漫反射的影响，每个区域需要校正的程度不同，那么单独使用全局图像判别器往往无法提供所需的自适应能力。
为了自适应地校正局部区域色偏，MTlab 采用文献[4]EnlightenGAN 中的 D 网络。该结构使用 PatchGAN 进行真假鉴别。判别器包含全局以及局部两个分支，全局分支判断校正图像的真实性，局部分支从输入图像随机剪裁 5 个 patch 进行判别，改善局部色偏校正效果。D 网络的输入图像与 target 图像，都会从 RGB 颜色域转换成 LAB 颜色域，Lab 是基于人对颜色的感觉来设计的，而且与设备无关，能够，使用 Lab 进行判别能够获得相对稳定的效果。全局 - 局部判别器网络结构如图 11 所示。

图 11. 全局 - 局部判别器
Loss 函数的设计包括 L1 loss, MS-SSIM loss, VGG loss, color loss and GAN loss。其中 L1 loss 保证图像的色彩亮度的真实性；MS-SSIM loss 使得生成图像不会丢失细节，保留结构性信息，VGG loss 限制图像感知相似性；color loss 分别将增强网络得到 image 与 target 先进行高斯模糊，也就是去掉部分的边缘细节纹理部分，剩下的能作为比较的就是对比度以及颜色；GAN loss 确保图像更加真实。这五个 loss 相加就构成了 AWBGAN 的损失函数。
最终色偏校正方案的校正效果如图 12 所示。

1 ...6 7 8 9 10 ...19 查看全文

AI凭什么超越人类修图师？万字长文看懂美图云修AI修图解决方案(8)

大耳朵图图之美食狂想曲

武林秘案之美人图鉴

普什图人

大耳朵图图之霸王龙在行动

美人图

凡人修真张天师

云图

长江图