深度|2017CV技术报告之图像分割、超分辨率和动作识别(2)
2024-07-04 来源:飞速影视
图 6:FAIR 语义分割技术实例展示,来源 Dollar(2016)。上图展示了 FAIR 应用的图像分割技术,它按顺序包括了 DeepMask、SharpMask 和 MutiPathNet 技术。该流程可实现大规模场景中的精准分割与分类。
视频传递网络(Video Propagation Network)[51] 通过建立一个简单模型,从视频第一帧开始便向后传递精准的对象分割区域。此外,在整个视频的传递过程中模型也会加入一些额外的信息。
在 2016 年,为了解决上文提及的大规模任务以及本地实现问题,研究人员开始寻找替代性的网络方案。DeepLab 就是一个例子,它在图像语义分割任务上得到了令人激动的成果。Khoreva et al.[53] 基于 Deeplab[52] 的早期工作(circa 2015)提出了一个半监督学习方法,该方法和监督学习网络的性能水平不相上下。
通过使用端到端网络,计算机视觉进一步修正了网络共享有用信息的方法。该方案降低了多进程全方位子任务分类的计算需求。以下是两篇使用了该方法的论文。
100 Layers Tiramisu[54] 是一个全卷积 DenseNet,其中每一层都以前馈的方式与其它层级相连接。该网络在多个标准数据集上都以更少参数和训练/处理过程达到了目前最先进水平。
Fully Convolutional Instance-aware Semantic Segmentation[55] 可以同时执行具体实例的掩码(mask)预测与分类这两项子任务。该网络获得了微软亚洲研究院 COCO 分割挑战的冠军。
然而在此之外,ENet[56](这是一种用于实时语义分割的深度神经网络架构)却并不属于这一类别。它也展示出了可以降低计算成本的经济适用价值,可以更好地用于移动设备。
我们希望尽可能地将这些前沿技术与已有的实际应用联系起来。所以下面列举了医疗卫生领域在 2016 年内最有意思的一些图像分割项目:
A Benchmark for Endoluminal Scene Segmentation of Colonoscopy Images[57]
3D fully convolutional networks for subcortical segmentation in MRI: A large-scale study[58]
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号