当前位置：首页 > 资讯 >

深度|2017CV技术报告之图像分割、超分辨率和动作识别(2)

2024-07-04 来源:飞速影视

图 6：FAIR 语义分割技术实例展示，来源 Dollar（2016）。上图展示了 FAIR 应用的图像分割技术，它按顺序包括了 DeepMask、SharpMask 和 MutiPathNet 技术。该流程可实现大规模场景中的精准分割与分类。
视频传递网络（Video Propagation Network）[51] 通过建立一个简单模型，从视频第一帧开始便向后传递精准的对象分割区域。此外，在整个视频的传递过程中模型也会加入一些额外的信息。
在 2016 年，为了解决上文提及的大规模任务以及本地实现问题，研究人员开始寻找替代性的网络方案。DeepLab 就是一个例子，它在图像语义分割任务上得到了令人激动的成果。Khoreva et al.[53] 基于 Deeplab[52] 的早期工作（circa 2015）提出了一个半监督学习方法，该方法和监督学习网络的性能水平不相上下。
通过使用端到端网络，计算机视觉进一步修正了网络共享有用信息的方法。该方案降低了多进程全方位子任务分类的计算需求。以下是两篇使用了该方法的论文。
100 Layers Tiramisu[54] 是一个全卷积 DenseNet，其中每一层都以前馈的方式与其它层级相连接。该网络在多个标准数据集上都以更少参数和训练/处理过程达到了目前最先进水平。
Fully Convolutional Instance-aware Semantic Segmentation[55] 可以同时执行具体实例的掩码（mask）预测与分类这两项子任务。该网络获得了微软亚洲研究院 COCO 分割挑战的冠军。
然而在此之外，ENet[56]（这是一种用于实时语义分割的深度神经网络架构）却并不属于这一类别。它也展示出了可以降低计算成本的经济适用价值，可以更好地用于移动设备。
我们希望尽可能地将这些前沿技术与已有的实际应用联系起来。所以下面列举了医疗卫生领域在 2016 年内最有意思的一些图像分割项目：
A Benchmark for Endoluminal Scene Segmentation of Colonoscopy Images[57]
3D fully convolutional networks for subcortical segmentation in MRI: A large-scale study[58]

1 2 3 4 5 ...8 查看全文

深度|2017CV技术报告之图像分割、超分辨率和动作识别(2)

初识与告别之间

雌雄莫辨

敌友难辨第一季

世界奇妙物语 2017年深夜特别篇

大耳朵图图之霸王龙在行动

超超超超超喜欢你的100个女朋友

分手进度百分之99动态漫画

职场是个技术活