当前位置：首页 > 资讯 >

深度|2017CV技术报告之图像分割、超分辨率和动作识别

2024-07-04 来源:飞速影视

选自The M Tank
机器之心编译
参与：晏奇、蒋思源
The M Tank 编辑了一份报告《A Year in Computer Vision》，记录了 2016 至 2017 年计算机视觉领域的研究成果，对开发者和研究人员来说是不可多得的一份详细材料。该材料共包括四大部分，在本文中机器之心对第二部分做了编译介绍，第一部分和第四部分详见《计算机视觉这一年：这是最全的一份 CV 技术报告》和《计算机视觉这一年：2017 CV 技术报告 Plus 之卷积架构、数据集与新趋势》。
图像分割
计算机视觉任务的核心是分割（Segmentation）处理，它将整幅图片分割成可被标记和分类的像素组。在此基础上，语义分割（Semantic Segmentation）则更进了一步，它试图从语义上去理解一幅图像中每个像素扮演的角色。比如：一个图像中出现的是一只猫还是汽车，还是其它类别的事物。然而，实例分割（Instance Segmentation）又在语义分割上更进了一步，它能够分割出一个类别事物中具体不同的对象，比如以三种不同颜色来标记不同的三只狗。此外，分割技术的应用十分广泛，大量语义分割技术被应用于自动驾驶中。
可以认为，在图像分割领域，部分最重要的贡献应该归功于 FAIR 实验室。自 2015 年起，他们便展开了名为 DeepMask[46] 的研究项目。DeepMask 可以在对象上粗略生成一个初级版本的分割区域（也即一个「mask」）。在 2016 年，Fair 开发了 SharpMask[47] 系统，它可以对 DeepMask 提供的分割区域进行修正，纠正漏掉的细节并且改善语义分割效果。在此基础之上，MultiPathNet[48] 可以识别出由每个分割区域描述的物体。
「为了能够识别一般物体的形状，你必须首先在高层面（high-level）理解所观察的事物（DeepMask），但是如果要想更具体地来识别它们，那你则需要观察那些小到像素的低层面（lower-level）特征（SharpMask）。」——Piotr Dollar，2016.[49]

1 2 3 4 5 ...8 查看全文

深度|2017CV技术报告之图像分割、超分辨率和动作识别

初识与告别之间

雌雄莫辨

敌友难辨第一季

世界奇妙物语 2017年深夜特别篇

大耳朵图图之霸王龙在行动

超超超超超喜欢你的100个女朋友

分手进度百分之99动态漫画

职场是个技术活