深度|2017CV技术报告之图像分割、超分辨率和动作识别

2024-07-04 来源:飞速影视
选自The M Tank
机器之心编译
参与:晏奇、蒋思源
The M Tank 编辑了一份报告《A Year in Computer Vision》,记录了 2016 至 2017 年计算机视觉领域的研究成果,对开发者和研究人员来说是不可多得的一份详细材料。该材料共包括四大部分,在本文中机器之心对第二部分做了编译介绍,第一部分和第四部分详见《计算机视觉这一年:这是最全的一份 CV 技术报告》和《计算机视觉这一年:2017 CV 技术报告 Plus 之卷积架构、数据集与新趋势》。
图像分割
计算机视觉任务的核心是分割(Segmentation)处理,它将整幅图片分割成可被标记和分类的像素组。在此基础上,语义分割(Semantic Segmentation)则更进了一步,它试图从语义上去理解一幅图像中每个像素扮演的角色。比如:一个图像中出现的是一只猫还是汽车,还是其它类别的事物。然而,实例分割(Instance Segmentation)又在语义分割上更进了一步,它能够分割出一个类别事物中具体不同的对象,比如以三种不同颜色来标记不同的三只狗。此外,分割技术的应用十分广泛,大量语义分割技术被应用于自动驾驶中。
可以认为,在图像分割领域,部分最重要的贡献应该归功于 FAIR 实验室。自 2015 年起,他们便展开了名为 DeepMask[46] 的研究项目。DeepMask 可以在对象上粗略生成一个初级版本的分割区域(也即一个「mask」)。在 2016 年,Fair 开发了 SharpMask[47] 系统,它可以对 DeepMask 提供的分割区域进行修正,纠正漏掉的细节并且改善语义分割效果。在此基础之上,MultiPathNet[48] 可以识别出由每个分割区域描述的物体。
「为了能够识别一般物体的形状,你必须首先在高层面(high-level)理解所观察的事物(DeepMask),但是如果要想更具体地来识别它们,那你则需要观察那些小到像素的低层面(lower-level)特征(SharpMask)。」——Piotr Dollar,2016.[49]

深度|2017CV技术报告之图像分割、超分辨率和动作识别


相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号