实录|旷视研究院详解COCO2017人体姿态估计冠军论文(PPT 视频)(2)

2023-05-04 来源:飞速影视
先讲一些 网络设计过程中的细节。
我们在这次比赛方法的Motivation跟paper中写的稍微有一点出入,因为在写paper的时候补充了一些实验,并对整体架构做了一定的重新梳理。

实录|旷视研究院详解COCO2017人体姿态估计冠军论文(PPT 视频)


我们最初的Motivation是来源于对人怎么去看人体关节点这个问题的思考。在分析的这个问题的时候,我们会发现在人看人的关节点的时候,会下意识地先看人体裸露在外面的关节点。比如说鼻子,从这张图上来看裸露在外面的关节点,它会有相对固定的形状和纹理,所以这类关节点可能是一些Visible easy keypoints,人其实是会更倾向于先去看到这些关节点。但是在初级的阶段,有些关节点是相对难于被识别的,比如被衣服遮挡的关节点。
那么 人是怎么样去看比较难的关节点呢? 人可能会无意识地放大或者利用可见点的上下文信息来推断其他点的信息。有些点是隐藏的,不仅是被衣服遮挡,识别这一类关节点会更难,需要利用更多的上下文信息。
从人理解关节点的过程,我们受到了很大的启发,但是怎么样做才可以把看keypoint这个过程体现在卷积神经网络里呢。我们很难人为定义哪些关节点是可见容易关节点,哪些是被遮挡的关节点,哪些是隐藏的关节点。
为了解决这个问题,我们退而求其次,把人体的关节点,大致分类两类: 简单的部分和难的部分。用不同的方案去解决简单点和难点,先解决容易点,再解决难点。 在解决难关节点部分时,提供更多的上下文信息,更大的可感受野。
Network Design

实录|旷视研究院详解COCO2017人体姿态估计冠军论文(PPT 视频)


相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号