实录|旷视研究院详解COCO2017人体姿态估计冠军论文(PPT 视频)(8)
2023-05-04 来源:飞速影视
后面是说我们自己的minival数据集。minival数据集上是74.5,在test dev上是73,test challenge是72.1。
这是一个图片的结果的展示。从结果上可以看出视觉效果还不错,下面放一个视频中的人体关节点检测例子。这个视频是基于单帧做预测的结果,没有采用帧间平滑。
总结
两个阶段的网络很重要,不同的阶段识别的keypoints不一样,easy point和hard point分开。
Intermediate supervision很重要。
Large batch,在keypoint上也是有用的。
一则招人硬广: 希望加入旷视科技一起登上CV巅峰的同学可以投简历至:,长期招聘算法实习生。实习优秀者,更有直接跳过面试阶段,入职megvii研究院的机会。
Q&A
在视频中进行Keypoint检测怎么加入tracking?能否用keypoint检测做行人检测和行人多目标跟踪?
我们现在也在做tracking,具体一些细节现在还不能透露,因为后面也会准备一个paper。能否用keypoint检测做行人检测和行人多目标跟踪这个的话,其实在做行人检测上,可以用keypoint的检测结果做post filter滤掉行人检测的FP。Bottom Up的方法可以用紧框去做行人检测,最好与现有检测框架共同去检测行人,行人多目标跟踪的话,现在有很多方法是用人体关节点作为特征来比对跟踪目标,keypoint的作用主要在用于提供特征。
Softnms阈值是怎么确定的?
我们是用默认的阈值,因为我们这一块主要focus在keypoint上,detection大概也是只是用了一下,没有去更多的去挖掘。
请问判断easy point和hard point的依据是什么?
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号