实录|旷视研究院详解COCO2017人体姿态估计冠军论文(PPT 视频)

2023-05-04 来源:飞速影视
主讲人:王志成 | 旷视研究院研究员 屈鑫 整理编辑 量子位 出品 | 公众号 QbitAI
12月13日晚,量子位·吃瓜社联合Face 论文解读系列第二期开讲,本期中旷视(Megvii)研究院解读了近期发表的人体姿态估计论文: Cascaded Pyramid Network for Multi-Person Pose Estimation 。
基于这篇论文所提出的算法,Megvii(Face )队在COCO2017人体姿态估计竞赛上获得了历史最好成绩,相对 2016年人体姿态估计的最好成绩提高了19%。
本期主讲人为旷视研究院研究员王志成,同时也是COCO 2017 Detection竞赛队owner、论文共同一作,在比赛中主要负责整体方案的确定,模型设计、训练调优的工作。
量子位应读者要求,将精彩内容整理如下:
48:20
△ 直播回放视频
本期主要讲的是 人体姿态估计算法 ,主要内容如下:
1 Top-down Pipeline
2 Network Design
A. Motivation: How human locate keypoints?
B. Our Network Architecture
3 Techniques & Experiments
4 Conclusion
下一期将会由黎泽明为大家讲解Light-Head R-CNN,欢迎12月20日晚19:30来观看直播。
Top-down Pipeline

实录|旷视研究院详解COCO2017人体姿态估计冠军论文(PPT 视频)


现在我们做Pose Estimation主要有两种Pipeline,这次比赛使用的是 Top-down Pipeline: 先用detector检测出图象中的人,再把每一个人的图像抠图,抠出来的单人的图过single person Pose Estimation Network(即单人姿态估计网络),最后把所有的单人估计出来的姿态,整合到原图中,得到最终结果。
相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号