格灵深瞳官宣「深瞳阿瞳目」,开创智慧体育新范式(6)
2023-07-07 来源:飞速影视
分析体育动作姿势,一般有两种方法。一种是 2D 姿态估计的检测和分析,主要基于RGB 图像中人体关节的 X、Y 坐标。
格灵深瞳采用了 3D 姿势估计,检测和分析的是 X、Y、Z 坐标,因为带有深度信息,可以显著提高体育运动中的人体姿势识别精度,包括识别与正确动作非常相似的假跳或单腿跳等。
不过,从单目视角下的 2D 映射到 3D 存在一个比较大的挑战:3D 世界中不同形状的物体可以在 2D 世界中拥有一模一样的投影,也就说,2D 骨架可以对应多个 3D 骨架,给准确获取 3D 人体关键点造成不小挑战。
格灵深瞳自研了一种 3D 人体姿态估计算法,基于单目相机的 3D 重构技术,再结合动作模型库及人体运动功能学的特点,优化了使用单目相机获取三维人体关键点的效果,使得运动姿态分析算法在三维人体上做出更为精准的判断,还能有效避免因遮挡产生的误报。
「除了计算机视觉手段,我们也跟一些体育高等院校、体育专业老师合作,在数学、运动生物力学方法上做了很多研究,帮助更好地还原人体动作。」夏鹏飞说。
事实上,几年前他们已开始为国家竞技队提供实时姿态捕捉与数据分析支持,积累了较为丰富的人体行为数据及相关项目经验。
除了 3D 姿态和动作识别技术,在更靠近前端的采集环节,格灵深瞳独有的多目传感器标定与深度估计技术也对识别精度的提升,功不可没。
通过一对成本更低的可见光相机组成的双目系统,对场景深度信息进行估算,在达到普通结构光相机精度的同时,还能提高相机的可靠性和易用性,覆盖更多结构光相机无法工作的光线条件和场景。
解决方案结构图
解决识别精度带来的挑战之后,接踵而来的是需要给算法运作创造一个稳定的工作环境。然而,现实情况往往是一到大课间或者体育课,很多班级一起涌现,给人体检测、目标跟踪带来困难,影响算法能力正常发挥。
不过,凭借过去十多年的业务积累,格灵深瞳业务团队通过成熟项目应用磨练出一些核心素质,包括人体跟踪、ReID 等,他们成功地解决了这一挑战。比如「多精度目标检测与跟踪」,在安防场景下,目标被遮挡、消失又再度出现很常见,格灵深瞳的系统早就可以做到一直跟踪目标,直到「失踪」的人再次出现。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号