GAITC2022智媒专题论坛丨王亦洲:主动跟踪算法研究(4)
2023-06-17 来源:飞速影视
所以不应该简单地说:因为这个方法不是在真实环境中训练的,就否定这个方法的价值,这种结论过于草率。
由于时间有限,下面我简单介绍几个主动跟踪的问题和解决方法。首先我们做了一对一的主动跟踪。它是一个零和博弈,逃跑者目的是要甩开跟踪者。我们提出了一种非对称博弈机制用于主动目标跟踪的学习。也就是,在跟踪器学习跟随目标的同时,让目标同步学习如何摆脱跟踪。在这种竞争机制下,因为跟踪器和目标的能力都是从零开始同步增长的,所以他们在每个训练阶段都能够遇到一个能力相当的对手与之竞争,这就自然得构成了从易到难的课程,使得学习过程更加高效。这个机制是非对称的,因为我们为逃跑者引入了心智模型,让他猜测跟踪者的跟踪策略,从而训练出聪明的逃跑者,最终得到更高明的跟踪者。我们发现一些有趣的智能现象涌现出来,比如逃跑者为了甩开跟踪者,学会了拟态行为。我们把在虚拟环境中训练的跟踪模型非常容易地transfer到真实环境当中,效果也很好。
另一个场景还是一跟一,但是多了干扰者,这个时候就复杂了针对视觉混淆干扰的影响,我们提出了一种多智能体混合博弈机制。该机制下,目标和干扰物组成了一个与跟踪器竞争的合作团队,通过主动制造具有迷惑性的外观和行为使跟踪器学习抗干扰的跟踪策略。为了提高多智能体博弈学习的效率,进一步提出了一系列改进方法,包括面向干扰者的奖赏函数、跨模态师徒学习策略以及用于跟踪器的循环注意力机制等。
在多跟一的模型中,我们主要采用的心理模型是从众心理模型,因为物体走到某些角度时会block相机的view,这时被遮挡相机的动作要根据其他相机的pose决定。针对复杂场景下的单目标多相机跟踪问题,受“羊群效应”启发,提出了一种位姿辅助的多相机合作跟踪系统。该系统中,设计了一种受羊群心态驱动的位姿控制器,可在视觉观测受限情况下通过参考多数相机位姿状态输出与群体一致的动作(都指向同一区域),实现在复杂场景下的高效合作跟踪。
最后一种更具有挑战性的是多跟多的问题,智能体之间相互协调谁跟谁,把任务分进去之后各自完成各自的任务的思路。针对多相机多目标覆盖问题,提出了一种面向目标分配的层次化多智能体协调机制。该协作机制主要分两层,包括了一个集中式协调者和多个分布式执行者。协调者收集各个执行者的观测信息,进行全局规划,为每个执行者分配子目标任务。每个执行者通过采取一系列基本动作实现对指定目标集的覆盖。为提升模型训练效率和泛化能力,采用了一系列改进方法,包括了用自注意力感知模块处理变长输入输出,面向目标分配的边际贡献近似估计,基于子目标的观测过滤器等。谢谢大家。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号