具身智能:通向人类智慧的未来之路(3)

2024-09-26 来源:飞速影视
在Metin Sitti 2021年的论文Physical intelligence as a new paradigm中,他指出,在具身的物理智能层面上,柔性系统可以对环境刺激做出响应……然后根据身体部位与环境条件的自我定位、自我运动和自我感知(本体感觉)得出自我定位,并将其转化为后续行动。这意味着具身智能不仅能感知环境,还能根据感知进行自主的行动。另一篇论文Embodied Intelligence in Physical, Social and Technological Environments同样采用相似的方法定义具身智能:当一个生命在各种感官信息的基础上,自主地对环境采取行动,在这样做的过程中,能够将自己作为一个多感官的积极主动的自我,从而与环境中正在发生的事情区分开来,并加以调节时,它就拥有了具身智能。
这种主动性可以通过一个简单的比喻来理解:当你走进图书馆,遇到一个传统的管理员时,他或许会根据你的请求给到你想要的答案,如一个书名及对应位置。但如果这位管理员是一个具备具身智能的导览顾问,它不仅能够找到你需要的信息,还会主动引导你,找到书籍,并给你讲解相关知识,带你深入了解整个知识的世界。
这种交互方式类似于与一个热情、友好的伙伴一起探索知识,而不仅仅是从一个冷漠的知识助手那里得到答案。具身智能通过主动性,提供了一种全新的交互体验,这不仅能够增强人类对信息的获取和理解,还能加深人类与智能系统之间的情感和认知联系。
尽管目前的具身智能还未完全实现主动性和热情互动,但以视觉导航的快速发展为例,在如iGibson Sim2Real、Habitat和RoboTHOR等挑战赛中,我们已经见证了这一领域初步形态的涌现,这些成果已经超越了仅仅执行任务的冷漠机器。例如,结合人类先验知识的导航系统能够通过将这些知识以多模态输入形式融入到深度强化学习框架中,如知识图谱或音频输入,进而使AI能够在未知环境中学习导航并寻找未见过的物体。
最新的视觉语言导航(VLN)技术致力于创建一种能够通过自然语言与人类交流,并在真实3D环境中自主导航的具身智能。目前,该领域已经利用多个数据集进行研究和开发,如REVERIE、R2R、CVDN、GELA、ALFRED、Talk2Nav、Touchdown等,同时也产生了一些创新的网络架构,如辅助推理导航框架。这些技术应用于机器导航、辅助技术和虚拟助手等领域,尚处于初级阶段。
相关影视
合作伙伴
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)

www.fs94.org-飞速影视 粤ICP备74369512号