具身智能:通向人类智慧的未来之路(4)
2024-09-26 来源:飞速影视
此外,VLN的拓展视觉对话导航,旨在训练AI与人类进行持续的自然语言对话,以辅助导航。在这个领域,研究者们使用了一种跨模态记忆网络(CMN),该网络分别拥有语言和视觉记忆模块,用于记忆和理解与过往导航动作相关的信息,并利用这些信息来作出导航决策。
实时性
实时性是具身智能另一个核心特性,它使得智能系统能够在真实世界中及时学习并迅速反馈。具备实时性的具身智能能够在接收到新信息或遇到新环境时立即做出响应。与此相比,传统的人工智能依赖于预训练的数据,在面对实时变化的环境时难以快速反应。
以电视节目为例,观看录播的魔术表演就像是与传统AI的互动:虽然内容精彩,但你只能被动地观看预先录制的内容,不能实时中断或更改节目内容。相比之下,观看现场直播的魔术秀则更类似于与具身智能的交互:你可以实时提出需求,魔术师则根据这些需求在现场即兴表演,就好像在为你个人定制节目一样,你不再是一个被动的观众,而是整个魔术秀的一部分。这种互动方式不仅更加个性化,也更具参与感。
故而,和现场表演的魔术师一样,具身智能能够即时响应人类的需求和环境变化,提供更为贴合实际情况的解决方案,并以更贴近于人际交往的方式与人类互动。这种实时性帮助它更好地融入人类的日常生活,成为一个更加智能和有用的伴侣,而不仅仅是一个执行预设任务的机器。
在论文LLM-Planner: Few-Shot Grounded Planning for Embodied Agents with Large Language Models中,研究团队提出了LLM-Planner方法。这种方法利用大型语言模型的能力,能为具身智能进行少样本规划,并通过物理基础来增强语言模型,从而生成和更新与当前环境相关的计划。其优势在于它能够实时反映和适应环境的变化,为具身智能的决策提供即时的信息和指导。
情境性
除主动与实时之外,具身智能对特定的场景和情境的反馈应该有深入的感知和个性化的理解。
就像人类在与周围环境互动中实时调整自己的行为一样,具身智能应该通过实时学习和反馈,深刻地理解所处的情境,并据此调整其行为。它能够根据上下文和环境的变化灵活地调整回应方式,融入当前的情境中,从而实现更自然和有效的交流。例如,具身智能能够感知用户的情绪变化,并据此提供个性化的体验,增强用户的参与感和满意度。
本站仅为学习交流之用,所有视频和图片均来自互联网收集而来,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,也不参与录制、上传
若本站收录的节目无意侵犯了贵司版权,请发邮件(我们会在3个工作日内删除侵权内容,谢谢。)
www.fs94.org-飞速影视 粤ICP备74369512号