Yann LeCun团队提出分层规划方法,提升JEPA世界模型长时域推理能力

robot
摘要生成中

ME News 消息,4 月 8 日(UTC+8),近日,Yann LeCun团队提出了一种基于多时间尺度潜在世界模型的分层规划方法,旨在解决学习型世界模型在长时域控制中面临的预测误差累积和搜索空间指数级增长两大挑战。该方法通过在不同时间尺度上学习潜在世界模型,并执行跨尺度的分层规划,实现了长时域推理,同时显著降低了推理时的规划复杂度。该框架可作为插件式抽象模块,适用于多种潜在世界模型架构和领域。实验表明,在真实世界非贪婪机器人任务(如抓放)中,仅给定最终目标,分层规划实现了70%的成功率,而单层世界模型的成功率为0%。在基于物理的模拟环境(如推动操作和迷宫导航)中,分层规划在取得更高成功率的同时,所需的规划时间计算量减少了多达3倍。该方法不依赖任务特定奖励或外部提供的子目标,展现了在未见环境和任务上的强大泛化能力。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论