@slsdliu
slsd_liu 暂无简介
PiTe模型所具备的强大视频理解能力为后续具身智能的视觉感知工作提供了基础,其蕴含的物体移动轨迹信息也为设计新颖的视觉语言动作模型提供了新思路。
三维占据预测能够全面描述周围场景,已成为三维感知领域的关键任务。现有方法大多局限于单视角或有限视角的离线感知,无法满足具身智能体通过渐进式探索逐步感知场景的需求。本文针对这一实际应用场景,提出具身三维占据预测任务,并开发基于高斯分布的EmbodiedOcc框架来实现该目标。我们使用均匀的三维语义高斯分布初始化全局场景,并通过具身智能体逐步更新观测到的局部区域。
具身智能机器人入门学习路线
机器人具身智能框架
一个轻量化的开源具身智能全栈道场机器人项目