OK-Robot 是一个由 Meta 和纽约大学合作开发的开源机器人框架,专注于零样本、基于语言的拾取和放置任务,特别适用于真实家庭环境。它利用视觉语言模型(VLM)进行物体检测,结合导航和抓取模块,无需预训练即可执行任务。项目在10个真实家庭环境中测试,成功率达到58.5%,在整洁环境中可提升至82%。