Helix模型:具身智能的新里程碑
在人工智能和机器人技术的交汇点上,Figure AI以其最新发布的Helix模型,为人形机器人领域带来了革命性的突破。Helix模型是全球首个视觉-语言-动作(VLA)一体化模型,专为高频率、连续控制的人形机器人设计,标志着具身智能技术的新纪元。
技术特点:多机器人协作与高频控制
Helix模型的最大亮点在于其能够支持多机器人协作,通过自然语言指令完成复杂任务。例如,在官方演示中,两台Helix驱动的机器人能够协同完成厨房杂货的分类与收纳,无需任何预编程或物体特定训练。此外,Helix模型实现了全身协调控制,涵盖头部、躯干、手腕及单个手指的35个自由度,控制频率高达200Hz,确保了动作的精确性和实时性。
技术突破:双系统架构与端到端学习
Helix模型的技术突破源于其独特的“系统1+系统2”双模块架构设计。系统1(S1)是一个8000万参数的视觉运动Transformer,负责实时控制,以200Hz的高频输出精确的连续动作控制信号。系统2(S2)则是一个70亿参数的视觉语言模型(VLM),负责场景理解与语义解析,以7-9Hz的频率更新任务目标。通过解耦架构和高效协同,Helix模型平衡了通用性与实时性矛盾,同时解决了传统机器人学习中的数据效率与泛化难题。
商业化部署:低功耗与本地化运行
Helix模型已具备在嵌入式低功耗GPU上本地化运行的能力,仅需500小时训练数据(仅为同类模型的5%)。这使得其在家庭服务、仓储物流等场景中具备快速落地的潜力。Figure AI正在计划推进一轮15亿美元的融资,估值飙升至395亿美元,较一年前的26亿美元增长超15倍。
具身智能的未来:寒武纪大爆发
Helix模型的发布,让我们首次看到人形机器人本体之间的多机协同作业。从技术上进行预测,双系统架构未来衍生的分布式机器人系统,有可能会让未来的人形机器人形成自主协作网络,通过动态分配任务并共享经验。配合低数据依赖与本地化部署,Figure AI很有可能会加速人形机器人大规模部署的商业化进程。
根据高盛、ABI Research等机构数据,全球人形机器人市场规模预计从2023年的18亿美元增长至2035年的380亿美元,年复合增长率(CAGR)达30%。未来随着Figure AI、特斯拉Optimus、波士顿动力Atlas等产品的竞合,人形机器人或将迎来属于它的“寒武纪大爆发”时代。
通过Helix模型,Figure AI不仅在技术上实现了具身智能的突破,更在商业化部署上展现了巨大潜力,预示着人形机器人领域的“寒武纪大爆发”。