Helix模型的诞生与技术突破
2024年2月21日,美国机器人初创公司Figure AI正式发布了Helix通用具身智能模型,这是全球首个能够对整个人形机器人上半身进行高频率、连续控制的视觉-语言-动作(VLA)模型。Helix模型的发布标志着人形机器人技术的一次重大飞跃。
Helix模型的最大特点在于其将视觉感知、自然语言理解与高维机器人动作控制整合到单一模型中,并实现了全身协调控制、零样本泛化能力以及多机器人协作。在官方演示中,两台Helix驱动的机器人通过语音指令协同完成厨房杂货分类与收纳,过程中无需任何预编程或物体特定训练。
核心技术解析
Helix的技术突破源于其独特的“系统1+系统2”双模块架构设计。系统1为高速响应式视觉运动策略,系统2为基于VLM的场景理解与语义解析。通过解耦架构和高效协同,平衡了通用性与实时性矛盾,同时解决传统机器人学习中的数据效率与泛化难题。
-
系统1(S1):实时控制的“快反应”模块,以200Hz的高频输出精确的连续动作控制信号。
-
系统2(S2):语义理解的“慢思考”模块,负责处理自然语言指令与场景理解,以7-9Hz的频率更新任务目标。
商业化部署与市场影响
Helix模型已具备在嵌入式低功耗GPU上本地化运行的能力,仅需500小时训练数据,这使得其在家庭服务、仓储物流等场景中具备快速落地的潜力。Figure AI正在计划推进一轮15亿美元的融资,估值飙升至395亿美元。
Figure的Helix模型展示了其在视觉-语言-动作集成技术上的巨大潜力,不仅为机器人行业带来了新的技术突破,也推动了行业在商业化进程中的快速演进。随着Helix进一步扩展和优化,Figure未来可望在更广泛的应用场景中全面投入使用,该公司在通用机器人的技术探索和商业运营上起到了重要的引领作用。
未来展望
Helix模型的发布,让我们首次看到人形机器人本体之间的多机协同作业。从技术上进行预测,双系统架构未来衍生的分布式机器人系统,有可能会让未来的人形机器人形成自主协作网络,通过动态分配任务并共享经验。配合低数据依赖与本地化部署,Figure AI很有可能会加速人形机器人大规模部署的商业化进程。
根据高盛、ABI Research等机构数据,全球人形机器人市场规模预计从2023年的18亿美元增长至2035年的380亿美元,年复合增长率(CAGR)达30%。未来随着Figure AI、特斯拉Optimus、波士顿动力Atlas等产品的竞合,人形机器人或将迎来属于它的“寒武纪大爆发”时代。
Figure的Helix模型不仅为其自身赢得了市场与技术的双重认可,也为整个机器人行业的未来发展提供了一个重要参考。通过不断推进通用机器人技术和多智能体协作的应用,Figure展示了其创新和扩展人工智能在实际生活中的潜力,为消费者和企业带来了无限可能。未来的机器人市场将更加充满活力与机会,而Figure无疑将在其中扮演一个日益重要的角色。