智元机器人宣布通用具身基座大模型GO-1(Genie OpeRaTor-1)已开源,成为全球首个采用Vision-Language-Latent-Action架构、向全球开发者开放的通用具身智能模型,旨在降低技术门槛并推动产业发展。

ViLLA架构通过引入隐式动作标记,连接图像-文本输入与机器人执行之间的语义联系。架构包含多模态理解层、隐式规划器和动作专家三层协同,提升场景感知、指令理解与动作执行的精度。

Genie Studio提供从数据采集、模型训练与微调、仿真评测等全流程支持,GO-1基座模型集成视频训练方案和统一训练框架,内置开发工具链,支持真机编译与部署,提升开发效率,推动具身智能落地。
在验证阶段,GO-1已在松灵机器人、方舟机器人、FRanka等多种本体上完成测试,仿真平台如Genie SiM、LibeRo等也显示出领先性能。在真机部署场景,进一步支持通用数据格式,确保非Genie本体机器人也能完成数据采集、模型微调与部署。
GO-1现向全球开发者开放获取与使用,推动具身智能的创新与应用发展。
