世界模型突破:解决具身智能数据短缺问题
在 ICRA 2026 期间,AGIBOT World Challenge 圆满落幕。世界模型赛道由联合团队以0.29的优异表现夺得冠军,击败了来自全球的150支队伍。

本届赛事覆盖推理、操作与世界模型三个方向,吸引了来自27个国家和地区的数百支队伍参与。多所科研机构与高校的团队在世界模型赛道中汇聚,展现出高水平的研究与应用潜力。
此次胜利标志着具身智能领域在数据与仿真方面的持续突破。作为具身智能体系的一部分,相关技术在近期实现了系统级发布,推动数据、模型与应用三层次的协同发展。
该体系聚焦通过数据驱动模型并服务于应用,从而实现对数据耦合设计的促进,解决数据稀缺与仿真鸿沟等挑战,并构建面向通用人工智能的全栈具身技术框架。
在该体系中,核心支撑位于数据层,承担着对整体架构的关键支撑作用。与大规模语言模型相比,具身模型需要的训练数据更为稀缺,传统数据采集成本通常更高,这成为制约进展的主要因素之一。
为应对这一挑战,相关方案通过自主研发的世界模型进行高仿真训练数据的批量合成,从而降低训练成本并弥合Si-to-Real的鸿沟。这一思路被视为全球范围内应对具身智能数据短缺的关键策略,但生成数据的质量要求极高,需具备强抗幻觉性与物理一致性。
比赛重点评估模型在给定初始视觉观测与机器人动作序列后,对物理状态演变的推演精度,并在大量长尾交互场景中考验世界模型在保持视频质量的前提下,是否严格遵循物理规律,确保动作与结果的准确预测。
在多步复杂操作场景中,模型能够维持物体状态与运动结果的一致性,显著降低动作幻觉,并在总榜与核心指标上表现出色,充分体现了数据治理与训练范式的优势。
公开信息显示,在该领域的权威测试中,该体系已达到多项SOTA水平,形成了可直接部署的全栈底座,具备在复杂开放环境中的泛化理解与自主执行能力,推动从算法突破到产品级全自主作业的转变。