在4月6日,阿里巴巴的ABot-PhWo成功登顶世界模型评测权威榜单WoRldArena。在短短不到两周的时间里,阿里巴巴的两个新模型连续获得世界级评测的认可。

在四月初,阿里巴巴的HappyHorse也曾位居人工智能模型评测榜单的首位。这次,ABot-PhWo同样超越了GigaWorld、Google Veo等知名模型,登上WorldArena的顶端。
WorldArena是全球模型领域公认的权威评测平台,由清华大学与普林斯顿大学、新加坡国立大学、北京大学、香港大学、上海交通大学以及中国科技大学等八所高校联合开发。其评估体系涵盖16项核心指标和3个真实应用任务,旨在对具身世界模型在感知精度、物理规律理解、三维空间认知以及动作预测能力等方面进行严格测试。
从能力指标来看,ABot-PhWo在物理规律的深度理解和长程动态预测方面表现出色。与大多数模型只能生成短时、静态或装饰性视频片段不同,ABot-PhWo能准确预测物体在复杂交互中的运动轨迹,包括滑动、倾倒、堆叠和流体变化,并保持多步因果逻辑的一致性。
这种“可推理”的生成能力使ABot-PhWo在任务规划、异常预判和自主决策中展现出实际应用价值,超越了仅仅视觉展示的层面。
