互联网资讯

群核开源上市，世界模型迎来新机遇了吗？

2026年4月22日 ·

接连演三场重磅戏码。

10月16日至17日，阿里云发布世界模型HAYO，腾讯同日开源混元3D模型2.0，而群核则于次日登陆港交所。这或许并非巧合，他们正在释放一个信号：世界模型赛道正从技术探索迈向商业化临界点。

当Google DeepMind在2025年8月发布Genie 3时，行业还在讨论“什么是世界模型”；现在，中国厂商已行动给出答案：这是一场关乎AI未来十年走向的基础设施之争。

截至2026年4月，全球已有至少12家主要玩家布局世界模型/模拟器赛道，包括Google、OpenAI、Meta、NVIDIA等巨头，以及群核科技、Runway等垂直领域企业。群核科技在香港上市首日涨144%，市值超300亿港元，显示出市场热情，与阿里、腾讯的战略级投入呼应。

一个关键问题浮出水面：世界模型会不会成为继ChatGPT之后的下一个现象级突破？

48小时三大事件：

从技术发布到资本验证

2026年4月16日，阿里云ATH正式发布世界模型HAYO。该款产品被定位为“世界模拟器”，其核心功能包括漫游模式和导演模式。

HAYO采用原生多模态+长时序建模技术，与谷歌Genie 3同属“生成式视频派”，但在交互时实现突破。阿里云在2026年3月财报会上宣布“五年内云+AI收入超1000亿美金”的目标仅过去不到一个月。

财报数据显示，阿里云2026年Q3收入同比增长36%。HAYO的发布，既是技术实力的展示，更是阿里AI战略从“大模型军备赛”转向“世界模型基础设施”的关键落子。

同样在4月16日，腾讯混元团队宣布开源Hunyuan3D 2.0（HY-World 2.0）。与阿里的闭源策略不同，腾讯选择将这款3D模型完全开源，并支持与Unity等游戏平台无缝对接。

HY-World 2.0的核心差异化在于“可导出性”——生成的3D资产文件可直接用于二次编辑。这一设计直指游戏、影视预演等B端场景的工程化需求。

群核科技则更进一步，推出SpatialL、SpatialGen等语言模型，并开放Aholo空间智能开放平台。优势在于可直接用于游戏、机器人仿真，工程化落地最快。

劣势在于实时交互性受限，计算复杂度高，难以实现超长时序推演。

基于技术指标、产品成熟度、商业化进展三个维度，全球主要玩家可划分为三个梯队。

第一梯队（产品化领先）包括Google Genie 3、阿里HAYO、腾讯HY-World 2.0，具有实时交互能力，且有清晰的场景定位。群核科技是唯一实现盈利的空间智能企业，2025年营收8.2亿元，毛利率8.2%。

第二梯队（技术独特但场景有限）包括Meta V-JEPA 2、Tesla FSD、NVIDIA Omniverse，技术路线独特但聚焦特定垂直场景。

第三梯队（早期探索）包括百度文心、字节豆包、Runway GW-1、斯坦福World Labs、OpenAI Sora，仍在技术验证阶段。

中美博弈与商业化突围：

在全球世界模型竞赛中，中美两国呈现明显的差异化优势。美国的优势在于基础研究、算力和数据资源。NVIDIA GPU和谷歌TPU的算力垄断，构建了美国玩家的天然护城河。

中国的优势则体现在工程化能力、应用场景和资本化进程。阿里、腾讯能够在Google Genie 3发布八个月后迅速推出对标产品，体现了强大的工程优化能力。群核科技的上市，标志着中国在空间智能赛道率先完成资本化布局。

但底层架构创新目前仍由美国主导，中国厂商更多是快速跟进和工程优化。HAYO与Genie 3同属“生成式视频派”，HY-World 2.0的技术路线也与World Labs Marble高度相似。跟随式创新能否在长周期竞争中胜出，仍需时间验证。

尽管技术层面百花齐放，但世界模型的商业化之路仍面临多重挑战。首要问题是推理成本。实时交互意味着更高的算力消耗，Genie 3和HAYO均支持每秒24帧生成，但背后的GPU成本如何消化？

群核科技提供了一个可行样本。公司聚焦家装设计等垂直场景，通过SaaS+API服务模式实现盈利。2025年8.2亿营收、8.2%毛利率、57万元净利润的数据，证明空间智能在特定场景下具备商业可行性。但这一模式能否扩展至通用世界模型，仍是未知数。

另一个关键变量是开源与闭源的战略选择。Meta V-JEPA 2、腾讯HY-World 2.0选择开源，意在建立生态标准；Google Genie 3、阿里HAYO选择闭源，意在保护核心技术。

短期内，闭源有助于保护投资回报；长期来看，开源可能凭借生态优势实现超越。此外，地缘政治风险也不容忽视。高端GPU出口管制对中国厂商的影响，数据跨境流动限制，都可能成为世界模型全球化发展的阻碍。

对于中国厂商而言，如何在有限的算力资源下优化模型效率，如何利用本土数据优势构建差异化壁垒，将是未来竞争的关键。

三种情景与终极逻辑：

回到最初的问题：世界模型会不会是继ChatGPT之后的下一个现象级突破？基于当前技术进展和产业动态，对世界模型的未来发展做出三种情景化推演。

乐观情景（概率30%）：2028年出现杀手级应用。假设技术瓶颈在2-3年内突破，长时序一致性和物理精准度达到实用水平。某个垂直场景率先爆发，出现千万级用户的killer app。头部玩家确立行业地位，世界模型成为AI基础设施。

中性情景（概率50%）：场景分化，长短期共存。技术路线收敛至2-3种主流方案，但不同流派服务不同场景。10+玩家淘汰至3-5家，但无明显赢家。世界模型成为AI工具箱的重要组件，而非替代LLM的下一代基础模型。

悲观情景（概率20%）：泡沫破裂，回归理性。技术瓶颈长期无法突破，商业化进展缓慢。大部分玩家因资金压力退场，仅剩Google、Meta等巨头维持研发。“世界模型”概念被证伪或重新定义，行业回归到更务实的组合方案。

透过48小时三大事件的喧嚣，观察到一个深层趋势：世界模型的终极竞争不是技术竞争，而是生态竞争。

Google凭借技术积累和算力垄断，构建的是“技术+算力”双壁垒；阿里依托阿里云和企业客户资源，走的是“云+模型”一体化路径；腾讯通过开源策略，意在吸引开发者；群核科技则用数据积累和盈利验证，卡位空间智能基础设施。

每一种策略都有其合理性，但最终胜出的，必定是能够构建最完整生态的那一家。这不仅需要技术领先，更需要场景落地、开发者支持、资本助力、政策友好的多维协同。

对于中国厂商而言，短期内的工程优化可以快速缩小差距，但长期来看，必须在底层架构创新上有所突破。否则，即便赢得某一轮产品竞赛，也难以在AGI时代的生态格局中占据主导地位。

2026年4月的这48小时，或许会被后世视为AI发展的一个关键节点。阿里、腾讯、群核的集体行动，标志着世界模型从“实验室玩具”迈向“产业基础设施”。但真正的ChatGPT时刻何时到来，取决于技术突破的速度，更取决于生态建设的深度。

在未来2-3年的窗口期内，我们或将见证第一批标杆案例的出现，也可能目睹部分玩家的退场。唯一确定的是：谁掌控了空间，谁就能掌控物理AI的未来。而这一次，中国企业已经抢先站在了赛道最前方。