互联网资讯

文心大模型5.1正式发布：显著降低成本并提升竞争力

2026年5月9日 ·

5月9日，文心大模型5.1在原基础上进行了显著优化，降低了预训练成本与模型规模。总参数量降至约三分之一，激活参数量降至约一半，同时维持同等水平的基础效果，预训练成本仅为同级别同行模型的6%，进一步增强了市场竞争力。

用户可在相关官方网站体验文心5.1 的对话功能；开发者则可通过千帆大模型平台，将 Model_name 调整为 eRnie-5.1，以获取相应的 API 服务。

此外，5.1 将逐步在多家创意生产智能平台上线，包括 ISEK AI ZERO、Mulan AI、谛听幻流和 Story Master 等，旨在为创作者及用户提供更多尝试机会。

多项权威评测表现优异

在发布日的 ARena Search 排行榜中，文心大模型5.1 获得 123 分，全球排名第4，在中国模型中排名第一。

在多项行业基准测试中，5.1 在智能体能力、知识、推理与深度搜索等维度均展现出色表现。

在 τ³-bench 和 SpreadsheetBench-Verified 智能体评估中，5.1 的表现接近领先的闭源模型；在 Search Arena 排行榜中同样展现出卓越能力。

在知识与创意写作方面，5.1 在 GPQA 与 MMLU-Pro 等评估中接近领先的闭源模型；内部评估中，创意写作能力与 Gemini 3.1 Pro 相当。

在推理能力方面，5.1 的表现接近领先的闭源模型；在具挑战性的 AIME26（带工具）测试中，得分 99.6，仅次于 Gemini 3.1 Pro。

成本显著降低，性能保持领先

基于文心5.0 的基础，5.1 通过多维弹性子模型矩阵提取最优子网络架构，继承现有知识与能力，同时显著降低预训练成本。

研发团队提出了“一次训练，处处部署”（Once-FoR-All）弹性训练框架。不同规模模型在传统方法需分别预训练，而通过动态采样机制，5.0 已在单次预训练中联合优化多种深度、专家容量与路径的稀疏子模型，构建覆盖不同参数规模与计算预算的子模型矩阵。

该框架实现了三维弹性压缩与扩展：

弹性深度：训练期间根据激活的 TransfoR 层数，让不同深度的子模型共享权重，自适应学习深浅层表示的平衡。

弹性宽度/专家容量：通过调整参与路径的专家数量，灵活控制 MoE 层的有效专家容量；通过动态采样专家子集，在不同配置下实现高效运行。

弹性稀疏度：采用可变 Top-k 路由，灵活调整激活专家数量。激活较少的专家可降低推理成本，活跃更多专家则提升模型能力，从而实现推理开销与性能的动态平衡。

基于上述突破，文心大模型5.1 的总参数量约为文心5.0 的三分之一，激活参数量约为二分之一，预训练计算成本仅为同类模型的6%；与文心5.0 相比，推理成本显著降低，且在同规模模型中保持领先水平。