互联网资讯

文心大模型5.1正式发布:显著降低成本并提升竞争力

2026年5月9日 ·
openmagic ad

5月9日,文心大模型5.1在原基础上进行了显著优化,降低了预训练成本与模型规模。总参数量降至约三分之一,激活参数量降至约一半,同时维持同等水平的基础效果,预训练成本仅为同级别同行模型的6%,进一步增强了市场竞争力。

百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%

用户可在相关官方网站体验文心5.1 的对话功能;开发者则可通过千帆大模型平台,将 Model_name 调整为 eRnie-5.1,以获取相应的 API 服务。

此外,5.1 将逐步在多家创意生产智能平台上线,包括 ISEK AI ZERO、Mulan AI、谛听幻流和 Story Master 等,旨在为创作者及用户提供更多尝试机会。

多项权威评测表现优异

在发布日的 ARena Search 排行榜中,文心大模型5.1 获得 123 分,全球排名第4,在中国模型中排名第一。

百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%

在多项行业基准测试中,5.1 在智能体能力、知识、推理与深度搜索等维度均展现出色表现。

百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%

在 τ³-bench 和 SpreadsheetBench-Verified 智能体评估中,5.1 的表现接近领先的闭源模型;在 Search Arena 排行榜中同样展现出卓越能力。

在知识与创意写作方面,5.1 在 GPQA 与 MMLU-Pro 等评估中接近领先的闭源模型;内部评估中,创意写作能力与 Gemini 3.1 Pro 相当。

在推理能力方面,5.1 的表现接近领先的闭源模型;在具挑战性的 AIME26(带工具)测试中,得分 99.6,仅次于 Gemini 3.1 Pro。

成本显著降低,性能保持领先

基于文心5.0 的基础,5.1 通过多维弹性子模型矩阵提取最优子网络架构,继承现有知识与能力,同时显著降低预训练成本。

研发团队提出了“一次训练,处处部署”(Once-FoR-All)弹性训练框架。不同规模模型在传统方法需分别预训练,而通过动态采样机制,5.0 已在单次预训练中联合优化多种深度、专家容量与路径的稀疏子模型,构建覆盖不同参数规模与计算预算的子模型矩阵。

该框架实现了三维弹性压缩与扩展:

弹性深度:训练期间根据激活的 TransfoR 层数,让不同深度的子模型共享权重,自适应学习深浅层表示的平衡。

弹性宽度/专家容量:通过调整参与路径的专家数量,灵活控制 MoE 层的有效专家容量;通过动态采样专家子集,在不同配置下实现高效运行。

弹性稀疏度:采用可变 Top-k 路由,灵活调整激活专家数量。激活较少的专家可降低推理成本,活跃更多专家则提升模型能力,从而实现推理开销与性能的动态平衡。

百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%

基于上述突破,文心大模型5.1 的总参数量约为文心5.0 的三分之一,激活参数量约为二分之一,预训练计算成本仅为同类模型的6%;与文心5.0 相比,推理成本显著降低,且在同规模模型中保持领先水平。