互联网资讯

国产底座完成 GLM-5.2 Day-0 适配 长程任务实现进展

2026年6月18日 ·
openmagic ad

本次报道聚焦最新一代 GLM-5.2 模型在国产硬件底座上的 Day-0 级适配进展,以及对长程任务处理能力的初步验证。通过对高带宽内存与持续推理能力的结合,相关团队展示了在多端场景中的应用潜力,为国内开发者在无需外部依赖的条件下进行深度学习任务部署提供参考与启发。

GLM-5.2(M 系列)作为面向长文本推理与代码处理的强大模型,在国产底座上的适配旨在提升整体吞吐与稳定性。通过对核心算子的专项调优、索引结构的优化,以及对内存调度和并行执行策略的改进,已经实现了对长文本上下文的高效处理。关键在于高带宽与内存管理能力的协同优化,以及对长序列推理的专门指令集优化,以在有限算力资源下达到更高的稳定性。

本次适配的核心亮点在于对核心内核的无损升级与对大模型的对齐,确保在国产算力平台上实现与国际同类水平相近的推理性能和应用覆盖能力。通过对多端应用的联合测试,已经在 Web、移动端和小程序等场景完成覆盖,显示出良好的一致性和可扩展性。务实的实现路径为先在小型任务上验证,再扩展到中大型应用,有利于积累可复用经验与工具链。

在长程任务场景中,海光信息与智谱正以“持久算力底座 + 高效推理框架”的思路推进生态建设。通过内存调度与索引分层的联合优化,以及在每四层稀疏注意力之间引入索引器,显著降低单 Token 的 FLOPs,提升大模型在连续推理中的稳定性与效率。这为自主可控的商业应用提供了坚实的物理基础,也为国内开发者在本地体验到接近国际水平的模型性能创造条件。

两家单位将继续推进对 GLM-5.2 的深层优化,围绕长程任务与代码能力场景开展更多实操验证,推动模型在真实软件开发与系统优化中的落地应用。

海光DCU率先完成GLM-5.2 Day-0适配 长程任务国产底座就绪

未来工作重点包括:深入评估在更大规模输入与更复杂任务下的推理稳定性、进一步优化底座对高吞吐需求场景的适配能力,以及扩展到多端协同的开发工具链。

海光DCU率先完成GLM-5.2 Day-0适配 长程任务国产底座就绪

本次进展强调了国产底座在大模型落地中的潜力,强调了对内存带宽、存储管理与高效指令集的综合优化价值。相关方表示,将在后续阶段公开更多性能数据与应用案例,帮助行业参与者理解与复用技术要点。