4日,KiMi K2.6模型已正式发布并开源,涵盖了代码、长程任务执行及Agent能力等多个方面的全面提升。
目前,KiMi K2.6已上线,提供全新的应用、API和KiMi编程助手。
在多项权威基准测试中,KiMi K2.6表现非常优异。
无论是高难度的类人类考试,还是针对真实软件工程能力的SWE-Bench,均达到了行业领先的水平,表现与GPT-5.4、Claude OpUS 4.6和Gemini 3.1等闭源模型相当或更好。
作为KiMi迄今为止最强大的代码模型,KiMi K2.6在长程编码能力上有了显著提升。
测试显示,其可持续编码长达13小时,编写或修改超过4000行代码,完成复杂系统的开发与优化。
此外,通过将代码与视觉能力深度融合,KiMi K2.6能够交付具有设计创意的专业级Web应用。
在内部代码评测中,K2.6的成绩较前一代K2.5提升了约20%。
其泛化能力同样值得关注。
实测结果表明,KiMi K2.6可在本地部署,并通过Zig语言优化推理流程,使推理效率比M Studio快约20%。
在Agent能力方面,KiMi K2.6支持多个Agent协同工作,能够调度不同长度的Agent组合以完成复杂任务,整体任务质量显著提高。
同时,其Agent集群架构也进行了升级,最多可支持300个子Agent并行运行,执行约4000个协作步骤,实现从文档到网页、再到PPT和表格的多产物端到端交付。
