互联网资讯

DeepSeek-V4 模型适配进展

2026年5月7日 ·

在 4 月 25 日，相关公司宣布 Blackwell 平台已成功适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型。开发者可通过微服务下载与部署，或借助 SG Lang 与 vLLM 框架实现个性化推理。

DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，适用于高水平推理任务；DeepSeek-V4-Flash 拥有 284B 总参数量与 13B 激活参数，聚焦高效场景应用。

两款模型均支持 100 万 Token 的上下文窗口以及最高 38.4 万 Token 的输出长度，适用于长文本编码和文档分析等核心应用，并遵循 MIT 开源协议。

实测显示，DeepSeek-V4-Pro 在 GB200 NVL72 环境下开箱即用，性能超过 150 Token/s/User。开发者可借助 vLLM 的 day 0 配方，在 Blackwell B300 上快速部署。随着 DynaMo、NVFP4 与 CUDA 内核的持续优化，预计性能将进一步提升。

在生态部署方面，开发者可通过微服务进行下载与部署，或结合 SG Lang 与 vLLM 框架实现个性化推理。SGLang 提供低延迟、均衡与最大吞吐量三种配方，vLLM 则支持多节点扩展至百余 GPUs，具备工具调用和推测解码能力。