互联网资讯

全新服务器系列面向 AI、HPC 与云工作负载

2024年4月7日 · admin

全球服务器解决方案提供商宣布推出搭载第三代 Intel Xeon 可扩展处理器、集成 AI 加速器以及英特尔深度学习相关技术的新一代服务器系统，形成面向企业级 AI、HPC、存储与云场景的高密度部署方案（SuprMicRo X12 系列的定位）。

新系列旨在满足低延迟与高应用性能需求的 AI 应用场景。2U 型号提供 4-GPU 的 NVIDIA HGX A100 配置，适合大规模分布式训练集群，内部实现 CPU-GPU、以及 GPU-GPU 互连的高效协同。另一款 2U 2 节点系统通过共享电源与冷却风扇来降低能耗与运维成本，并可依据 workload 需求选配多种 GPU 加速器。这两款系统均内置基于英特尔软件保护扩展（Intel SGX）的高级安全特性。

公司高层表示，新的设计在成本、空间和能耗方面优于部分同类产品，能够为 AI、HPC 工作负载提供支持，其中可部署 4 枚 NVIDIA HGX A100（代号 Redstone）的 2U 高密度 GPU 服务器，以及以独特共享资源方案降低营运成本的 2U 2 节点系统。此外，新系统基于第三代 Intel Xeon 可扩展处理器，支持 Intel Deep Learning Boost，针对分析、训练与推理任务进行优化。该平台可搭载多达 4 枚 A100 GPU，通过 NVIDIA NVLink 完全互连，理论 AI 性能可达数十亿级别的计算能力，且 GPU 内存高达数百 GB，显著提升企业数据科学与 AI 领域的算力。对于如大型对话式模型的推理任务，较上一代产品有显著提升，同时在训练性也实现显著增长。

此外，系统在散热与冷却方面采用高级设计，适合关注节点密度与电源效率的高性能集群。对需要进一步降低运营成本的场景，亦可选装液冷方案。平台还可支持 Intel Optane 持久内存，将大模型在进入 GPU 处理前就近存储于内存中，以提升数据吞吐。对于多系统协作的应用，还可配备 4 张 NVIDIA ConnectX-6 200 Gb/s 的 InfiniBand 网卡，实现 1:1 GPU-DPU 的半径下 RDMA 通信。

新款 2U 2 节点采用节能架构设计，每个节点可扩展至最多 3 张双宽度 GPU。每个节点都搭载具备多达 40 颗核心、内建 AI 与 HPC 加速器的第三代 Xeon 可扩展处理器，覆盖广泛的 AI、渲染、VDI 应用场景，受益于 CPU-GPU 平衡设计。系统内置高级 I/O 模块扩展插槽（AIOM），提供快速且灵活的网络连接，在大规模数据流与深度学习任务中确保持续吞吐。该平台还是多工作负载云游戏与其他计算密集型 VD I 场景的理想选择，并支持虚拟内容分发网络（vCDN）以应对日益增长的流媒体需求。同时，内置备用电源可在单节点故障时由相邻节点供电，提升系统可用性。