互联网资讯

全新服务器系列面向 AI、HPC 与云工作负载

2024年4月7日 · admin
openmagic ad

全球服务器解决方案提供商宣布推出搭载第三代 Intel Xeon 可扩展处理器、集成 AI 加速器以及英特尔深度学习相关技术的新一代服务器系统,形成面向企业级 AI、HPC、存储与云场景的高密度部署方案(SuprMicRo X12 系列的定位)。

新系列旨在满足低延迟与高应用性能需求的 AI 应用场景。2U 型号提供 4-GPU 的 NVIDIA HGX A100 配置,适合大规模分布式训练集群,内部实现 CPU-GPU、以及 GPU-GPU 互连的高效协同。另一款 2U 2 节点系统通过共享电源与冷却风扇来降低能耗与运维成本,并可依据 workload 需求选配多种 GPU 加速器。这两款系统均内置基于英特尔软件保护扩展(Intel SGX)的高级安全特性。

公司高层表示,新的设计在成本、空间和能耗方面优于部分同类产品,能够为 AI、HPC 工作负载提供支持,其中可部署 4 枚 NVIDIA HGX A100(代号 Redstone)的 2U 高密度 GPU 服务器,以及以独特共享资源方案降低营运成本的 2U 2 节点系统。此外,新系统基于第三代 Intel Xeon 可扩展处理器,支持 Intel Deep Learning Boost,针对分析、训练与推理任务进行优化。该平台可搭载多达 4 枚 A100 GPU,通过 NVIDIA NVLink 完全互连,理论 AI 性能可达数十亿级别的计算能力,且 GPU 内存高达数百 GB,显著提升企业数据科学与 AI 领域的算力。对于如大型对话式模型的推理任务,较上一代产品有显著提升,同时在训练性也实现显著增长。

此外,系统在散热与冷却方面采用高级设计,适合关注节点密度与电源效率的高性能集群。对需要进一步降低运营成本的场景,亦可选装液冷方案。平台还可支持 Intel Optane 持久内存,将大模型在进入 GPU 处理前就近存储于内存中,以提升数据吞吐。对于多系统协作的应用,还可配备 4 张 NVIDIA ConnectX-6 200 Gb/s 的 InfiniBand 网卡,实现 1:1 GPU-DPU 的半径下 RDMA 通信。

新款 2U 2 节点采用节能架构设计,每个节点可扩展至最多 3 张双宽度 GPU。每个节点都搭载具备多达 40 颗核心、内建 AI 与 HPC 加速器的第三代 Xeon 可扩展处理器,覆盖广泛的 AI、渲染、VDI 应用场景,受益于 CPU-GPU 平衡设计。系统内置高级 I/O 模块扩展插槽(AIOM),提供快速且灵活的网络连接,在大规模数据流与深度学习任务中确保持续吞吐。该平台还是多工作负载云游戏与其他计算密集型 VD I 场景的理想选择,并支持虚拟内容分发网络(vCDN)以应对日益增长的流媒体需求。同时,内置备用电源可在单节点故障时由相邻节点供电,提升系统可用性。