互联网资讯 · 2024年1月20日

亚马逊云科技与英伟达深化合作

11月29日消息,美国时间28日上午,在2023 Re:Invent大会上,亚马逊云科技首席执行官Adam Selipsky与英伟达CEO黄仁勋共同宣布了双方将扩大战略合作的计划。

此次合作将显著推动各行业生成式AI的发展,具体内容包括:

• 亚马逊云科技成为首个在云端部署多节点NVlink技术的NVIDIA GH200 GRACE Hopper超级芯片的云服务提供商。NVIDIA GH200 NVL32多节点平台利用NVIDIA NVlink与NVSwitch技术连接32个GRACE Hopper超级芯片,形成一个实例。该平台将在Amazon Elastic Compute Cloud(Amazon EC2)实例上可用,并与亚马逊强大的网络(EFA)相连,由先进的虚拟化(Amazon Nitro系统)及超大规模集群(Amazon EC2 UltraClusters)支持,允许客户扩展至数千个GH200超级芯片。

• 英伟达与亚马逊云科技合作推出NVIDIA DGX Cloud,提供NVIDIA AI训练即服务(AI-Training-as-a-Service)。这一服务将是首个配置GH200 NVL32的DGX Cloud,为开发者提供最多的共享内存,能够加速训练含有超过1万亿参数的前沿生成式AI和大型语言模型。

• 双方还将合作推动Project Ceiba,建设全球最快的GPU驱动AI超级计算机。该系统配备GH200 NVL32和Amazon EFA互连技术,专为英伟达研发团队服务,配置16,384颗NVIDIA GH200超级芯片,能够处理65 exaflops的AI计算。这台开创性的超级计算机将推动英伟达在生成式AI领域的创新。

• 亚马逊云科技还将推出三款Amazon EC2实例:P5e实例配置NVIDIA H200 Tensor Core GPU,专为大规模与前沿生成式AI及高性能计算(HPC)工作负载设计;G6与G6e实例分别配置NVIDIA L4 GPU与NVIDIA L40S GPU,适用于AI微调、推理、图形以及视频工作负载等广泛应用。特别是G6e实例,适合于开发3D工作流程、数字孪生及其他基于NVIDIA Omniverse的生成式AI 3D应用。