4月9日,美国举行的产业创新大会披露了面向企业的全栈生成式AI解决方案,宣布全新的一代至强处理器品牌及 Gaudi 3 加速器,并展示了面向大规模部署的开放系统、下一代产品及多项战略合作,致力于加速生成式 AI 的落地。调研机构的结果显示,2023年仅少数企业实现生成式AI项目落地产品化,最新方案有望帮助企业克服推广阶段的挑战。

“高新技术正在以前所未有的速度演进,生成式 AI 已成为多行业的共同目标。面向PC、数据中心与边缘计算的整体平台将提供灵活、可定制化的解决方案,帮助客户把握未来机遇。”
企业希望将生成式AI从试验走向应用,需要高性能、经济性与能效兼具的处理方案,尤其是可快速部署的系统。Gaudi 3 加速器在复杂性、成本、数据可靠性与合规性等方面也给出响应。
用于 AI 训练与推理的 Gaudi 3
Gaudi 3 加速器将为大规模 AI 系统提供动力,支持通过以太网实现跨数万个加速器的互连。相比上一代,Gaudi 3 在 BF16 算力方面提升约 4 倍,内存带宽提升约 1.5 倍,为大规模生成式 AI 部署带来显著进步。
在训练方面,Gaudi 3 预计能显著缩短 70 亿与 130 亿参数模型(如 Llama2)的训练时间,并在推理性能与能效方面对 Llama 7B、70B 以及大规模 FALCON 180B 等模型表现出色。
Gaudi 3 提供开放的软件与以太网网络标准,支持企业从单节点扩展到数千节点的集群,覆盖大规模推理、微调与训练场景。该加速器计划于 2024 年第二季度面向原始设备制造商出货。
为客户创造价值的 AI 解决方案
大会对开放、可扩展的 AI 系统进行了总体描述,涵盖硬件、软件、框架与工具。通过开放生态伙伴诸如设备厂商、数据库提供商、系统集成商、开发商等参与,企业能够获得定制化的生成式 AI 方案,同时与信任的生态伙伴协作,提升落地效率。
开放平台与生态共创,推动企业 AI 创新
多家伙伴宣布将联合打造开放平台,结合 RAG(检索增强生成)技术,提升部署便利性、性能与价值。该平台将允许企业在标准云基础设施上整合现有数据源与大语言模型,推动生成式 AI 在企业中的应用。
在初期阶段,基于安全的至强处理器和 Gaudi 方案,将为生成式 AI 流程推出参考实现与技术框架,同时完善开发者云平台的基础设施功能,以支持 RAG 与未来生态系统的发展。鼓励更多伙伴参与开放平台建设,推动企业采用并扩大应用范围。
AI 路线图与开放生态的最新进展
大会还分享了面向企业 AI 各细分领域的下一代产品与服务信息。
新一代至强处理器:为当前生成式 AI 解决方案提供高效支撑,包含面向数据中心、云端与边缘的新处理器品牌更新。新型号将于 2024 年第二季度推出,提供提升的能效与性能;随后的型号将带来更高的 AI 性能。
配备能效核的至强处理器型号:在单位功耗上的性能显著提升,机架密度亦有提升,帮助客户实现可持续发展目标。
配备性能核的至强处理器型号:新增对 MXFP4 数据格式的软件支持,理论上在处理更大规模语言模型时能将延迟进一步降低,且可运行高达 700 亿参数的模型。
客户端、边缘与连接:讨论了客户端产品的发展及边缘、网络互联产品的路线,其中包括面向生产力、安全性和内容创作的新一代产品。同时,预计在 2024 年推出新一代边缘客户端处理器家族,具备高算力与强大 NPU 协同能力,用于下一代 AI 设备。
边缘芯片组合还覆盖面向零售、制造与医疗等关键领域的产品,计划在本季度上市并在年度内获得边缘平台的支持。
通过超以太网联盟推动面向 AI 的开放以太网网络创新,推出一系列针对 AI 优化的以太网解决方案,目标是实现 AI 模型训练与推理方面的大规模纵横向扩展。产品组合包括 AI 网络连接卡、系统级集成方案、基于 Gaudi 的加速器平台,以及面向代工生态的软硬件参考设计。
TibeR 解决方案组合的发布
新推出的 TibeR 解决方案组合旨在简化企业软件与服务的部署流程,覆盖生成式 AI 等场景。统一的体验让客户和开发者更易找到合适的解决方案,从而加速创新并实现价值,同时确保安全、合规与性能。当前即可探索,第三季度将全面覆盖。
整体而言,此次大会强调以开放、可扩展、以人为本的 AI 生态,致力于让 AI 在各行业尽快落地,推动创新并创造显著商业价值。
