互联网资讯

中美竞争AI芯片市场

2024年3月3日 · admin

英伟达率先占领了AI大模型算力芯片市场，市值已超过万亿。与此同时，英特尔、AMD及中国的GPU芯片公司也在竞争中，希望能够在AI算力市场中获得一席之地。

在9月19日于美国圣何塞举行的Intel On技术创新大会上，62岁的英特尔CEO基辛格（Pat Gelsinger）以俯卧撑开场，展现出十足的活力。

基辛格在此次会议上发布了一系列新技术产品，包括基于Intel 4（5nm）工艺的英特尔酷睿UltRa处理器，代号“MeteoR Lake”；预览了第五代至强服务器芯片及其后续产品路线图；并披露了5nm AI芯片Gaudi 3等信息。

此次演讲中，基辛格对AI算力对经济作用的讨论持续近2小时，提到“人工智能”、“深度学习”等相关术语达200次之多。

与此同时，AMD也在同一时间发布了最新的EPYC 8004 CPU，并预计在年底前出货MI300系列AI芯片，以此对抗英伟达。此外，国内的华为、天数智芯等AI芯片厂商也在积极布局大模型训练及推理产品。

基辛格在9月20日对CNBC表示：“我们与AI算力芯片市场领导者英伟达的竞争非常激烈，但Gaudi2和Gaudi3都已迈出了重要一步。市场意识到，AI芯片行业中仍有其他机会。”

市场竞争加剧

2023年，以ChatGPT为代表的AI大模型热潮席卷全球，推动AI向更加通用的方向发展。

然而，算力的稀缺和高昂的成本已成为制约AI发展的关键因素。算力已成为全社会数字化和智能化转型的重要基石，导致智能算力需求激增。

根据AMD首席执行官苏姿丰（Lisa Su）提供的数据，2023年全球数据中心AI加速器的潜在市场总额将达到300亿美元，预计到2027年将超过1500亿美元，年复合增长率超过50%。

英伟达企业运算副总裁曼努维尔·达斯（Manuvir Das）则表示，预计AI的潜在市场规模将增长至6000亿美元，其中芯片和系统可分得3000亿美元，生成式AI软件可分得1500亿美元，英伟达企业软件贡献1500亿美元。

显然，AI算力芯片市场是一块大“蛋糕”。

目前，英伟达在全球数据中心AI加速市场占据82%的份额，并在全球AI训练领域以95%的市场占有率形成了垄断，成为这一轮AI竞争中的最大赢家，市值超过1万亿美元。

与此同时，算力需求的激增直接导致英伟达GPU的紧缺，英伟达A100显卡的数量成为衡量公司算力的标准。

事实上，企业在研发通用大模型时，需关注显卡的数量和价格。OpenAI训练GPT-3.5模型时使用了1万到3万颗英伟达GPU。根据集邦咨询的最新报告，运行ChatGPT可能需要使用到3万块英伟达GPU显卡。而在开源模型方面，LlaMa模型则在2048块80GB A100显卡上训练，算力接近2000 PTOPS。

在价格方面，国内的H800显卡价格已高达20万/张，而A100/A800的价格分别达到15万和10万/张。以2000P算力需求为例，H800 GPU单卡算力为2P，需要1000张，整体价格将达到2亿元；而A800单卡算力约为0.625P，需要3200张，整体显卡价格将高达3.2亿元。

除了购买GPU显卡外，服务器的整体配置运算，包括CPU、存储、NV-link通讯连接等，以及电力消耗、场地租金和运维成本等也需考虑。

目前，A800和H800服务器主要以8卡机型为主，若需满足2000P的算力，就需配置125台8卡H800服务器或400台8卡A800服务器，价格分别为3亿元和5.6亿元。由于H800支持PCIe 5.0和新一代CPU及内存，因此其价格也相应提高，以发挥最佳算力性能。

从大模型训练的角度来看，购买H800的总成本低于A800，性价比更高，且相比搭建CPU的成本也更具优势。这也是英伟达CEO黄仁勋近期常提到的：“买的越多，省的越多。”

当然，如果预算有限，也可以选择英伟达的在线租赁服务DGX超级AI计算系统，提供给企业租用，每个节点配备8个H100或A100 GPU，640GB内存，每月租金为37000美元，从而省去自建数据中心和购买大量GPU显卡的成本。这种租赁方式的毛利率很高，微软的云端算力租赁服务的毛利率高达42%，已成为新的“现金奶牛”。

在国内市场，英博数科、商汤AIDC及其他超过11个智算中心/云厂商也提供类似服务，整体价格比自建价格降低20%以上。

此外，英伟达最新发布的NVIDIA L40S GPU在模型训练效率上也优于A800/H800。一个70亿参数的模型，HGX A800运行需要17小时，而L40S的速度快1.3倍，仅需半天完成；对于一个1750亿参数的模型，L40S一个周末即可训练完成。