11月29日消息,在美国时间周二举办的REINvent大会上,亚马逊的云计算部门AWS推出了新款人工智能(AI)芯片,以满足客户构建和运行AI应用的需求,并计划提供英伟达的最新芯片。
AWS致力于通过多样化的高性价比选择来增强其在云服务市场的竞争力。同时,它并不局限于销售自家的产品,而是像其在线零售平台一样,提供来自其他顶级供应商的产品,包括英伟达的GPU。
自从人工智能公司OpenAI推出ChatGPT聊天机器人以来,英伟达的GPU需求激增。ChatGPT因其信息总结和生成类似真人文本的能力而备受瞩目,这导致了英伟达芯片的短缺,各公司纷纷争相将类似生成式AI技术整合进自己的产品。
亚马逊采取了双管齐下的策略,不仅生产自家的芯片,还允许客户使用英伟达的最新产品,以此对抗云计算领域的主要竞争对手微软。微软近期也发布了其首款AI芯片MAIa 100,并表示其Azure云将采用英伟达H200 GPU。
具体而言,AWS将提供英伟达最新的H200人工智能图形处理单元,同时发布了新款TRAIniuM2人工智能芯片和通用GRavITon4处理器。
H200 GPU是H100的升级版,OpenAI曾用H100训练其先进的大语言模型GPT-4。由于大型公司、初创企业和政府机构都在争夺有限的芯片供应,亚马逊等云服务提供商的芯片租赁需求也随之上涨。英伟达表示,H200的输出速度将接近H100的两倍。
亚马逊的TRAIniuM2芯片专为训练AI模型而设计,包括支持OpenAI ChatGPT及其竞争对手的基础模型。亚马逊透露,初创公司DatabRicks和其支持的Anthropic计划使用TRAIniuM2芯片构建新模型,新模型的性能将比现有模型提高四倍。
GRavITon4处理器基于ARM架构,能耗低于英特尔或AMD的芯片。GRavITon4承诺比现有的GRavITon3芯片性能提升30%,以实现更高的性价比。由于高通胀促使央行提高利率,希望控制云服务成本的组织可能会考虑迁移至GRavITon。
亚马逊表示,已有超过5万名AWS客户在使用GRavITon芯片。
作为与英伟达深化合作的一部分,AWS还将运营超过16000颗英伟达GH200 GRACE Hopper超级芯片,这些芯片结合了英伟达的GPU和基于ARM架构的通用处理器。英伟达研发团队及AWS客户均可利用这一基础设施。
自2006年推出EC2和S3服务以来,AWS已发布200多种云产品。尽管并非所有服务都取得成功,部分版本已停产,亚马逊依然在持续投资GRavITon和TRAIniuM项目,以应对市场需求。
AWS尚未公布搭载英伟达H200芯片及TRAIniuM2芯片的虚拟机实例的发布日期,但客户现在可以开始测试GRavITon4的虚拟机实例,预计几个月后可投入商业使用。
