互联网资讯 · 2024年2月12日

英伟达发布三款消费级显卡,主打本地化人工智能

英伟达在1月发布了三款面向消费市场的新显卡,分别是RTX 4060 Super、RTX 4070 Ti Super和RTX 4080 Super,售价区间为599美元至999美元。新产品除了面向游戏场景外,也强调在个人电脑和笔记本上运行“本地化”人工智能能力,例如图像生成、视频通话背景处理以及游戏开发辅助等应用。

过去一年,英伟达的H100等服务器级GPU因广泛用于训练和部署生成式人工智能而备受关注,公司也因此站上了AI浪潮的中心。如今,英伟达开始将这一趋势延伸到消费级市场,希望通过更适合终端设备运行的显卡,扩大其在人工智能领域的优势。

此次推出的三款显卡均加入了更多张量内核,用于加速生成式人工智能相关任务。英伟达还将这些显卡提供给宏碁、戴尔、联想等厂商,用于笔记本产品。

在企业级市场,人工智能需求推动英伟达销售额大幅增长,其市值也突破万亿美元。相比之下,企业级GPU往往价格高昂,常用于由多块显卡组成的大型服务器系统,而消费级产品则更强调在个人设备上的普及与落地。

长期以来,游戏显卡一直是英伟达的重要业务基础。此次新品则进一步强化了AI处理能力,尤其突出无需将数据频繁传回云端、即可在本地完成部分人工智能任务的特点。

英伟达表示,新显卡仍然以游戏为核心用途,但也适合处理多种AI工作负载。以RTX 4080 Super为例,其生成式AI视频处理速度可比上一代产品提升150%。此外,英伟达称,近期的软件优化还可让大语言模型的运行速度提升至原来的五倍。

英伟达产品管理高级总监贾斯汀·沃克表示,随着RTX系列显卡累计出货量达到1亿块,公司已经拥有足够大的硬件基础,可为AI应用在个人电脑上的普及提供支撑。

英伟达预计,未来一年会出现更多能够充分利用增强算力的新型AI应用。与此同时,微软也被认为将在后续系统版本中进一步加强对人工智能硬件的支持,从而推动相关生态发展。

在实际应用层面,这类显卡可以用于Adobe Photoshop中的Firefly图像生成工具,也可用于视频会议中的背景移除等功能。英伟达还在开发面向游戏开发者的工具,帮助他们将生成式人工智能引入游戏流程,例如自动生成非玩家角色的对话内容。

边缘设备与服务器的分工

这次新品发布也反映出英伟达在消费级AI设备上的进一步布局。尽管其当前最受关注的业务仍集中在大型服务器GPU,但在“本地化”人工智能方向上,英伟达正与英特尔、AMD和高通展开竞争。这些厂商近期也都推出了具备专用机器学习单元的新芯片,面向所谓的“AI PC”市场。

当前,科技行业仍在探索部署生成式人工智能的最佳方式。由于这类应用通常需要庞大的计算资源,若完全依赖云端运行,成本可能非常高。

因此,不少厂商开始推广AI PC或“边缘计算”方案,即让设备本身配备更强的AI处理能力,直接在本地运行部分大语言模型或图像生成任务。这样的方式能够减少对网络和远程算力的依赖,但在性能、模型规模和能耗等方面也需要做出一定权衡。

英伟达提出的思路则是将云端与本地结合:复杂的大模型任务交由云端处理,而对时延要求更高、需要即时响应的任务则放在本地设备上运行。

沃克表示,云端的英伟达GPU能够承担超大规模语言模型和高强度AI计算,而个人电脑中的RTX张量内核则更适合处理对延迟敏感的人工智能应用。这样的分工被视为未来AI应用落地的一种现实路径。