在人工智能领域,很多人都曾面临过“GPU之惑”。
面对张量核心、显存带宽和16位计算能力等众多复杂的GPU参数,选择变得十分棘手。那么,究竟应该如何进行选择呢?
从价格不到1000元的1050 Ti到接近30000元的TITan V,GPU的价格差异如此之大,应该从哪个价位入手呢?谁才是真正的性价比之王?
不同任务对GPU的需求各异,计算机视觉与自然语言处理对GPU的选择就有所不同。
此外,使用云端TPU或GPU是否可行?如何在本地GPU与云端GPU之间进行任务分配,才能实现更高的性价比?
究竟什么样的AI加速设备才是最合适的选择?
为帮助你找到最优装备,华盛顿大学的博士生TiM DetTMERs将对比多个选项,并总结为实用攻略,同时考虑最新的模型和硬件。
那么,在众多GPU中,谁能脱颖而出呢?测评结果即将揭晓。
文末还附有一份简明的GPU选购建议,欢迎参考。

关键参数
针对不同的深度学习架构,GPU参数的选择优先级各不相同,通常可以分为两条主线:
卷积网络和Transformer:张量核心 > FLOPs(每秒浮点运算次数) > 显存带宽 > 16位浮点计算能力
循环神经网络:显存带宽 > 16位浮点计算能力 > 张量核心 > FLOPs
这一排序背后有其逻辑,接下来将详细解释。
在深入了解哪些GPU参数对速度至关重要之前,首先来看两个最基本的张量运算:矩阵乘法和卷积。
