特斯拉表示,其道场(Dojo)超级计算平台已进入量产阶段,目的在于训练其自动驾驶车队。
在 2023 年第二季度的财报中,公司概述了实现大规模车辆自主性所需的四大技术支柱:庞大的真实世界数据集、神经网络训练、车辆硬件与车辆软件。
财报还指出:“我们正在内部推进这些支柱。本月,我们正式开始生产道场训练计算机,这是提升神经网络训练速度并降低成本的一步。”
此前,特斯拉已经在使用基于英伟达GPU的超级计算机,曾被认为是全球最强之一;但新版道场定制系统采用了特斯拉自研芯片。2019 年,埃隆·马斯克为这台被誉为“超强训练设备”的系统取名为道场(Dojo)。
他早前还声称,道场的算力将达到每秒十亿亿次浮点运算,即 10^18 FLOPS,这是一种难以置信的能力。
在 2021 年的特斯拉 AI Day(AI Day)上,道场仍处于开发阶段。高管们展示了第一块芯片和训练模组(training tiles),这些模组最终将演变成一个完整的道场集群或“超级节点”。特斯拉表示,它将在一个托盘中组合 2×3 个模组,并在一个机柜中放置两个托盘;每个机柜的计算能力超过 100 PFLOPS(每秒达到 10^15 次浮点运算)。在由 10 个机柜组成的系统中,道场超级节点的总算力将超过每秒 10^18 次浮点运算。
一年后,在 2022 年的 AI Day 上,特斯拉展示了道场的一些进展,包括拥有一个完整的系统托盘。当时提到在 2023 年初拥有一个完整的集群,但现在看来,可能要等到 2024 年初才能实现。
