互联网资讯

特斯拉 AI Day：FSD 进化、D1芯片与 Dojo 超算亮相

2024年4月2日 · admin

美国现场举行的 AI Day 展示了纯视觉方案在 FSD 的进展、神经网络训练、D1 芯片与 Dojo 超算等关键方向。多位工程师通过在线讲解，介绍了相关技术的最新进展与应用前景。

纯视觉传感方案的实现，离不开多任务学习的 HydRaNets 架构。每辆车配备 8 个环绕车身、覆盖 360° 的摄像头，用以捕捉交通信号、车道、路面障碍等信息，为神经网络学习提供丰富数据。

团队表示，目标是构建类似动物视觉皮层的神经网络连接，模拟大脑信息输入输出过程。就如光线进入视网膜，我们希望通过摄像头实现类似的感知与处理。

HydRaNets 架构能够将 8 个摄像头的数据拼接在一起，尽量在画质、延迟和精度之间取得平衡。通过人工或自动标注车道、车辆、信号灯等环境元素，系统逐帧分析画面，理解物体纵深、速度等信息，进而用于全局学习。

在这一过程中也遇到一些挑战：跨平台的数据拼接受限于底层框架、某些空间数据输出质量不稳定、不同摄像头对同一物体的观测差异导致整合困难等。

为应对这些问题，团队开发了“向量空间”技术，具备非凸优化和高维处理等优势。基于 8 个摄像头的数据，可以绘制 3D 鸟瞰视图，形成带有时间维度的路网信息，帮助车辆更好地理解驾驶环境并寻找最优路径。

有了海量精准的视频数据，下一步是打造一个强大的神经网络，将数据在总干网上进行整合和再分析。因此，团队自主研发了全新的训练方式，以实现高效的网络学习。

全球范围内的标注团队规模约千人，专注于对视频中的物体在向量空间中的定位。通过高精度人工标注与自动标注的协同，标注工作实现高效率与高准确性，为神经网络培训提供大量原生数据。

此外，团队还开发了“仿真场景技术”，可在虚拟环境中重现边缘场景进行自动驾驶训练。工程师可以设置不同环境和参数，显著提升训练效率与覆盖范围。

目前，FSD 系统已实现高效的多次预测与路径规划，能够在复杂场景中快速评估多种可能性，选择更安全、舒适、快速的自动驾驶路径。

随着处理数据量的指数级增长，训练所需算力也在持续提升，因此推出了 Dojo 超级计算机。Dojo 的目标是在实现极高训练算力的同时，扩展带宽、降低延迟、控制成本，并在空间与时间两个维度实现最佳平衡。

Dojo 的核心单元是自主研发的神经网络训练芯片 D1。D1 采用分布式结构与先进制造工艺，拥有庞大晶体管数与训练节点，内部线路长度达到数十公里级别，带来强大算力与带宽。

1500 块 D1 芯片构成训练模块，总计约 53 万训练节点。芯片之间实现无缝连接，低延迟高带宽的特性使得训练模块可以高效协同工作，整体算力达到数十 PFlop 级别。

凭借模块化设计与无限扩展能力，Dojo 的理论性能呈现上限空间，实际应用中可通过组合实现更大规模的训练能力。以 ExaPOD 体系为例，Dojo 组合后的性能相较同类产品具备显著优势，在同等成本下提升多倍性能、在同等能耗下提升效率、并显著节省空间。

为配合强大硬件，系统还开发了分布式软件层 DPU（Dojo Processing Unit），提供可视化交互、灵活扩展、数据建模、存储分配与布局优化等功能，进一步提升整机的可控性与可维护性。

不久后，Dojo 首批组装将正式启动，并在芯片、系统层面进行更深入的完善与落地。

在活动尾声，马斯克提及 AI 发展方向时，还提到“Tesla Bot”这一方向。该机器人身高约 1.72 米、体重约 56.6 千克，配有信息显示屏，具备人类水平的双手和高效的反馈系统，以实现平衡和灵活动作。

马斯克表示，Tesla Bot 将利用 Dojo 的训练机制来提升功能，并指出：未来劳动力并非短缺，但体力劳动是一种选项。Tesla Bot 旨在执行一些危险、重复和单调的任务，首款原型有望在明年推出。

设想若生产线的人工工人被机器人替代一半，Model 3 与 Model Y 的价格是否会进一步下降，进入更广泛的价格区间？