互联网资讯

特斯拉 AI Day:FSD 进化、D1芯片与 Dojo 超算亮相

2024年4月2日 · admin
openmagic ad

美国现场举行的 AI Day 展示了纯视觉方案在 FSD 的进展、神经网络训练、D1 芯片与 Dojo 超算等关键方向。多位工程师通过在线讲解,介绍了相关技术的最新进展与应用前景。

纯视觉传感方案的实现,离不开多任务学习的 HydRaNets 架构。每辆车配备 8 个环绕车身、覆盖 360° 的摄像头,用以捕捉交通信号、车道、路面障碍等信息,为神经网络学习提供丰富数据。

团队表示,目标是构建类似动物视觉皮层的神经网络连接,模拟大脑信息输入输出过程。就如光线进入视网膜,我们希望通过摄像头实现类似的感知与处理。

HydRaNets 架构能够将 8 个摄像头的数据拼接在一起,尽量在画质、延迟和精度之间取得平衡。通过人工或自动标注车道、车辆、信号灯等环境元素,系统逐帧分析画面,理解物体纵深、速度等信息,进而用于全局学习。

在这一过程中也遇到一些挑战:跨平台的数据拼接受限于底层框架、某些空间数据输出质量不稳定、不同摄像头对同一物体的观测差异导致整合困难等。

为应对这些问题,团队开发了“向量空间”技术,具备非凸优化和高维处理等优势。基于 8 个摄像头的数据,可以绘制 3D 鸟瞰视图,形成带有时间维度的路网信息,帮助车辆更好地理解驾驶环境并寻找最优路径。

有了海量精准的视频数据,下一步是打造一个强大的神经网络,将数据在总干网上进行整合和再分析。因此,团队自主研发了全新的训练方式,以实现高效的网络学习。

全球范围内的标注团队规模约千人,专注于对视频中的物体在向量空间中的定位。通过高精度人工标注与自动标注的协同,标注工作实现高效率与高准确性,为神经网络培训提供大量原生数据。

此外,团队还开发了“仿真场景技术”,可在虚拟环境中重现边缘场景进行自动驾驶训练。工程师可以设置不同环境和参数,显著提升训练效率与覆盖范围。

目前,FSD 系统已实现高效的多次预测与路径规划,能够在复杂场景中快速评估多种可能性,选择更安全、舒适、快速的自动驾驶路径。

随着处理数据量的指数级增长,训练所需算力也在持续提升,因此推出了 Dojo 超级计算机。Dojo 的目标是在实现极高训练算力的同时,扩展带宽、降低延迟、控制成本,并在空间与时间两个维度实现最佳平衡。

Dojo 的核心单元是自主研发的神经网络训练芯片 D1。D1 采用分布式结构与先进制造工艺,拥有庞大晶体管数与训练节点,内部线路长度达到数十公里级别,带来强大算力与带宽。

1500 块 D1 芯片构成训练模块,总计约 53 万训练节点。芯片之间实现无缝连接,低延迟高带宽的特性使得训练模块可以高效协同工作,整体算力达到数十 PFlop 级别。

凭借模块化设计与无限扩展能力,Dojo 的理论性能呈现上限空间,实际应用中可通过组合实现更大规模的训练能力。以 ExaPOD 体系为例,Dojo 组合后的性能相较同类产品具备显著优势,在同等成本下提升多倍性能、在同等能耗下提升效率、并显著节省空间。

为配合强大硬件,系统还开发了分布式软件层 DPU(Dojo Processing Unit),提供可视化交互、灵活扩展、数据建模、存储分配与布局优化等功能,进一步提升整机的可控性与可维护性。

不久后,Dojo 首批组装将正式启动,并在芯片、系统层面进行更深入的完善与落地。

在活动尾声,马斯克提及 AI 发展方向时,还提到“Tesla Bot”这一方向。该机器人身高约 1.72 米、体重约 56.6 千克,配有信息显示屏,具备人类水平的双手和高效的反馈系统,以实现平衡和灵活动作。

马斯克表示,Tesla Bot 将利用 Dojo 的训练机制来提升功能,并指出:未来劳动力并非短缺,但体力劳动是一种选项。Tesla Bot 旨在执行一些危险、重复和单调的任务,首款原型有望在明年推出。

设想若生产线的人工工人被机器人替代一半,Model 3 与 Model Y 的价格是否会进一步下降,进入更广泛的价格区间?