提到自动驾驶,大家往往会联想到「视觉算法」与「激光雷达」之间的争论。前者依赖于摄像头的视觉感知,而后者则重视激光雷达(LiDAR)的精确测距。根据资料显示,到2021年,配备激光雷达的车型将达到23款,但大多数仍作为高分辨率影像信息的辅助。
近期,麻省理工学院计算机科学与人工智能实验室(CSAIL)团队成功展示了一个基于机器学习的自动驾驶系统。该系统采用端到端框架,仅依靠LiDAR获取的原始3D点云数据和低分辨率GPS地图即可实现自主导航,显著提升了鲁棒性。这项研究对依赖LiDAR的自动驾驶技术具有重要意义。

自动驾驶的实时控制需要端到端学习,能够直接从原始传感器数据生成实时决策以实现自动控制。此外,现实世界中的自动驾驶系统要求具备准确性、高效性和鲁棒性,而端到端模型对扰动的敏感性较高。
CSAIL以往的研究表明,仅依靠摄像头的视觉数据生成的稀疏地形图和粗略定位即可实现点对点导航。目前,计算机视觉还难以应对因照明等环境变化带来的影响,而LiDAR传感器则能提供更为准确的距离(深度)信息。
然而,LiDAR的缺陷在于其产生的庞大数据量和高计算需求。例如,一台典型的64通道传感器每秒可生成超过200万个数据点;推理3D模型所需的计算量是处理2D图像的14倍。将数据转换为2D格式可能会导致大量信息丢失。
因此,MIT团队基于稀疏卷积内核和硬件感知模型,设计出名为FAst-LiDARNet的神经网络。通过主动降低点云的采样率,该神经网络能够高效地在完整的LiDAR点云上进行学习并做出实时控制决策。

研究人员在全尺寸车辆上评估了他们的激光雷达端到端自动驾驶系统,展示了卓越的车道稳定性和导航能力。该系统显著提高了鲁棒性,减少了因失控而需要人工接管的频率。
多项技术确保了自动化系统的优势
效率的提升确保了自动驾驶的精确控制。论文的共同作者、MIT在读博士生刘志健表示:“我们从算法和系统层面优化了我们的解决方案,与现有的3D激光雷达方法相比,累计加速了9倍。”
速度提升的原因既在于端到端模型,也源于稀疏卷积内核。这种内核基于该团队之前提出的3D点云计算模块——稀疏点云-栅格卷积(SPVConv),通过在稀疏张量(SpaRse TensoR)表示下利用3D稀疏卷积(3D SpaRseConvolution)处理邻近点信息,即使在户外大场景中也能保留细节,同时显著降低计算量,缩短计算时间。
MIT团队的目标一直是“实现新环境下驾驶的鲁棒性自主导航”。从2018年开发的允许无人驾驶汽车在没有3D地图的情况下行驶的MapLITe,到2019年仅依赖简单地图和相机视觉数据使汽车在新复杂环境中自动驾驶的端到端机器学习系统,再到如今基于LiDAR数据的端到端自动驾驶系统,该团队初步实现了他们的目标。

鲁棒性的提升确保了新系统在现实世界中的可行性。研究人员表示,借助新的混合证据融合策略,他们的系统降低了测试时驾驶员接管车辆控制的频率,甚至能够应对严重的传感器故障。MIT教授Daniela RUS指出:“通过基于模型不确定性的融合控制预测,该系统能够应对突发事件。”
想象一下,当你开车穿过隧道,瞬间暴露在阳光下,可能会因眩光而短暂失去视线。自动驾驶汽车中的摄像头在这种情况下也会遇到类似问题,而新系统能够有效解决这一挑战。通过在决策时给这种预测赋予权重,即使在传感器数据不准确的情况下(例如穿出隧道),系统也能忽略这些不可信的预测。

高级别自动驾驶的未来
未来的自动驾驶汽车将配备收集彩色数据的摄像头、高分辨率近场感知的LiDAR以及恶劣天气条件下进行远程感知的雷达。在这一传感器组合中,LiDAR将发挥最重要的作用。
要实现(L3以上)高级别自动驾驶技术,激光雷达被视为关键组件,这已成为自动驾驶工程领域的共识。3D构建能力与精准的深度感知,使激光雷达在工业勘测与自动驾驶领域占据举足轻重的地位。
激光作为平行光,即使在遇到障碍物时,其传播仍保持准直。这意味着,无论距离近在眼前还是远在100米以外,它都能精准聚焦。无数激光点根据不同物体的距离,在平面上形成深浅不一的线性阴影,构建出3D点云图,宛如铅笔勾勒出的速写画。
尽管激光雷达仍面临一些待解决的问题,当前的车载激光雷达传感器尚未得到充分应用。但MIT团队的最新研究为未来应用带来了希望。无论是速度、准确性还是鲁棒性,多个技术的结合展现了卓越的自动驾驶能力,相信能为业内人士提供应用灵感。下一步,该团队计划继续扩展系统,以应对现实世界中的复杂性,包括恶劣天气条件及与其他车辆的动态交互。
论文链接:https://aRxiv.oRg/abs/2105.09932
