汽车智能化:机遇与挑战
随着以ChatGPT为代表的生成式AI大模型的迅速崛起,汽车产业的竞争焦点正逐渐从新能源转向智能化。无论是传统汽车制造商还是新兴造车势力,智能化已成为他们发展的核心。因此,问题随之而来:大模型能否真正推动汽车智能化的进步?
从汽车行业与大模型的关系来看,大模型在自动驾驶、智能驾驶舱、人车传感器互联和工厂数字化等多个领域都具备价值。在功能层面,大模型在汽车智能化方面的主要应用体现在智能座舱和智能驾驶,这也是车企和用户体验最为关注的领域。
以智能座舱为例,目前许多用户对汽车的人机交互能力表示不满。那么,如何改善车机交互,提升用户体验呢?AI大语言模型为汽车制造商提供了新的解决思路。当前,生成式AI大模型在智能座舱等车联网场景中展现出巨大潜力,许多汽车制造商将其视为战略技术之一。例如,车载ChatGPT语音助手能够处理完整的对话,包括追问,并保持对上下文的理解,从而提供良好的语音交互体验。
例如,今年美国微软公司与德国汽车制造商梅赛德斯奔驰宣布合作,将ChatGPT人工智能服务整合到现有车型中,预计将惠及美国地区的90万辆汽车。
梅赛德斯奔驰表示,未来车主在使用语音助手提问时,ChatGPT将负责回复,从而增强汽车语音助手的功能。微软的发言人指出,这是ChatGPT首次应用于汽车环境中。实际上,微软与梅赛德斯奔驰正在探索ChatGPT的插件生态系统,为第三方服务集成开辟了可能性。未来,驾驶员可以通过车载系统完成餐厅预订、电影票预订等任务,极大丰富和提升智能汽车与用户之间的互动体验。
在国内,多个品牌已经宣布将在其车型上接入AI大模型,如长安、集度、吉利、岚图、红旗、长城、东风日产和零跑等,这些品牌均为文心一言的早期客户。
除了智能座舱,AI大模型在自动驾驶领域同样展现出广泛的应用前景。许多专家认为,AI大模型的应用将成为未来智能出行的重要驱动力,为自动驾驶技术的发展和普及做出显著贡献。
大模型能够处理海量数据,具备多维度分析能力,提供更精准和全面的数据分析及预测能力。通过持续优化和升级大模型,可以提高自动驾驶的准确性和可靠性。在云端,车企可以利用大模型的强大计算能力完成大多数的数据标注和挖掘工作,从而节省成本,并借助仿真场景进行赋能。在车载端,大模型可以被细分为多个子模型,负责不同的任务,节省推理计算时间,提高行车安全性。
以特斯拉为例,随着AI大模型的发展,特斯拉率先采用了基于TRansFoRMeR大模型的BEV+占用网络感知算法,显著提升了环境建模的效率,成为主流汽车制造商下一代智能化的主要架构。这一感知架构能减少对激光雷达等高成本传感器的依赖,有效降低系统成本,减轻车企及消费者的负担。
新挑战显现,真正落地仍需时日
总体而言,大模型在智能座舱的应用已取得初步成果,但在自动驾驶方面仍面临诸多挑战。
首先,从硬件层面来看,AI大模型的运行需要高规格的硬件支持,包括高算力、大容量内存和低时延等特性。尽管目前车载设备的硬件水平有所提升,但仍无法满足AI大模型的运行需求。例如,自然语言处理(NLP)的预训练模型GPT-3需要数万亿次TOPS的计算能力,这要求芯片的算力至少达到万级TOPS以上才能完成计算任务。
然而,目前的车载硬件部署中,即使是蔚来、理想等新兴造车势力使用的英伟达ORin X芯片,其单颗算力仅为254TOPS,远不能满足大模型的计算要求。这也是特斯拉自研芯片和建立云端智算中心Dojo的主要原因。
其次,在数据处理层面,尤其是日益流行的多模态数据,包括自动驾驶中的激光雷达、毫米波雷达和超声波雷达数据,以及高清摄像头、GPS等设备收集的数据,均使得数据处理、管理和使用变得极为复杂。相较之下,大模型所需的数据量更是不容小觑。
此外,数据隐私和安全等问题也将随着数据量的迅速增长而加剧。
值得注意的是,从感知算法的进展来看,行业在2022年及之前的商业化应用主要集中在2D+CNN算法,而随着ChatGPT等AI大模型的兴起,感知算法已升级至BEV。目前,特斯拉早在2021年就采用了BEV+TRansfoRMeR算法,而国内的小鹏、华为和理想等品牌在今年才开始转向BEV+TRansfoRMeR,但仍主要应用于感知端。由于算法复杂性和大算力要求,感知决策一体的端到端算法的落地仍需时日。
总之,虽然大模型已成为智能汽车行业竞争的焦点,并为自动驾驶和智能座舱带来巨大潜力,改善驾驶安全性、优化交通流量和提供个性化驾驶体验,但在算力、算法及数据处理方面的新挑战也成为实现这些目标的阻碍。未来究竟是挑战大于机遇,还是机遇大于挑战,仍需我们不断观察。
[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
[[[IMG_4]]]
[[[IMG_5]]]
[[[IMG_6]]]
[[[IMG_7]]]
[[[IMG_8]]]
