随着智能驾驶技术的发展,越来越多企业纷纷进入汽车行业,希望能分得独属于自己的一杯羹。但在市场的选择下,已有一部分品牌走入了历史的尘埃。但也有部分车企,却稳稳地站稳了脚跟,小米就是其中一个,作为后起之秀,小米在宣布造车前被非常多的人质疑,但在“真香”定律下,小米创下了很多友商所不能及的成就。作为科技企业,小米也在智能驾驶领域也不断研发及突破,并推送了端到端自动驾驶系统。
小米端到端功能简介
所谓“端到端”,即是指系统从最初的外部环境信息捕捉,到最终的车辆控制指令输出,都由一个整体化的软件和硬件平台协同完成,无需中间繁琐的模块拆分,从而大幅降低了信息传递的延迟和误差。这种架构不仅在技术实现上更加高效,也使得系统能够自适应各类复杂场景,在多变的道路环境中依然保持高水平的鲁棒性与安全性。
今年2月份,小米端到端全场景智能驾驶功能实现了全量推送,这一功能给车主提供了“上车即用,车位到车位”的智能驾驶体验。与传统模块化架构相比,小米采用了端到端的深度神经网络建模方式,从传感器信号输入到决策规划输出均由一个统一的模型完成。这种数据驱动和模型泛化能力极强的架构,使得系统能够面对复杂多变的现实路况,呈现出前所未有的驾控体验。
只需上车、开启导航、挂入D挡,再按下智驾键,车辆即可自动完成路边启动、ETC或闸机通行、环岛驾驶等多种驾驶场景的无缝衔接。无论是在城市道路、快速路,还是高速公路、封闭园区和停车场,小米的端到端全场景智能驾驶都能够提供稳定、流畅的行驶体验。使用体验也力求充分体现出“驾驶更拟人”的理念,即可以提供老司机的驾驶经验,能够提前预判路况并规划出最优行驶路径,确保行车安全和舒适。
得益于系统对前方障碍物和复杂情况的快速反应能力,在遇到缓行车辆、行人以及路边障碍时,小米的端到端智驾系统能够迅速做出绕行决策,保持车辆在车道中央安全行驶,从而显著提升通行效率。这种全新的端到端体验不仅大大降低了驾驶员的操作负担,更让驾驶变得简单、便捷,成为未来智能出行的重要趋势。
硬件基础决定智驾能力下限
硬件平台作为智能驾驶系统的基石,对系统整体性能起到了至关重要的作用。智能驾驶系统的高效运行离不开对物理世界的精确感知,而这一切的实现都建立在坚实的硬件基础之上。小米汽车在设计之初,就充分考虑到了对外部世界的探索需求。以小米SU7为例,其全系车型均标配11颗高清摄像头,实现了车辆周围360度无死角的环境感知;而在小米SU7 Pro、Max及Ultra版本中,更是增加了前向激光雷达,进一步提升了前方感知能力,确保在各种复杂场景下都能精准捕捉环境信息。
这种多传感器融合方案,为车辆构建了一座“海量数据底座”,使得系统能够获取更丰富、准确的实时场景信息。不论是高速行驶中的动态路况,还是停车场等封闭区域内的微小障碍,均能通过高清摄像头、毫米波雷达与激光雷达协同感知得到有效监测。多传感器的高精度数据采集还为后续的物理世界建模提供了丰富素材。通过实时采集车辆周边的图像、距离和运动信息,系统得以形成对复杂交通环境的整体认知,从而为后续的决策规划奠定坚实基础。
数据处理决定智驾能力上限
要让智能驾驶系统真正“看懂”周围的世界,仅仅依赖硬件采集数据远远不够。更为关键的是如何将这些零散的信息进行整合、解读并最终转化为可执行的驾驶决策,这就对数据处理能力提出了很高的要求。小米在这一过程中构建了一个完整的物理世界建模体系,这一体系主要分为三个层次,即数据观测层、隐式特征层和显式符号层。
小米“三层建模”架构的物理世界模型
数据观测层相当于系统的“眼睛”。数据观察层与传统架构中的感知结构相似,主要用于查勘路况、收集交通信息。小米HAD(智能驾驶系统)同时采集来自11颗高清摄像头、毫米波雷达与激光雷达的数据,实时捕捉车辆周围360°内的包含图像、激光雷达点云以及领航功能所需要的导航信息等。这个层次将分散的传感器信号整合成可供后续处理的数据流,为系统提供了第一手的真实、多维度场景状态信息。
隐式特征层则类似于系统的“思考大脑”。隐式特征层与传统架构中的决策层类似,在这一层,系统对从数据观测层获得的原始数据进行处理和分析,通过深度神经网络提取出隐藏在大量数据背后的特征和规律。这些隐式特征虽然不易直接被人类理解,但却包含了对周边车辆、行人等目标的精细判别信息。借助强大的模型推理能力,系统甚至能够恢复部分被遮挡区域的信息,为决策提供更为全面的依据。
显式符号层则起到了“翻译官”的作用,即将复杂的数据信息以人类可以理解的样式展现出来。它将隐式特征层提取出的模糊信息转化为人类可直接理解的符号或标签,从而实现对模型输出结果的直观判别。通过这种方式,系统不仅能够对每一可能的行驶轨迹进行安全性、舒适性、高效性等多维度的评估,还可以不断优化模型,使得最终输出的决策更加精准可靠。这种端到端的建模方法,不仅简化了传统系统中模块之间的数据交互流程,更大幅提高了在动态变化环境中的反应速度和决策准确性。
此外,为应对物理世界中时间维度的动态变化,小米还尝试将三层模型进行联合时序建模。在云端,利用未来帧数据作为自监督信号不断参与训练;而在车端,实时优化的模型则可以迅速适应各种突发情况。这种协同进化的设计,使得小米智能驾驶系统在不断学习与进化中,逐步实现了对复杂场景的精准判断与快速反应。
其实早在去年3月,小米SU7的智能驾驶系统就已具备高速领航、主动安全、代客泊车以及辅助泊车等先进功能。而在随后的OTA升级过程中,系统不断解锁城区场景,从最初覆盖部分城市扩展至中国大陆全域,实现了HAD端到端全场景智能驾驶功能的全量推送。在2023年12月28日的汽车技术发布会上,小米首次公开了变焦BEV技术、超分辨率OCC技术以及感知决策一体模型等一系列核心关键技术。这些技术的公开不仅证明了小米在智能驾驶研发上的深厚积累,更展示了其未来在自动驾驶领域的无限可能。凭借对物理世界建模能力的不断提升以及深度工程优化,小米智能驾驶系统正完成从“高精地图+模块架构”,到“无图+模块架构”,再到“端到端架构”的跨越式演进。
-- END --
原文标题 : 小米汽车端到端智驾技术介绍