都讲“端到端”与“大模型”的时代到底什么才是好的智驾?

  现在如果一场新车发布会的PPT里,没有一页是讲“端到端”、“大模型”、“无高精地图”、“全国都能开”的,那可能这个品牌会被认为是跟不上时代了。

  而当小鹏MONA M03第一次将具备城区高阶智驾能力的产品价格拉低到15.58万元时,似乎高阶智驾也开始像高通8155芯片、OLED大屏和各种OS车机系统一样,趋向于成为一种“惯例”。

  行业对于电动化与智能化的转折点,以及2025年将成为高阶智驾决赛点的认知,已经基本成为共识。而将高阶智驾的发展代入到创新扩散模型当中,“天花板级别”的高阶智驾系统将成为跨越鸿沟的关键。

  但就像同样拥有高通8155芯片和触控大屏,但智能座舱体验却也可以千差万别一样,仅仅是“端到端”、“无高精地图”这些名词,也很难决胜出智驾的优劣。

  而“天花板级别”,意味着带给用户可用、好用的体验,同时自然意味着主机厂高阶智驾的规模量产、成本控制、技术迭代进入到一个可持续的“商业闭环”状态。

  地平线创始人兼CEO余凯博士很好地总结了这种状态:“‘优雅不怂,从容笃定’,要以产品思维来做智能驾驶,以人为出发点,关注用户对产品的体验和感受。”

  余凯博士举了一个在路上很常见的刹车场景,他说:“优雅和不怂是充满矛盾的,(智驾)要开着优雅,可能就很怂。优雅本身就不容易,比如刹车,需要很多细节的打磨,光靠一个Transformer和端到端是不够的。与此同时,该果断决策的时候,也要敢于决策,这不仅意味着通行效率,也代表着安全感。”

  端到端、BEV、Transformer,这些名词,其实任何人稍加学习都能明白个大概原理,但能够放进教科书里面的技术,其实是每个公司都掌握的。“真正的区分点在于细节的打磨,去做脏活累活苦活,才能真正打造无与伦比的产品。”余凯博士说道。

  不久之前,余凯博士和大众汽车集团(中国)董事长兼CEO贝瑞德一同在望京体验了地平线全场景智能驾驶解决方案Horizon SuperDrive(点这里就可以看)。周五、晚高峰、下雨、北京望京,困难叠满的场景下,实现了50分钟零接管的体验。

  也许“零接管”的结果,很多系统在满足一定条件下都能轻松实现,但从地平线的测试中,我们大家可以关注系统应对复杂场景时的“拟人化”。

  比如拥堵汇流,系统会尝试不断寻找机会试探,而不是一味地停车等待;比如机非混杂道路的绕行,系统也会像“老司机”一样丝滑完成。

  同时,目前行业头部企业中,也屈指可数可以应对的环岛场景,面对打伞行人穿插、违规停车和积水覆盖车道线的情况,地平线HSD也可以流畅通过。

  如果说这些都还算是各家车企在城市高阶智驾的演示场景中,也能见到的场面,那地平线在一些往往容易被忽视的细节创新中,更体现了对于“以人为本”的思考。

  贝瑞德在体验HSD时曾表示:“这辆车正以正确的方式感知真实的世界,我可以非常精确地看到所有细节。”

  在地平线HSD的产品中,由实时感知对物理世界进行的实时渲染,于HMI(人机交互)构建世界的数字镜像被精心雕琢、呈现,甚至连过街天桥也被还原到虚拟世界当中。

  在地平线智驾系统架构师刘景初看来,HMI在车上所扮演的角色,就是智驾系统与人沟通的桥梁,“它作为一个机器,确实我们很难知道它脑子里的所思所想,所以有时候我自己做智驾系统的时候,我会盯着屏幕看,我确认它看到了、有响应,我就放心了。”刘景初说道。

  地平线希望能够通过HMI系统的构建,能够在一定程度上帮助驾驶者建立更强大的心理安全感,与车辆达成更有效的沟通。

  和过去我们常见的HMI不同,在HSD上,除去车模是3D的,场景与环境也得到了3D复原。刘景初谈到最近大火的游戏《黑神话:悟空》,他说:“让我很动容的场景就是刚上来的四大天王,往那个地方一立,哪怕它不动,你只是在二郎神前面打仗,你也认为这个世界很开阔。我们的HMI希望打造同样的效果。”

  当然,这样的世界场景还原和放一个摄像头播放实时画面的感受并不一样,系统需要在提供真实世界的同时,对信息流做出权重区分——让重要的信息不被遮挡。因此,即便我们看到了过街天桥、天空的显现,以及树木的郁郁葱葱,但我们依然能够很清晰地看到车辆的运行状态、车道、信号灯。

  而在车辆运行状态下,HMI也通过画面呈现出系统思考的过程,让人读懂车,从而获得更多的安全感。大多数变道信息,只是随便给你在旁边车道画了个框,但地平线给出的是一个或多个条带,每个条带都代表了车辆在思考驾驶的过程中,可能的行使目标。而随着车辆越来越靠近这个目标,可以看到变道选择的区间越来越窄,直至最后与自车的位置重合。

  甚至,当智驾系统启动时,地平线的工程师们也充满浪漫主义色彩,为这一刻设计了充满仪式感的动画效果,“它开始向这样一个世界辐射自己智慧的光辉,让我们知道它开始与这个世界交互了,而不是冰冷的叮咚一声。”

  同时,地平线还考虑了智驾与导航功能的融合,针对导航与SR(实时环境渲染)的3D界面对于用户注意力的争夺,设计了无缝衔接的画面,让用户都能够把自车周边不同尺度的信息平顺“穿起”。

  对于HMI的打磨,可能只是地平线工程师在开发HSD产品过程中的一个细节。就像余凯博士所讲:“智能驾驶在每一个细节的转弯、避让、减速,靠Transformer、靠端到端是做不到的。地平线有底气讲这个话,因为我们本来就是世界上最早做端到端的,长时间的积累让我们对于工程、系统更有敬畏之心。”

  事实上,相比于泛泛的技术名词,或是“空洞”的接管数据,让用户理解、信任一个产品,日积月累的使用是一种途径,而理解产品研发的思路,让深奥的技术能通过直观的方式呈现给用户,可能是一种更高效的路径。

  根据一汽车垂媒的调研报告,在用户的购车旅程中,对于“试驾体验”的重视程度和体验评价都是最高的,但对于高阶智驾的体验来说,在平均试驾时长20分钟,平均试驾距离5公里的过程中,其实很难让普通用户评判其高下。

  高阶智驾目前要解决两个核心问题:性能提升(Scale up)和场景泛化(Scale out)。

  Waymo的L4 Robotaxi,就是Scale up的“极致维度”。Waymo在相对受限的运营区域里有着L4级的性能表现,但它的区域拓展速度,乃至整个L4 Robotaxi的普及率,至今仍然不算很高。

  而特斯拉FSD作为智驾的“标杆”,在Scale out方面被认为是目前的领跑者,FSD已经覆盖全美,但事实上,有人尝试在欧洲使用,发现系统也能够正常的使用。只不过,在阳光明媚的加州可以有很出色表现的FSD,来到纽约曼哈顿的拥堵街道里,30分钟的路程接管了5次。

  在技术层面,Scale up主要有“基于规则”和“端到端”两种路线,也是我们之前常听到的两个名词。累积了历代工程师心血的,通过代码实现的规则堆叠,可以很好地兜住系统表现的下限,但很多时候相比于驾驶员对于场景的处理,会有些生硬和机械。

  而端到端系统,是通过模仿学习实现的,让神经网络模仿人的行为,因此系统的上限提升了很多,甚至有时会有一些“神来之笔”。但端到端作为一个黑盒系统,没有“第二双眼睛”帮它检查和防护,因此也会在一些格外的简单的场景下“翻车”。

  “如果一个系统真的与车内外人员的生命安全相关的时候,上限和下限同样重要。”刘景初说道。

  而对于Sacale out来说,静态环境的泛化是最大的技术挑战。过去,大家常说的高精地图就是解决系统理解静态环境的方式,但高精地图的覆盖度、更新频率和成本,在“全国都能开”的目标下存在不小的问题。因此用地图的方式解决Scale out,就会存在“广度”问题。

  如今无图或轻图方案,降低了对高精地图的依赖,但也带来了新的问题:更广泛、更新更快的数据源,存在质量偏低的问题,它所提供的信息与智驾系统拼接后,会带来体验的下降。“在一些乡间小道、三四线城市能不能开?确实能,但可能开得像过山车一样。”刘景初说。

  在地平线的工程师看来,端到端的出行是一道曙光,但放到技术发展的历史长河中,它也可能是一种方式而已。

  而对于未来路径的思考,依然要回归“以人为本”。车是给人设计的,路是给人开车设计的,在这条真理之下,理论上只要系统足够拟人,就会得到最自然、最好的结果。

  因此,地平线构建了一套端到端World Model和交互博弈算法,打破了技术迭代中常见的“跷跷板效应”,同时突破性能提升与场景泛化难题。

  自动驾驶技术的核心进化,本质上是对机器认知与交互能力的深度挖掘与提升。通过端到端世界模型,HSD系统具备理解万物、拥有通用认知的能力,让车辆可以像人类司机一样感知并理解周围世界,做出合理决策。同时,以数据驱动的交互博弈为内核,结合更安全的规则边界,可以让系统在面对拥堵换道、路口、人车混行灯复杂、常见的城区场景时,也能给用户所带来优雅从容的智驾体验。

  地平线通过技术能力实现了这种“兼收并蓄”,而从使用者真实的体验角度来说,就是车辆不会“很怂”或者“很莽”,整车轨迹的类人性相比以前有50%的提升,拥堵变道的成功率提升50%,复杂博弈场景不会“尬停”,人车混行通行效率提升60%,整体舒适度提升30%。

  事实上,无论是主机厂还是技术产品的供应商,都要面对最终的关卡——用户买单。

  余凯博士说:“地平线是一个软硬结合的公司,我们是芯片公司里最懂软件算法的,是软件算法里最懂芯片的,还是做软件算法和芯片的公司里最懂车规的,一直玩‘铁人三项赛’到现在。”

  如今,地平线万套智驾方案,拥有软硬结合全栈技术能力,并且最新推出了国内唯一满足全阶智能驾驶量产需求的计算方案征程6系列。

  这背后是地平线以时间和规模构建的,成熟的大规模量产工程体系,这不仅促进了前瞻软件算法和计算方案的迭代优化,还能极大提升产品应用效率,而这是领跑高阶智驾市场的基础。

  当高阶智驾逐渐从PPT走向更多用户身边时,所考验的,就不单单是“教科书”上的内容了。

来源:博乐体育网站登录    发布时间:2024-09-04 09:26:26