摘要:有意思的是,在乘用车辅助驾驶领域,小鹏是第一个把激光雷达带上车的主机厂。有印象的朋友应该知道,最开始的小鹏P5用了2颗览沃的激光雷达。现在又是第一个主动抛弃激光雷达的车企。尤其是在激光雷达势头一片大好的前提下,小鹏作为辅助驾驶行业领头羊,总有出奇之举,背后的逻
最近不少朋友跟我交流一个问题,小鹏为什么不用激光雷达了?
很多人可能也注意到了,从去年的重磅车型P7+开始,到今年的连续改款G6,G9,以及后续的很多重磅车型上,小鹏“去激光雷达”的势头越来越猛。
有意思的是,在乘用车辅助驾驶领域,小鹏是第一个把激光雷达带上车的主机厂。有印象的朋友应该知道,最开始的小鹏P5用了2颗览沃的激光雷达。现在又是第一个主动抛弃激光雷达的车企。尤其是在激光雷达势头一片大好的前提下,小鹏作为辅助驾驶行业领头羊,总有出奇之举,背后的逻辑是什么?
圈子里讨论比较激烈的一个说法是降本增效。目前批量采购单颗激光雷达成本在1千左右,加上一些配套线束不超过1500,小鹏之前用的是2颗,一款车上激光雷达的成本就是3000。
有人说20万的车3000块好像也不是很多,账肯定不是这么算的。如果按照总销量来看,之前激光雷达主要集中在MAX车型上,按照每年销量三分之一(没法拿到确切的销量数据,只能粗略估计)来算,小鹏今年以来月销量基本稳定在3万左右,一年就是34万,激光雷达版本差不多是10万量级,一年仅激光雷达一项就能省下来3个亿。
去掉激光雷达让小鹏在产品价格上拥有更多优势,效果也立竿见影。小鹏今年重新站上新势力销冠降本功不可没。推算下来这个逻辑闭环成立。但是从小鹏自身来说,这个事情并没有那么简单。这一切还要从小鹏最新的技术路线讲起。
为了通向自动驾驶终局,小鹏搭建了一个世界基座模型。小鹏汽车自动驾驶负责人李力耘介绍,小鹏基模是一个以大语言模型为骨干网络,使用海量优质驾驶数据训练的多模态大模型,具备视觉理解能力、链式推理能力和动作生成能力。提升智驾能力上限。
它可以理解成一个云端大模型,大模型结构的第一层采用Encoder编码器,对所有信号进行融合。你没有看错,是各种信息,包括视频信号,以及导航音频、车载视频,甚至耳朵、超声波雷达、毫米波雷达听到的各种信号。目前能够处理的参数量达到720亿参数(一个模型是72B),VLA模型参数差不多在1B-2B之间,大概是35倍的差值。
接下来就来到了最核心的部分,小鹏通过语言大模型(LLM)让各种各样的传感器信息、元素对齐,使它能够作为标准化“符号”被处理,这样大语言模型就具备了推理能力,以及持续的思维链能力,通过前方车辆的绕行推测前方可能有障碍物,进而推理出前方施工等场景,从而提前做出应对。
经过Encoder(编译器/编码器)到语言大模型之后,模型会变成一个聪明的学生或者刚入行的聪明青年教师。经验少,但是天赋高。然后再通过高质量数据的方式强化学习让系统变成一个经验丰富的老教授先放到车端。
强化学习是大模型训练的经典思路,Open AI的很多模型都是采取这个方式。先通过设置奖励函数给系统设置一些边界,再通过奖励模型提供更连续、更泛化、更多维的奖励信息给到强化学习,最后再通过世界模型对他进行多维度的模拟验证。
于是,一个经过海量数据训练的优秀老司机云端大模型就这样诞生了。最后再通过蒸馏的方式把云端训练的能力沉淀出来,生成“小身材、大智商”的端侧模型,下放在车端。
云端模型的工厂在新的AI时代下提升了整体的模型迭代效率和软件迭代效率,尤其是在全球化的环境下,要面向未来的前端的模型需求,一定是需要快速生产出不同的模型,并且快速部署到不同的环境当中。
小鹏的逻辑其实很简单,模型足够大,能够承载的参数量就足够多,系统的能力上限就足够高。
关于小鹏云端基座模型详细的技术拆解,我们在之前的内容里有过重点阐述。有兴趣的朋友可以回看一下我们之前的内容。
这里我们重点来聊一聊小鹏这一套逻辑到底成不成立。
讲太多技术的东西很枯燥,有一个很明显的佐证就是看特斯拉,特斯拉也是海量数据训练之后的结果,在美国市场的表现相当惊艳,说明这条路有它的可行之处。
这时候我们再来回看小鹏的策略,去掉激光雷达让小鹏形成了一条技术闭环路线:去激光雷达降本 — 多卖车 — 收集更多数据 — 海量数据驱动系统优化 — 与友商拉开差距 — 卖更多车重复循环。
特斯拉证明了这条路线的可行性,但follow注定是一条难走的路。小鹏对自己的技术绝对自信,但是挑战也是存在的。我觉得有几个点值得关注:
首先是数据量。小鹏的飞轮要转起来一定要有庞大的数据量,这是大前提,否则一切都是空中楼阁。看看特斯拉在这方面做多少努力就知道。
数据来自两方面,一方面是卖车收集的真实数据,另一方面还有世界模型工厂“造”出来的数据,也就是大家理解的仿真,但小鹏世界模型的作用可不止于仿真。
还有一点就是模型设计是否合理,小鹏的做法是先用数据训练一个云端大模型“老师”,小鹏拟定一套评价标准来评价老师好坏以及准出标准,再让“老师”去训练车端模型“学生”。现在除了特斯拉,因为他的模型技术到现在一直都没有公开。国内自动驾驶公司现在大家打的都是明牌,技术范式基本比较明确。理念提出来是一回事,东西能不能做出来是另一回事,效果好不好又是一回事。有印象的朋友应该知道,其实模型蒸馏这个说法,国内最早是毫末智行在2023年科技日上就提出来了,但是东西没做出来。
再有就是在传播上很被动,华为花了足够多的精力让消费者接受激光雷达就是高价值辅助驾驶的代表,小鹏如何向消费者解释视觉比激光雷达好,虽然特斯拉在前面帮小鹏消除了一部分误解。但小鹏最大的变量就是真正在体验上做出成绩,让消费者信服。视觉方案如果没有海量的数据几乎不太可能在体验上超越激光雷达,要拥有海量数据就要多卖车,多卖车就要体验比友商好,但体验好的前提是多卖车有更多数据,然而在数据量不够体验不够好的时候小鹏只能从理论上向消费者解释为什么视觉比激光雷达好,这就回到了华为推行激光雷达高价值的问题。这看起来像是一个死循环,看小鹏如何破局。
这里我们可以引入另一个话题,地平线余凯和小马智行楼教主都提到过一个观点认为人类数据并不是越多越好,很多人类数据其实并不直达的学习。他们更倾向于搭建一个世界模型以及评价标准相当于给系统设置了一个基本框架。这与小鹏和特斯拉的海量数据驱动系统升级似乎有矛盾。不着急评价谁对谁错,让子弹再飞一会。
暂且抛下自动驾驶的星辰大海,去激光雷达给小鹏带来的显性效果立竿见影。价格更便宜了,车卖的更多了。对小鹏是好事,毕竟当前的环境下,活下来才有更多可能。或许尝试一段时间之后再重新装上激光雷达也未必,毕竟二者并不矛盾。
小鹏自己认为,去掉激光雷达更多的是技术升维,这是对自身技术的绝对自信。注意,这里有一个核心的细节需要注意。在L2领域,小鹏只是认为现阶段的信息够用,并没有否定激光雷达的价值,在更高级别的L3、L4阶段,小鹏会继续采用激光雷达。这和马斯克有本质的区别。马斯克是完全不认可激光雷达的价值。
看起来,这更像是一个商业选择,并不是单纯的技术对立。接下来,小鹏需要向外界证明相机能够达到激光雷达相同的效果,甚至超越。特斯拉已经交卷,小鹏也在这条路上加速狂奔,期待好消息。
来源:圆周智行