摘要:当理想、小鹏等车企纷纷押注VLA(视觉-语言-动作模型)技术时,行业巨头华为却选择另辟蹊径,坚决放弃 VLA 技术路线,转而深耕WA(世界模型)技术。
汽车科技 I 渝码科技
在智能驾驶的道路上,一场关乎技术路线的重大抉择正在上演。
当理想、小鹏等车企纷纷押注 VLA(视觉-语言-动作模型)技术时,行业巨头华为却选择另辟蹊径,坚决放弃 VLA 技术路线,转而深耕 WA(世界模型)技术。
因而,有关人士指出,华为的此项决策不仅让整个行业为之瞩目,更预示着智能驾驶领域可能已经到了一个关键的“分水岭”。
VLA:看似“取巧”的路线
VLA 技术的核心思路是将摄像头、激光雷达等传感器采集到的视觉信息先“翻译”成语言描述,再通过大语言模型 (LM)理解环境、生成驾驶决策,最终控制车辆行动。
这种路径的优势在于可以借助相对成熟的语言大模型,实现快速迭代和短期内的能力提升。而友商纷纷押注 VLA 技术,看中的正是其在短期内能够带来的快速进步和市场竞争力。
然而,VLA 技术也存在明显的局限性。语言模型虽然在处理语言信息方面表现出色,但在处理复杂的视觉和动作信息时,可能会出现信息丢失或理解偏差的问题。
同时,VLA 技术依赖于大量的语言数据进行训练,这可能导致在面对新的、未见过的场景时,无法做出准确的决策。
此外,VLA 技术的多模态融合过程相对复杂,需要在语言和视觉之间进行多次转换,明显增加了计算成本,还可能导致延迟问题,进而影响驾驶的安全性和可靠性。
华为的 WA 选择:回归驾驶本质
华为智能汽车解决方案 BU CEO 靳玉志在上海媒体日上明确表态,VLA 看似“取巧”,通过将视频信息转化为语言 token 进行训练,再变成 action,控制车的运动轨迹,但这并非实现真正自动驾驶的最终方案。
华为选择的WA (World Action)则是一条更直接、也更难的道路:其核心是让车辆像经验丰富的“老司机”一样,直接通过视觉、声音、触觉等多维度信息输入,实时理解世界并做出驾驶行为,省去“语言翻译”这一中间环节。
基于 WA 架构,华为已推出了 WEWA 模型(云端世界引擎 World Engine+车端世界行为模型 World Action),并将在下一代 ADS 4.0 系统中部署。
尽管 WA 技术难度更大,但它能最终实现真正的自动驾驶。
华为的 WA 技术路线也得到了其长期投入的验证。
截止 2025 年 7 月,搭载华为乾崑智驾的车辆已超过 100 万辆,激光雷达发货量超 100 万台,累计辅助驾驶里程突破 40 亿公里。
积累的海量数据证明了华为在智能驾驶领域的技术实力,也为 WA 技术的发展提供了支撑。
智能驾驶的“分水岭”
面向未来,华为已制定了清晰的自动驾驶推进时间表:
2026 年:实现高速 L3 级自动驾驶能力,并在城区进行 L4 级自动驾驶试点。
2027 年:开展无人干线物流试点,并实现城区 L4 级自动驾驶规模化商用。
2028 年:争取实现无人干线物流规模化商用。
这场技术路线之争,最终将由市场与用户体验给出答案,或将成为智能驾驶的“分水岭”。
来源:渝码科技一点号