当友商 All in VLA，华为为何押注 WA？智能驾驶“分水岭”来了

摘要：当理想、小鹏等车企纷纷押注VLA（视觉-语言-动作模型）技术时，行业巨头华为却选择另辟蹊径，坚决放弃 VLA 技术路线，转而深耕WA（世界模型）技术。

汽车科技 I 渝码科技

在智能驾驶的道路上，一场关乎技术路线的重大抉择正在上演。

当理想、小鹏等车企纷纷押注 VLA（视觉-语言-动作模型）技术时，行业巨头华为却选择另辟蹊径，坚决放弃 VLA 技术路线，转而深耕 WA（世界模型）技术。

因而，有关人士指出，华为的此项决策不仅让整个行业为之瞩目，更预示着智能驾驶领域可能已经到了一个关键的“分水岭”。

VLA：看似“取巧”的路线

VLA 技术的核心思路是将摄像头、激光雷达等传感器采集到的视觉信息先“翻译”成语言描述，再通过大语言模型（LM）理解环境、生成驾驶决策，最终控制车辆行动。

这种路径的优势在于可以借助相对成熟的语言大模型，实现快速迭代和短期内的能力提升。而友商纷纷押注 VLA 技术，看中的正是其在短期内能够带来的快速进步和市场竞争力。

然而，VLA 技术也存在明显的局限性。语言模型虽然在处理语言信息方面表现出色，但在处理复杂的视觉和动作信息时，可能会出现信息丢失或理解偏差的问题。

同时，VLA 技术依赖于大量的语言数据进行训练，这可能导致在面对新的、未见过的场景时，无法做出准确的决策。

此外，VLA 技术的多模态融合过程相对复杂，需要在语言和视觉之间进行多次转换，明显增加了计算成本，还可能导致延迟问题，进而影响驾驶的安全性和可靠性。

华为的 WA 选择：回归驾驶本质

华为智能汽车解决方案 BU CEO 靳玉志在上海媒体日上明确表态，VLA 看似“取巧”，通过将视频信息转化为语言 token 进行训练，再变成 action，控制车的运动轨迹，但这并非实现真正自动驾驶的最终方案。

华为选择的WA （World Action）则是一条更直接、也更难的道路：其核心是让车辆像经验丰富的“老司机”一样，直接通过视觉、声音、触觉等多维度信息输入，实时理解世界并做出驾驶行为，省去“语言翻译”这一中间环节。

基于 WA 架构，华为已推出了 WEWA 模型（云端世界引擎 World Engine+车端世界行为模型 World Action）,并将在下一代 ADS 4.0 系统中部署。

尽管 WA 技术难度更大，但它能最终实现真正的自动驾驶。

华为的 WA 技术路线也得到了其长期投入的验证。

截止 2025 年 7 月，搭载华为乾崑智驾的车辆已超过 100 万辆，激光雷达发货量超 100 万台，累计辅助驾驶里程突破 40 亿公里。

积累的海量数据证明了华为在智能驾驶领域的技术实力，也为 WA 技术的发展提供了支撑。

智能驾驶的“分水岭”

面向未来，华为已制定了清晰的自动驾驶推进时间表：

2026 年：实现高速 L3 级自动驾驶能力，并在城区进行 L4 级自动驾驶试点。

2027 年：开展无人干线物流试点，并实现城区 L4 级自动驾驶规模化商用。

2028 年：争取实现无人干线物流规模化商用。

这场技术路线之争，最终将由市场与用户体验给出答案，或将成为智能驾驶的“分水岭”。

来源：渝码科技一点号

标签：华为智能友商 wa vla

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!