摘要:蔚来 NOMI GPT、小鹏 AI 天玑、理想 Mind GPT 等产品,本质上都是基于 LLM 的对话能力延伸。这种「暴力美学」式创新虽然带来了交互体验的显著提升,但似乎眼下还并没有突破「聊天机器人」的功能边界。
当 ChatGPT 在 2022 年底点燃全球 AI 革命时,汽车产业敏锐捕捉到了大模型对智能座舱的重构机遇。
这场始于语言理解能力突破的技术变革,正在经历从通用大模型到垂域智能体的关键跃迁。
这场技术进化遵循着清晰的路径演化,其发展轨迹可概括为两个关键阶段:
第一阶段以通用大模型上车为标志,车企纷纷将云端大模型作为智能座舱的「技术名片」。
蔚来 NOMI GPT、小鹏 AI 天玑、理想 Mind GPT 等产品,本质上都是基于 LLM 的对话能力延伸。这种「暴力美学」式创新虽然带来了交互体验的显著提升,但似乎眼下还并没有突破「聊天机器人」的功能边界。
第二阶段则指向端到端的全栈智能化,华为鸿蒙座舱的布局展现出独特洞察。
与多数车企聚焦大模型接入不同,鸿蒙座舱选择纵向打通硬件层与应用生态——其最新发布的 MoLA(Mixture of Large Model Agent)架构,将多模态感知、通用大模型、垂域智能体进行有机融合,构建起从用户意图理解到车辆硬件执行的完整链路。
这一架构创新不仅解决了传统分层架构的响应延迟问题,更通过系统级 Agent 实现了跨域协同的智能化跃升。
这种硬件-软件-生态的全栈能力,正在重新定义智能座舱的竞争维度。
1、车企大模型战局:从「能力补齐」到「生态卡位」
随着 DeepSeek 的全民爆火,智能汽车在大模型领域的暗战也悄然浮出水面,并加速向「移动智能空间」进化。
今年年初,DeepSeek 的横空出世引发行业剧变,据不完全统计,比亚迪、广汽、长安等约 20 家车企已官宣接入这一技术,其中智能座舱的人机交互成为首个落地场景,这意味着车企对座舱升级的战略重视。
不过,当前车企的大模型应用普遍面临「技术悬浮」困境。虽然 DeepSeek 为车企提供了基础的语音服务和聊天机器人(Chatbot)的能力,智能化水平得到提升,但其实很多应用只是基于手机体验的简单移植,在车端场景下能起作用的价值仍然有限。
例如,对于规划行程,目前的通用大模型也只是做了一个类似小红书攻略的「搜索和推荐」,并不能结合用户实际的爱好、导航情况、车辆状态、补能计划等做出定制化推荐。
这种「最后一公里」的割裂感暴露了通用大模型的局限:在车载场景中,大部分用户需求都具有强垂域特征,需要融合车辆数据、地理信息、用户习惯等专有知识。
正如华为车 BU CTO 卞红林在生态大会上直言:「语音只是入口,真正的智能依赖垂域 Agent 的深耕。」
现阶段,行业正处于技术融合的过渡期,垂域 Agent 尚未实现完全的系统整合。
从实践来看,采用类似华为 MoLA 的混合架构更为可行——通过多 Agent 协同机制,在导航、车控等关键场景中,发挥对车辆数据的精准处理能力以及在跨域语义理解上的优势。
这种架构演进路径,本质上是在技术理想与工程现实之间寻找平衡点。
华为发布的 MoLA 架构,其技术创新体现在多个核心要素的有机整合:
作为调度中枢的 System Agent,通过实时分析用户意图、车辆状态和环境信息,动态调用 Agent 组合。例如在"车内太闷"的场景中,需并行触发天窗开启、空气净化和路径规划等多个服务模块。通用大模型基座则承担跨领域语义理解和讯息联网检索、百科问答等任务,将模糊指令映射为具体场景需求。当用户提出「找个能看日落的地方」,模型需识别出导航与景点推荐的双重需求,并触发相应 Agent 协作。垂域 Agent 集群覆盖导航、车控、多媒体等核心场景,每个 Agent 都集成了行业知识库与专用模型/大模型,为细分的场景化领域提供更深层的智能服务。记忆模块实现跨会话状态保持,持续优化服务策略,例如记录用户对空调 26℃的偏好,或在冬季自动推荐开启座椅加热。这种架构与行业热议的多智能体系统(Multi Agent System,MAS)不谋而合。
仅仅依托通用大模型难以应对车载场景的复杂性——例如,用户说「我想看《甄嬛传》滴血认亲那一集」,很可能只是拉起对话框实现了《甄嬛传》剧情梗概的介绍描述,而无法拉起视频应用并播放相应的剧集。再比如,用户一句「我有点冷,也有点困」,除了需要精准理解用户表达的意思之外,还需要同时调用车控 Agent(调高空调温度)和导航 Agent(寻找附近休息站)去完成操作上的闭环。
而 MoLA 通过 Agent 分工协作,结合车辆硬件状态与用户习惯,能提供更精准的服务。
行业 Know-How是认知根基:智能汽车的核心竞争力在于对座舱场景的精细化理解,脱离场景认知的 Agent 仅是通用技术堆砌,无法解决真实问题。而精细化理解,或者说领域知识的沉淀本质来源于产品化。只有通过产品实践,才能定义数据埋点、获取高质量反馈,进而驱动算法优化。基于车辆智能化部件产品的落地与商用,将车辆数万个信号参数转化为可理解的语义标签,才能诞生出根据地理位置、驾驶模式、乘员状态等动态调整策略的深层智能。算法能力决定知识到技术的工程转化:行业 Know-How 需通过算法实现技术落地。垂域 Agent 依赖多模态感知、小样本学习、强化学习等前沿技术支撑。同时算法也需平衡精度与效率,同时实现动态环境下的鲁棒性。构建多模态感知-任务分解-决策闭环,包括对用户肢体语言的视觉识别、语音指令的意图消歧、车辆功能或应用的调用等;数据闭环是算法持续演进的基础:依托车云协同,通过产品端埋点(如部件日志、设备传感器)、用户反馈构建全链路数据管道,建立数据驱动的闭环迭代机制,在云端实现算法的持续优化。系统级整合发挥1+1>2的价值:深层智能的实现要尽可能避免“拼凑式”技术方案(A 厂商提供大模型、B 厂商提供硬件、C 厂商设计交互),需实现软硬芯-应用-生态的全栈协同,确保多 Agent 协同响应,实现从车辆座舱硬件到开放应用生态的垂直融合。这些能力需要长期的技术积累:华为在通信协议栈、实时操作系统、智能计算、智能终端等领域的技术储备,构成了垂域智能体的完整技术链。特别是在生态整合方面,华为拥有庞大的开发者生态和数量庞大的应用合作伙伴,并打造了“1+8+N”设备生态,手机、智能家居与车机深度打通,手机上朋友分享的用餐地址,可以无缝流转到车机导航。
这正是华为「纵横术」的具象化体现——纵向深耕车辆垂直场景的技术纵深,横向打通人-车-家全域生态的数据经脉。
当行业还在讨论座舱屏幕数量时,华为已着手重构智能汽车的服务范式:不再局限于功能堆砌,而是通过 Agent 矩阵实现服务自进化,让车辆从被动响应转向主动关怀。
这种升维竞争策略,正在重新定义智能座舱的游戏规则。
2、华为的「纵横术」:重新定义智能座舱的游戏规则
当前,智能座舱竞争已从技术单点突破转向系统工程能力较量。
系统工程能力的核心在于需求理解、资源调度与体验交付的闭环协同。
MoLA 架构的价值在于建立了动态映射机制:
在需求理解维度,System Agent 专注于工作流编排与任务分发;在资源调度维度,API Pool 实现跨域资源动态调配;在体验交付维度,硬件能力与场景需求实时适配。这种技术栈贯通能力正在重塑行业格局——基于上述能力,头部玩家通过开放生态接口,将麦克风、游戏手柄等第三方外设纳入服务体系,形成「硬件-软件-服务」闭环,而传统供应商因缺乏生态协同逐渐丧失优势。
在这场系统性能力升级中,华为的实践颇具代表性。
华为将座舱定义为「第三空间」,打破出行、娱乐、办公的界限,是通过纵向打穿技术栈、横向融合全场景,构建繁荣应用生态。
这一概念本质上是通过纵向打穿技术栈、横向融合全场景实现的系统工程能力外化。
纵向:从硬件到应用的全链路配合;南向:既涵盖车载原生硬件(智能座舱显示屏、环绕音响系统等),也通过HSpace-Link协议建立标准化外设接口,与投影、智能遥控器等设备可即插即用;北向:联合一众生态伙伴,定制空间音频、儿童伴读等场景化服务;端到端:MoLA 架构实现视频应用内的融合搜播,把大语言模型、模糊搜索、多媒体播放控制等能力融合,形成了「影视空间」的创新交互体验。这种架构优势在具体场景中得到集中体现。以影音场景为例,HarmonySpace 5 的「影视空间」聚合了4K 双 Vivid 内容、HUAWEI SOUND、以及激光投影,从内容、声学、显示三端构建沉浸式体验。
这个案例通过内容、声学、显示三端协同,正是 API 资源调度与硬件实时适配能力的具象化体现。
这种「软硬服一体化」能力,让单一应用或硬件厂商难以复制。可以说,华为鸿蒙座舱 HarmonySpace 5 的发布,标志着智能座舱竞争进入「生态化」阶段。
当「Agent 覆盖率」取代「语音识别率」成为核心指标,智能座舱竞争正式进入深水区。MoLA 架构揭示的本质规律是:真正的场景智能化不仅需要通用大模型的基础能力,更依赖垂域 Agent 对行业 Know-How 的深度挖掘。
未来竞争的关键,在于如何将分散的硬件、应用、服务整合为有机体——这既考验技术架构的动态调度能力,更取决于生态开放的格局与决心。在这场变革中,能够打通技术栈与生态链的玩家,或将重新定义智能出行的价值标准。
来源:汽车之心Autobit一点号