摘要:不同于市场普遍认为的2025年将是应用落地的超级大年,个人认为目前所见的应用范式仍然是AI基建过程中基于模型能力的较为低垂的果实(包括老黄在CES上提到的客服/广告/写代码)。换言之,一个新模型能力出现解锁一个新应用场景(模型即应用)的业态并未发生真正意义上的
#我们或仍处于AI的大基建时代
1、不同于市场普遍认为的2025年将是应用落地的超级大年,个人认为目前所见的应用范式仍然是AI基建过程中基于模型能力的较为低垂的果实(包括老黄在CES上提到的客服/广告/写代码)。换言之,一个新模型能力出现解锁一个新应用场景(模型即应用)的业态并未发生真正意义上的改变,我们还没有等到能将各式模型能力融合到一起的“无限手套”
2、真正意义上的科技革命,理应会诞生新的超级入口。然而,当前即使拥有3亿WAU的ChatGPT也无法阻挡Sonnet 3.5在开发者侧过去半年的市场份额蚕食,截至2024年国内外势头最强劲的玩家也依然还是BATT、Mega7等上一代移动互联网时代的巨头(期待Deepseek继续发力),包括我们看好的字节豆包,其看好的出发点更多也是出于产品能力和商业推广的维度,而并非模型能力和应用形态的创新
3、因此,在尚未出现变革性的应用创新前,我们仍处于基座大模型、大算力集群主导的AI基建时代。模型侧我们今年关注o1/o3为代表的推理模型(Test-time Compute降本降延时、RFT在垂直行业中应用)、NVIDIA Cosmos为代表的世界模型(为自动驾驶、机器人等领域提供合成数据)、以及新维度的模型能力涌现(原生的记忆能力、复杂视觉推理能力)。算力侧我们关注ASIC与GPU的再平衡(各家ASIC芯片的研发/部署情况)、芯片间大规模互联带来的技术变化(AEC、CPO、硅光)、以及集群/机柜功率增大后带来的电气结构变化(高功率电力设备、备用/灾备电源、HVDC、小型核电站)
#大模型真正的壁垒还未形成
4、回顾2024年,基座模型在MoE、Long Context、KV Cache压缩等领域取得了长足的进步,并诞生了视频生成模型、代码/数学模型和o系列复杂推理模型。但总体而言,模型能力进步的速度和头部模型公司的领先优势并未达到我的预期。相反,大模型API的商品化趋势愈发明显(国内从5月开始爆发价格战、DeepSeek将模型成本降至新低)、预训练的Scaling Law撞墙等负面观点日益增多(零一万物正式放弃大规模训练、海外的Mistral也在传被收购)
5、尽管基座模型的格局快速出清,但仅从的巨头们似乎也没有从这场巨额资本投入的绞肉机中卷出显著的竞争优势,OpenAI在24年下半年肉眼可见的在代码生成和轻量化领域被Sonnet 3.5和Gemini 2.0 Flash赶超,国内也有豆包通过低价+投流的打法成功复制了年初Kimi的用户增长模式。造成这一局面的根本原因还是因为LLMs不同于过去的微信、抖音等入口拥有的用户数据飞轮、网络效应,其用户交互数据难以对模型训练形成有效的反哺,大模型先天也不具备社交属性,这使得移动互联网时代的壁垒在大模型时代难以延续
6、个人认为大模型形成壁垒有两个模糊正确的路径:个性化、OS化。个性化壁垒的形成基于用户个人数据与模型的深度融合,体现出千人千面的特点,这一观点最早由杨植麟在去年2月提出。然而,遗憾的是Kimi未能实现这一愿景,究其原因我认为在于用户与模型的交互场景仍然非常有限(仅靠AI搜索远远不够),无法全面收集用户的偏好数据。这也是我看好各种端侧智能硬件(如AI玩具、AI眼镜等)的原因,它们能够拓展更多用户与AI的交互场景。OS化则是一个较为缓慢的过程,不过我们已看到像Anthropic这样的公司开始布局Compute Use(可操作电脑的GUI Agent)和MCP协议(将大模型与外部数据源深度连接的标准化协议),围绕开发者心智和生态系统的竞争已经打响
#Agent的第一个元年正式开启
7、AI Agent在2025年的应用领域中无疑将成为核心主角(实际上在过去两年中也已反复讨论)。但随着模型在代码生成、多步规划、多模态理解及记忆等能力上的逐步提升,许多此前仅作为概念存在的应用场景正逐渐变为现实,其中最具代表性的便是Coding Agent。在过去一年中,Coding作为具有高度产品市场契合度(PMF)的垂直领域,已经完整经历了从代码片段生成(ChatGPT)到代码向下补全(GitHub Copilot),再到代码全局生成(Cursor)以及自主代码生成(Devin)的演进过程
8、尽管以Devin为代表的全自主Coding Agent在实际使用过程中仍面临诸多问题,其500美元/月的定价也可能被认为名不副实,但我认为Devin的出现类似于去年1月我们在CES上看到的Rabbit R1(一款GUI Agent智能硬件),它虽然现在还不够强大但却很好的揭示了未来Agent的发展方向:执行长任务步骤(支持异步交互体验而非当前的一问一答模式)、部署在云端虚拟机(避免因操作中断而影响任务执行)、具有学习和记忆模块(能够动态适应任务内容并不断优化表现)、低于人工成本(Devin每小时费仅8美金,是加州最低工资标准的一半)
9、除Coding Agent外,GUI Agent我认为是未来最具话题性的2C场景之一,这是因为需求端它的用户受众最大(理论上所有用手机电脑的人都是潜在客群),供给端所有的玩家都在涌入(手机厂商/模型公司/应用公司);在2B场景中,我最为期待以Agentforce为代表的Workflow Agent,这类产品有望带动商业模式上的重大创新,即将过去企服软件业务纯项目制的商业模式转化为“前期深度定制按项目制收费+后续按调用量SaaS化收费”的新模式,兼具定制化带来的客户绑定关系和SaaS化的持续收费能力。在这一趋势下,已积极布局Agent功能的手机厂商(苹果、小米等)和美股企服SaaS公司(CRM、NOW等)及其相关映射值得我们重点关注
来源:全产业链研究