摘要:火爆的ChatGPT本质上是chatbox,聊天机器人和C端用户的互动不需要百分百的准确,但是企业生产环境能有多少聊天场景,把其他场景全改为chatbox也不现实,幻觉问题更是死穴,企业生产更需要确定性。
一个原生自带幻觉的新技术,能用到企业的生产环境么?起初,这是行业所有人对大模型的疑虑。
火爆的ChatGPT本质上是chatbox,聊天机器人和C端用户的互动不需要百分百的准确,但是企业生产环境能有多少聊天场景,把其他场景全改为chatbox也不现实,幻觉问题更是死穴,企业生产更需要确定性。
当模型层面的问题不再是问题,大模型进入生产场景就有了前提条件。2025年6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型。
结合行业趋势来看,包括字节跳动在内的所有模型厂商都认为,大模型的“死穴”已经尽数消失,而产业正从卷模型转向卷应用,大模型产业的胜负手既在大模型本身,更在于谁能构建一条让Agent进入核心场景的通路。
火山引擎总裁谭待表示,深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。同时,由于Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。
大模型的效果和性价比都很重要,本次大会上,豆包1.6宣布按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
与此同时,大模型要进入企业核心生产场景,还有大量的工程化实践,以及超出Agent本身的工作要做。一年多之前,HiAgent企业级智能体开发平台就推出了第一个版本,如今HiAgent再更新大版本,如何进一步补全企业级Agent的版图,钛媒体App和火山引擎副总裁张鑫聊了聊。
2025年,Agent上生产线元年如果参照互联网,应用繁荣才意味着大模型产业真正的繁荣,没有企业想要拥有一个“互联网”,但所有企业都想拥有互联网化生出的各种能力,这些能力就以软件应用的形式呈现。
大模型产业的蔓延同样有迹可循,从预训练到精调,从算力基础设施到工具链,大模型产业行至应用层是一种必然,相比于又厚又重的底层基础设施,上层应用是一条更好、更快拥抱新技术的路径。此外,自上而下由业务到技术的驱动模式,企业也往往更愿意为看得见的价值付费。
火山引擎的认知也经历了变化,张鑫谈到,早期火山引擎看到,应用效果很大程度由大模型本身决定,所以字节跳动加大基础模型的投入,想通过好的模型让大家能够更容易地构建出好的应用。
之后火山引擎发现,有了好的模型并不和应用直接画等号,中间有一系列工程化实践,从提示词工程到知识库到工作流等,火山引擎要提供一个足够好的智能体的开发平台,要把新技术的链路补全,扣子和HiAgent这样的平台随之诞生。
一年多之前,张鑫发布了HiAgent第一个版本。当时聊大模型的算力、算法、Token的很多,聊Agent的人不多,只有一小部分企业选择开始使用HiAgent。随后大模型演变比大多数人预料的还要快速且剧烈,似乎之前的问题已经不是问题。
“2025年是Agent元年”,几乎所有人都这么说,但问题是,Agent元年是什么样的?在张鑫看来,Agent元年是一个乐观的预期,智能体可能会“遍地开花”,但智能体爆发需要在几个不同维度都达到临界点。
例如技术临界点,大模型能力的上限,决定了智能体应用效果的下限,今天的大模型已经达到博士生的水平;在商业和生态的角度,智能体最大的一个变化是使用工具,不管是通过MCP,还是谷歌提出的A2A协议,真正能够把智能体的价值放大,还需要生态体系更加完善。
“大模型商业模式至今也分了几个阶段,初级阶段卖算力,收费单位是卡时,下一个阶段按token收费, 其实是在算力基础上叠加了一部分大模型能力,再到下一个阶段是按使用量或者按订阅制来收费,但最终智能体要在元年爆发,我认为应该按效果、按价值收费,比如营销额外产生了多少收益,节省了多少成本。”张鑫说。
一个新的共识是,上一轮所有的应用都会被AI重构。
咨询机构IDC预计,2025年生成式AI在企业的落地仍将优先聚集在办公助手等提升生产力的场景,其次是行业垂直业务场景。金融、能源、零售、制造是最值得关注的传统行业。从另一个角度,智能体将是大模型应用的重要方向,流程自动化,RPA,CRM,数字员工将优先受益于智能体升级。
从企业视角观察,大体路径先是企业研发、生产、供应链、销售服务等环节所依赖的软件、硬件工具,都通过AI不断迭代升级;未来全面AI化的企业,将发生业务流程、商业模式乃至组织形态的变化。
“有通用大模型,但很难有通用智能体,智能体非常依赖于场景,”张鑫说。面对一个完全陌生的新技术,哪怕它具有足够的革命性、足够的势能,开端总是磕磕绊绊且不尽如人意的。这些现象背后的本质问题包括了模型能力边界的探索、To B场景的复杂多变、工程最佳实践的缺乏,以及数据知识质量参差不齐等。
目前企业客户认知存在两个极端,企业高层大多高估AI Agent,一线人员则很容易低估AI Agent,同时很多企业把AI Agent当作传统的软件工程,交付验收即结束,但是企业的业务场景在变,数据在变,领域知识在变,智能体和真人一样需要不断地学习和调教,AI Agent不是一次搭建的静态结果,而是持续调优的动态过程。
此外,某种意义上,在大模型产业和技术尚不成熟的阶段,企业要真正发挥新技术价值,需要付出的精力并不比技术服务商少,从0到1、从无到有的拓荒,只有企业本身才能实现。对比之下,互联网产业分工明确,是因为产业基础尽数具备,技术供应商只需完成“最后一公里”的服务,大模型生态还早得很。
跳出Agent,才能做好Agent大模型的演化有一个特点,在技术发展的极早期,大部分技术都没到成熟的稳定态,所以大模型的优化必须做端到端的把控,典型代表就是现在还留在大模型牌桌的厂商,从底层芯片到云基础设施到大模型本身,都不能有短板。
如前所述,企业Agent的技术栈同样不成熟,这就要求技术服务商向前一步,做更多端到端的服务。
对于当下智能体开发平台的启示是,企业不愿意为工具付费,但愿意为结果付费,想做好企业级Agent,不能只做一个应用开发平台,而是沿着企业Agent的链条延展,最大程度降低企业的门槛、提高企业Agent的价值。
如果大模型是纵向的端到端,那么,AI Agent更像是另一个横向的端到端,当然,大模型的纵向能力也可以引入其中。
火山引擎也看到了企业的顾虑,张鑫将HiAgent智能体构建平台本次大版本的更新,定义为“上下左右”的迭代,核心是基于Agent DevOps理念,HiAgent提供策略规划、能力开发、评测、发布、观测、优化全生命周期管理,实现从模型到应用的全链路打通。
具体来看,向右意味着开发和运营一体化,智能体不是一次开发的交付,而是一个数据不断产生、经验不断积累、知识不断丰富的过程,因此Agent需要持续运营,HiAgent从原来智能体开发加上了智能体运营, 包括评估评测、应用发布、线上观测、会话管理、品质调优、数据回流等一系列全生命周期管理。
火山引擎副总裁 张鑫
类比云原生的DevOps理念,将开发(Dev)、运维(Ops)和测试(Test)等团队紧密结合,通过自动化流程和工具链的整合,实现软件从开发到运维的快速、高效交付。DevOps不仅仅是开发团队和运维团队的结合,而是涵盖了从需求分析、产品设计、开发、测试、部署到运维的全过程协作。
向上,除了智能体开发平台以外,很多企业还是要面临“最后一公里”的问题,火山引擎也提供了行业样板间和模板库,面向常见的一些场景,包括客服、营销、招聘、办公类等,进一步细分成教育行业、医疗行业、金融行业等。“如果说智能体开发是从0到1,有了模板以后企业就从0.8到1,企业可以基于模板补充符合自己需求的最后20%,小修小改就能快速完成。”张鑫说。
向下则是模应一体,模型和应用一体,除了提示词工程、知识库,大模型能力本身就是应用能力很重要来源。很多行业免不了要做自己的模型,把通用模型通过精调、强化学习,甚至通过精蒸馏达到一个非常专业的领域模型成都,然后再基于它做上层的智能机搭建,以期实现更好的效果。
在HiAgent 新版本中,智能体效果的深度优化可以下钻到模型层。HiAgent 2.0 融合一站式模型训推平台,提供模型后训练以及多模型的管理和评测,从数据标注到参数调优,让专业开发者能针对行业场景定制专属模型,告别‘通用模型水土不服’的痛点;同时,HiAgent 2.0提供私有化部署引擎,让推理服务嵌入企业内网,数据不出企业防火墙,既满足合规要求,又能在工厂、银行等网络敏感环境中稳定运行。
向左,一个统一的智能体入口。张鑫表示,跟企业合作多了以后就会发现,大家会遇到一个共同问题,基于HiAgent确实可以很方便地创建智能体,企业员工群策群力,一个企业内部往往会有几百个不同的智能体,但是所有智能体的使用非常零散,所有智能体分布在不同的入口。
这时企业就需要统一的交互入口,让员工可以在日常工作中更容易地和智能体协作,同时沉淀更多企业用户数据和偏好记忆。HiAgent 2.0就发布了这样一个Canvas统一交互门户,在HiAgent上搭建的智能体可以直接发布到Canvas门户,员工与多智能体可以通过“千人千面”的动态“画布卡片”的方式,协同作业。HiAgent通过闭环智能体从搭建到使用的链路,可以让企业更容易地使用多个智能体,让“数字员工”真正融入到日常业务中,更好推动业务的AI转型。
张鑫表示,“飞书和钉钉本质上更多解决了人人协同的问题,和飞书和钉钉不一样,火山引擎更想成为解决人机协同的入口,这个入口专属于一个用户,甚至可以千人千面的呈现,研发、销售和管理人员看到的界面都不同,通过这个入口可以唤醒几十个甚至上百个自己的专属智能体。”
他还提到,互联网应用看重流量和生态能力,类比到企业领域,企业内部智能体一定不是孤立存在,新技术和老技术有相对长的共存期,企业内部已有的CRM、OA以及API、各种算法等工具还是会存在的,如何让智能体更好和企业已有系统打通,火山引擎也希望通过统一端能够完成,比如存量系统是否可以通过工具的形式发布到HiAgent平台,让智能体可以自由调动,这也是HiAgent要做端到端的核心之一。
Agent繁荣,大模型才是真繁荣除了负责火山引擎企业级智能体开发平台之外,字节跳动的智能体开发平台,还有更被开发者和普通用户所熟知的扣子,有了扣子,为什么字节跳动还要做HiAgent?
“在字节内部,我们特别不提倡内卷。”张鑫一言以蔽之。
从本质上看,扣子的产品确实在企业业务市场有需求,从客户视角看,扣子有自己的定位,面向开发者和C端用户,追求开发者的广度和深度。此外,企业级客户,尤其是大型客户的“人事物”更复杂,需求也更个性化,需要HiAgent这样的平台来满足。
但是扣子和HiAgent也算“同出一门”,两大产品之间既有交叉的部分,譬如智能体开发的通用能力未来也会做到复用,类似低代码、写提示词、做自动优化、工作流编排、知识库建设等。不交叉的部分两边会各自投入大的资源,HiAgent的投入就是企业级客户的所需。
简而言之,扣子和HiAgent走出了差异化的路径,但共同目标都是大模型产业的繁荣,前者聚焦于低门槛、场景化的智能体搭建平台,赋能个体开发者和中小企业快速落地AI应用;后者则深耕企业级复杂流程自动化与深度集成,为大型组织提供端到端的高可靠智能解决方案。
结合行业来看,企业市场的Agent有时会滞后于消费市场,但是在垂直领域的纵深要远远超过消费级应用。例如某企业基于其他开源平台开发了Agent并应用于生产系统,但是并发只能做到200个,远远低于该企业所需,改换HiAgent之后才满足了生产环境的大规模并发。
更有趣的是,比如在企业AI工作台,用户想总结一个会议,此时企业没有会议总结助手,AI工作台就会自动调用一个特殊的工具HiAgent-Browser-Use,像manus那样在线用HiAgent搭建出一个会议总结助手智能体,搭建完成后自动注册成超级App背后的子智能体并执行会议总结,然后把结果渲染到画布上。这就好像是,HiAgent能让Agent自我繁衍了,一个更高阶的Agent创建了新的Agent。
这也表明,HiAgent不只是一个开发工具,甚至不只是一个平台产品,越来越多的客户把HiAgent视为一个完整的AI能力中心,有别于以往的软件应用,HiAgent沉淀了客户的数据和知识,云基础设施、大模型、中间件等产品和服务都是过程,最终交付给企业的AI能力,这应当是AI Agent之于企业的意义。
张鑫还记得,广州公交集团的数字人,在内部居然有了自己的工号,在合同审核、车辆维修等多个领域持证上岗,且有自己的考评体系,硅基员工似乎真的成了企业生产环境的一部分,这也是他眼中Agent上生产线的实证。
基于行业视角观察,张鑫认为,现在还是智能体开发平台的发散阶段,就像早期模型架构不统一的“百模大战”,最终MoE架构成为主流,大模型玩家自此收敛。目前Agent的标准也并不统一,缺少公认的Agent成熟度体系,所有人都认可Agent的战略方向,只是在落地和关键能力上有所不同。
火山引擎认为,除了开发平台以外,还有几个关键因素,首先是模型的能力,其次是极致的推理性价比,因此字节跳动在豆包大模型本身的投入上不遗余力,更注重自身模型的效果。同时在AI推理能力上,火山方舟加大更多投入,让Agent跑起来的时候性价比更高,这也是未来Agent繁荣很重要的一个因素。
基于云计算的软件开发模式已经成为主流,但是开发者使用容器等理念反而减少了对云厂商的依赖,张鑫在加入字节跳动之前,曾在谷歌深度参与K8s的开发,之后回国创立才云科技,亲历了云计算时代的软件开发。
“K8s让应用太容易迁移,这是开源的胜利,我们曾在谷歌内部开玩笑说,某种程度它反而有损于公有云厂商的价值,因为开发者可以将应用迁移到任何合适的环境,但是Agent可能不一样”张鑫表示。
在他看来,对企业或者开发者来说,Agent真正的黏性在于更具性价比的全栈基础设施,以及越用越好用的数据沉淀。
“Agent更依赖于基础设施,就像DeepSeek出来之后各家的推理成本差距很大,很多云厂商托管的DeepSeek服务也不可用,火山引擎提供了更好的服务。另外,Agent天然对用户有黏性,因为它有长期记忆,用户使用同一个平台,用同一个产品构建了Agent以后,用得越多Agent越好用,数据可能是以长期记忆或者知识库的形式存在,这些知识和数据没有办法带走的话,Agent的效果也会大打折扣。”
来源:钛媒体