百度智能云升级千帆:云平台战场转向体系能力比拼

360影视 欧美动漫 2025-04-26 11:47 2

摘要:随着大模型迭代加速,AI 应用生态正面临前所未有的压力:越来越多的垂类应用被更强、更通用的模型 “吞噬”。开发者的焦虑感在加剧,企业也开始重新评估开发 AI 应用的投入产出比。

给企业落地大模型打造基础设施。

随着大模型迭代加速,AI 应用生态正面临前所未有的压力:越来越多的垂类应用被更强、更通用的模型 “吞噬”。开发者的焦虑感在加剧,企业也开始重新评估开发 AI 应用的投入产出比。

4 月 25 日在武汉举办的 Create 2025 百度 AI 开发者大会上,百度创始人李彦宏回应了这股 “模型焦虑”:大模型快速迭代不会吞掉所有 AI 应用,“只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用不会过时。”

李彦宏展示了百度智能云在交通信控、钢铁行业中的 AI 应用案例,称通用大模型再怎么升级,也不能独立完成 “检测高速公路上各种安全事件” 或者 “检测热轧带钢表面的缺陷” 等精细任务,它们与小模型协同才能产生更好的解决方案。

他认为,大模型能力提升会让这些 AI 应用护城河更深、价值更高,“这样的机会,在千行百业里比比皆是”。市场调研机构 Gartner 估算,到 2029 年,中国 60% 的企业将把 AI 融入主要产品和服务,而这些 AI 功能也会成为企业收入增长的主要动力。

帮企业客户开发大模型应用,是百度智能云近年来收入增长的动力。2024 年,百度智能云收入达到 219 亿元人民币,同比增长 17 %,是百度增速最快的业务线。据统计,今年一季度,百度智能云继续位居国内的大模型中标项目数量和金额第一。

2023 年开始内测的千帆,是百度智能云推动大模型落地企业的核心产品。这次 AI 开发者大会上,百度智能云再次升级千帆大模型平台:

模型开发平台更加多维开放,支持上百个模型服务;新增多模态、深度思考模型工具链,并且成为国内首个把 RFT、GRPO 等领先强化学习方法产品化的平台;“一键蒸馏” 功能,让企业客户更方便地用小参数模型 “学” 到大参数模型,解决特定问题的推理能力,降低推理成本。

数据智能平台上线,让企业把原来散落在各个部门、流程中的数据统一管理和治理,挖掘数据价值,实现数据变现,以及提升业务决策效率。

应用开发平台增加 “智能体 Pro”,让企业客户可以批量开发嵌入到工作场景中的大模型应用,尤其是当前行业中的热门产品形态 Agent,让各行各业定制自己的企业专属智能体;发布完整的 MCP(Model Context Protocol)服务,支持客户和开发者将 MCP Server 接入大模型应用,推出低代码创建 MCP Server 的工具,提供免费托管服务,以及组建聚集上千个 MCP Server 的广场。

MCP 是 Anthropic 在 2024 年提出的协议,用统一的方式,把现有软件变成大模型可以直接调用的 “工具”。“MCP 让 AI 更懂外部世界,更容易获得信息,更自由地调用工具,是 AI 发展的一大步。” 李彦宏说,“现在基于 MCP 开发 Agent ,就像 2010 年开发移动 App。”

百度各业务线也全面支持 MCP,将搜索、地图、文库、电商、网盘等产品能力做成 MCP Server。企业和开发者在千帆平台中可以把它们接入自己的 Agent。

2023 年 3 月,百度在国内率先发布对标 ChatGPT 的文心一言,并推动公司全面向大模型转型。如今,百度正进一步整合内部资源,抓住企业落地大模型的机会。云平台间的大模型企业服务竞争,已从单点技术比拼走向体系化能力角逐。

两年迭代,百度智能云逐步认识到如何开发一款好的企业大模型开发平台:“门槛要足够低,低到人人可用;天花板要足够高,必须有能力服务那些最严肃、要求最苛刻的企业场景。”

这是百度智能云千帆平台的升级目标。“大家有可能用的是同样的基础模型,要做出差异化的体验,靠的是工程能力。” 百度集团执行副总裁、百度智能云事业群总裁沈抖说,企业可以利用千帆 “快速完成从数据处理到模型定制、应用开发的一整套工作,开发出效果更好的产品。”

模型开发平台已上线超过 100 款基础模型,涵盖百度新发布的原生多模态模型文心 4.5 Turbo、深度思考模型文心 X1 Turbo,以及 DeepSeek、阿里等公司开源模型,跨越原生多模态、文本生成、深度推理、图像 / 视频生成、语音大模型等方向。企业客户可通过 API 调用这些模型。

这只是千帆的基础能力。他们还开发了模型工具链,覆盖数据管理、模型精调、评估优化与部署。“虽然从 0 到 1 训练大模型的需求没有那么多了,但企业定制专、精模型的需求还在增长。” 沈抖说。

更新后的模型开发平台上,企业可以拿自己收集的数据集精调平台上的基础模型,让它更好地解决特定场景的问题,也可以用新上线的 “蒸馏” 功能,把大尺寸模型解决特定任务的能力迁移到小模型上。

蒸馏并不是一个全新的功能。百度智能云 AI 与大模型平台总经理忻舟说,在 DeepSeek 推出 R1 前,千帆就可以支持企业用蒸馏的方式开发模型,“一直在做”,R1 加深市场认知,也验证了千帆的判断,加上公司内部业务有需求,蒸馏的价值提升,就推出了 “模型蒸馏样板间标品化产品”。

比如智联招聘使用千帆模型开发平台的模型蒸馏功能,把 6000 多亿参数的 DeepSeek-R1 作为 “教师模型”,蒸馏出它回答 “人岗匹配” 问题的数据集,清理后用它精调百亿参数的 ERNIE Speed 模型,保留效果的同时,将模型使用成本压缩至原来的三成。

忻舟说,这个平台也是一个可以迭代的模型开发体系。很多的 C 端用户使用大模型,不能为厂商提供直接有效的数据,促进基础大模型能力的提升,这个在行业已经形成共识。比如 DeepSeek 发布 R1 前并没有积累太多的用户。

不过企业真实应用场景上,调用大模型解决的都是特定场景问题,所以模型使用反馈对模型的价值都非常大。“千帆模型开发平台可以帮企业利用这些有效反馈,做模型精调并持续改善模型效果,让企业的应用效果越来越好。” 他说。

他们给模型开发平台设计了多种使用模式,以兼容不同的用户。针对开发能力强的企业和开发者,他们提供集成接口,支持本地、云端 IDE,或者命令行使用,并兼容 Python、Go、JS、Java 等多种编程语言。为了进一步降低门槛,他们会提供精调好的行业模型或者提供模型 “样板间”。

企业推动大模型落地的过程中,开发应用是最耗时的环节。百度智能云应用平台部总经理朱广翔说,他们调研发现,许多企业将 90% 的 AI 项目时间花在了应用开发上。

尤其是 DeepSeek-R1、文心 X1 等深度思考模型出现,让 Agent 解决复杂问题的能力增强,但开发难度也跟着上升。

在开发者大会上,沈抖用 “大工程” 形容 Agent 开发过程。他们调研发现,企业想要做好 Agent 要具备以下能力:

结合企业自己的私域数据、企业知识库,让 Agent 学习企业多年沉淀的行业经验,理解业务场景。

准确匹配到企业的标准 SOP,能根据企业规范编排业务流程、执行任务。

调用各种工具,解决复杂问题;同时还得达到企业级服务要求的安全性、稳定性、可控性。

千帆应用开发平台推出了智能体 Pro,用户只需要输入提示词,上传需要调用的知识库,选择特定的组件,比如 Deep Research,就能迅速创建一个像行业内 Deep Research 应用那样的 Agent。而且它不仅可以像其他的 Deep Research 那样搜索公开资料,也可以调用企业内部的数据库,整合后生成报告。

企业和开发者过去常用 RAG(检索增强生成)功能,让大模型根据特定的知识库回答问题,从而提高解题能力。随着智能体 Pro 推出,千帆也把它升级成 Agentic RAG。

朱广翔举例,销售要去找游乐园谈合作,想用公司开发的 Agent 推荐方案,传统的 RAG 会把关键词做向量化,然后用这些特征匹配知识库,如果公司没有跟游乐园合作过,可能什么都没有;而 Agentic RAG 具备思考能力,它会先拆解用户的需求,知识库中没有完全匹配项,它也会找相似的方案,然后整合出一个答案。

用智能体 Pro 降低企业开发大模型应用门槛的同时,千帆也全面支持 MCP,提升 Agent 价值。朱广翔说,百度智能云是第一家支持 MCP 的云平台,从 3 月到现在搭建起了一套完整的 MCP 服务,支持企业的 Agent 接入 MCP,还开发低代码制作 MCP Server 的工具,提供免费托管服务。

他们收集整理了行业内公开的优质 MCP Server,与百度开发的图像识别、OCR、语音识别、语音合成等 AI 工具,百度智能云长期积累的能源电力、智能交通等垂直行业的工具,以及百度 AI 搜索、地图、电商、网盘、百科等核心业务聚集到一起,组建超过上千个 MCP Server 广场。他说,利用这些 MCP 组件,企业可以不断给 Agent 增加各种技能,让它们持续成长,变成一个个行业专家。

与模型开发平台类似,千帆的应用开发平台也准备了 “样板间”,降低企业的使用门槛。他们也把新功能与无代码开发工具 “秒哒” 打通,让企业一站式开发 AI 产品。

数据智能平台是千帆新上线的服务。百度智能云数据平台部总经理刘斌说,他们调查发现,企业训练模型、开发应用的过程中,50~80% 时间都花在了在数据治理上。

尤其在多模态模型能力不断增强的当下,企业同时面临文本、图像、语音、视频等多模态数据的治理难题,而现有工具和流程仍以人工为主,协作复杂、自动化程度低,安全也难以保障。

“拉高的不只是机器和人力成本,还有机会成本,这对企业来说损失更大。” 刘斌说,企业用好大模型,数据工程是与算力、模型同样重要的基础设施,“但多模态数据治理还停留在农耕时代”。

据介绍,数据智能平台具备多模态数据管理、多模态数据处理、弹性 AI 计算、统一在线协同开发四项核心能力:5 大类算子 100+,支持抽取、清洗、过滤、去重、嵌入等数据处理主要环节,覆盖文档、图像、语音、音频等所有模态,大部分场景下只需通过少量配置,就可完成数据处理;很好支持 GPU+CPU 的混合计算,强弹性可以用来高效处理不同规模的数据;跨团队协作能力让大规模开发变成可能。

这一平台的首位客户,正是百度自己。刘斌说,数据智能平台是百度内部长期使用的数据工具的产品化版本,支撑了文心 4.5 及其升级版 Turbo 的训练,解决了数据冗余、不一致、精细管理缺失等难题,让数据生产效率提升六倍,算力成本节省 30%,而且 “数据安全可共享、可审计”。

在百度智能云看来,随着大模型与 AI 原生应用加速渗透产业核心场景,企业在数据管理方面的需求会持续增长,数据工程也会越来越重要。“未来多模态的数据体量会有 10 倍以上增长空间。” 刘斌说,“这是政企客户的刚需。”

千帆的诞生和迭代,是百度全面转型大模型的产物。

朱广翔说,大模型浪潮到来后,百度的各个业务快速接入大模型,“开发了一大堆应用”,覆盖问答、客服、创作、代码执行等各种场景,他们从中提炼不同团队开发大模型应用或功能的共性,做出千帆应用开发平台——模型开发平台也是类似的过程。

把公司内部技术对外开放,是大型云计算平台开发产品的惯用逻辑。AWS 的第一款产品是亚马逊电商网站的商品数据库,火山引擎早期最成功的产品是字节的推荐算法服务。

在忻舟看来,基于公司内部的技术积累迅速推出新产品,“只是短期优势”。传统的企业客户,业务流程相对稳定,没有那么容易接纳新技术,“效果只是企业考虑的因素之一,他们同样在意性能和成本”。

想抓住企业落地大模型的机会,云平台不仅要有各种类型的领先模型,还要理解企业的真实需求,并提供低成本的方案。

百度云计算业务从 2015 年正式对外运营,后更名为 “百度智能云”,一直有着 AI 云的鲜明标签。据市场调研机构 IDC 统计,截至 2023 年,百度智能云在中国 AI 公有云市场的份额连续 5 年保持第一。

在此期间,百度智能云积累一批愿意尝试用 AI 技术改造业务的客户,和 AI 在产业中落地的经验。对于云计算公司来说,客户和服务经验都是优质资产。一旦某个企业选定公有云服务商,都会在数据和业务层面深入绑定,迁移成本会持续升高。在新技术到来时,这些客户往往会愿意在原有的云计算平台上继续探索。

百度智能云介绍,千帆已经服务超过 40 万客户,在央企渗透率超过 60%,精调了 4.5 万个模型,开发了超 100 万个应用。这帮助百度智能云更好地理解用户需求,持续迭代千帆大模型平台。

企业客户在意的性能、成本,比拼的是云平台的技术系统实力。百度智能云在 2 月初上架 DeepSeek V3 和 R1 模型,API 调用价格比 DeepSeek 官方刊例价还低,当天就吸引 1.5 万客户使用。

“这不是大额补贴的结果。” 忻舟说,这是百度智能云在大模型推理性能优化方向的技术积累,他们联合百度智能云异构计算平台百舸、基础架构部等团队,针对 DeepSeek 的模型架构做了深入优化,比如将模型推理的 Prefill(处理提示词)和 Decode(生成内容) 两个阶段分离,使其能在不同的 GPU 上并行处理,从而降低了算力成本。

这次 AI 开发者大会上,百度又为千帆大模型平台增加更多能力,把公司各个业务开发的核心产品转换成 MCP Server 大规模对外提供。这样的开放程度,在全球大型公司中都很罕见,大多数公司支持 MCP 都只是为了利用生态增强实力。

“企业现在甚至可以用千帆,快速开发出类似 Perplexity 或 Manus 的产品。” 朱广翔说,接下来千帆也会兼容 Google 推出的 A2A 多智能体协作协议,让企业开发的 Agent 与全世界的 Agent 交互,提高产品价值。

数据智能平台则让千帆体系变得更完整。据市场调研机构 Gartner 估算,到 2028 年,中国企业处理 AI 数据的投资将达到 2024 年的 20 倍。

“数据平台有机会在更多场景发挥价值,推动企业的数据治理从农耕时代迈入工业时代。” 刘斌说,无论是模型能力的演进还是 Agent 应用的扩展,数据始终是基础。

“我们其实不存在 ‘Stay on the table’ 的问题,因为我们十几年前就已经上了 ‘table’。” 李彦宏在去年底的内部会上说,“百度绝不可能下这个 ‘table’。”

千帆的体系化升级,是百度给出的最新证明。

题图来源:《人生切割术》

来源:晚点LatePost

相关推荐