摘要:2019年6月,三位深度学习领域的先驱约书亚·本吉奥(Yoshua Bengio)、杰弗里·辛顿(Geoffrey Hinton)和杨立昆(Yann LeCun)并肩站在领奖台上,共同捧起了图灵奖奖杯。那一刻,AI 的黄金时代似乎刚刚拉开帷幕,而如今AI正在科
作者|晨曦
编辑|陈秋
另镜(ID:DMS-012)
2019年6月,三位深度学习领域的先驱约书亚·本吉奥(Yoshua Bengio)、杰弗里·辛顿(Geoffrey Hinton)和杨立昆(Yann LeCun)并肩站在领奖台上,共同捧起了图灵奖奖杯。那一刻,AI 的黄金时代似乎刚刚拉开帷幕,而如今AI正在科技界掀起前所未有的创新热潮。
为助力更多年轻人敢于探索AI新应用,4月25日,Create2025百度AI开发者大会在武汉召开。百度创始人李彦宏在会上宣布,正式启动第三届“文心杯”创业大赛,进一步加大对创业者的支持力度,特别大奖的投资额最高可达7000万元。同时宣布,未来5年,百度将加大力度,再为社会培养1000万AI人才。
李彦宏发表了主题为《模型的世界应用的天下》的演讲,发布文心大模型4.5 Turbo、文心大模型X1 Turbo、高说服力数字人、通用多智能体协作APP“心响”、沧舟OS等AI新品,并宣布将帮助开发者全面拥抱MCP。
李彦宏指出,多智能体协作是一个非常有价值的AI应用方向。未来的AI应用将从回答问题,走向任务交付,而任何一个复杂任务的交付,都需要多智能体协作来解析需求、分拆任务、调度资源、规划执行,最终交付结果。
“我们会用一些百度的算力和模型,做虚拟游戏每个人物都是一个AI智能体,我们就是多智能体驱动的场景,多智能体驱动的社交模拟。AI智能体有自己的用户目标,会更符合用户个性化的需求,它会产生更个性化的内容,或者反馈。”
出生于1997年乔海鑫,也是AI+社交/游戏的创业公司Kotoko的创始人、CEO。他也是去年通过层层选拔,最终在百度第二季“文心杯”创业大赛脱颖而出,二等奖的获得者。
Kotoko即将在STEAM平台上线基于大量AI智能体在线协作的新游戏Bside。Bside是一款围绕玩家的原创虚拟角色Biibit的多人社交模拟养成游戏,而游戏最大的亮点就是即使没有玩家的操作,由AI多智能体驱动的Biibit们也会基于自己的人设与环境信息去决定自己的行为,自主地互动、成长甚至交朋友。
智能体让新应用更有趣
和传统游戏相比,Bside里的虚拟角色本身会根据玩家赋予的人设、自身的记忆与所在场景的背景设定,在与其他角色自主社交的过程中自动产生大量有趣且个性化的内容(如对话、互动行为等),并且聚焦“文心杯”:看百度如何孵化AI应用赛道领跑者带领用户与其他虚拟角色背后的用户去认识。
在没有大模型之前,用户的文本创造与输入是游戏程序很难去真正理解并作为游戏的生产要素去进一步在游戏中产出内容的,剧情与行为树都是游戏团队预设好的内容。
但在大模型出现以后,很多用户过去会自己设定的角色故事、场景故事甚至世界观都能够被大模型驱动的游戏系统所理解,系统可以将用户创造的离散的内容积木remix成为更有意思且统一的模拟或故事。对于Bside针对的大量喜欢OC以及二次元的用户来说,能够让自己个性化的想法在虚拟世界中得以呈现甚至放大,是技术进步带来的新体验。
在乔海鑫看来,多智能体模型的推理能力在变强,也意味着多智能体应用场景也更多了,能给用户带来更有趣的体验。
“在没有AI大模型或智能体之前,让用户个性化的内容输入被多人联网的虚拟世界所理解并反馈给用户,是传统技术很难做到的。这个其实就是大模型所带来的,用户能够从0到1感受到不一样的AI原生的体验。”
乔海鑫认为,目前大模型的推理成本下降也很重要,过去我们使用chatbot的体验是回合制的,模型不会时刻被调用,token也并不是每分每秒都在被消耗的。但在由大量AI智能体角色组成的虚拟世界里,就像我们现实的世界一样,它一天24小时都在运转,这里面每一个角色的行为、思考与对话都是AI多智能体驱动的,这类体验对模型的调用消耗比过去的chatbot是高出一个量级的。
在今年成本大规模下降之后,这种体验才具备可规模化、可商用的可能性,在过去的成本结构下这个可能性是几乎没有的。今天还有很多基于多智能体高频调用大模型的应用场景,在模型推理成本大幅下降后得以被推广。不管是在虚拟世界还是现实世界,这些体验一定会让我们看到AI落地的新的可能性。
“我觉得今年肯定是AI应用的一个大年,甚至我们已经看到了AI应用的爆发。”
仍有诸多技术困境
Create开发者大会是百度一年一度面向开发者群体的技术发布和行业交流盛会,至今已举办六届,在行业也被视为科技风向标。今年百度又带来哪些行业发展的深度思考?
2025年,大模型迭代的速度越来越频繁。针对模型迭代太快,应用价值是否会被覆盖的行业疑虑,李彦宏明确指出,只要找对场景、选对基础模型、会调模型,做出来的应用就不会过时。
“我们选择了AI+零售,最开始我们也是拿着锤子在找钉子,不知道客户想要什么。电商好处就是足够大,巨头公司都做自己电商了,不太可能做一个中间工具帮其他电商做内容。”
武彬分享说,极睿科技打造了业界唯一的一站式全角色x全链路x全类型电商内容生成方案,把电商内容全部通过AI的方式来做。
武彬也是百度第二季“文心杯”创业大赛一等奖的获得者,奖金高达千万。
如今的极睿科技已经是一家上百人的团队,成立于2017年的极睿科技是一家“清华系”创企,算法团队源自清华大学计算机系NLP实验室,基于AIGC打造电商内容生成引擎。
武彬向另镜表示,只有电商的数据才能训练出来适合电商的内容生成效果,我们在垂直电商领域生成的内容效果要比平台级产品领先很多。
但竞争会越来越严峻,我们也会看,也会担心比如说新的技术,对我们会不会产生颠覆性的变革,任何新技术我们肯定都要去拥抱,看能不能跟我们结合,未来大量的AI公司都会这样。
都会来看新能力对自己的帮助,也会看能力会不会给自己带来一些新的竞争对手,这肯定是有利有弊的一件事情。
李彦宏认为,当前开发者做AI应用的一大阻碍,就是大模型成本高、用不起。成本降低后,开发者和创业者们才可以放心大胆地做开发,企业才能够低成本地在本地部署大模型,最终推动各行各业应用的爆发。
当下的部分模型,仍然存在模态单一、幻觉高、速度慢和价格贵等问题,为解决这些问题,
百度新发布的文心大模型4.5 Turbo和深度思考模型X1 Turbo,不仅能力更强、成本也进一步大降。相比文心4.5,文心大模型4.5 Turbo速度更快,价格大降80%。文心大模型X1 Turbo相比文心X1,性能提升的同时,价格再降50%。
AI竞争迈向执行时代
今年开年以来,国内外大模型发布越加频繁,DeepSeek横空出世,巨头之间价格战越演越烈。
在一年前,李彦宏就曾说过,最看好的AI应用方向就是智能体,而如今智能体成为AI应用的代名词。
多模态成为未来基础模型的标配,而智能体协作的场景被广泛关注。
随着模型能力越来越强,迭代越来越快,技术的不断突破,结合场景也会更加丰富,可以看到现象级应用诞生类型也正不断被打破。
短短一年,行业头部企业通用大模型的的多模态能力在不断增强,视频效果也在不断提升,头部大模型已具备更先进的思维链、更强的深度思考、推理和创作能力,最重要的是MCP逐渐成为行业标准后,调用工具能力也在不断加强。
李彦宏在现场给百度X1 Turbo出题:听说武汉有种东西叫“蒜鸟”,请你把它画出来。
不一会儿,一只头顶绿色大蒜的卡通“蒜鸟”跃然屏幕,背后,长江大桥、黄鹤楼等武汉元素清晰可见,展现AI对地域文化的理解力。
“我们也尝试了用其他模型来画,但生成出来的都只是一张普通小鸟的图片。”李彦宏笑着给出解释:文心大模型X1 Turbo自动选择了联网搜索、图片生成两个工具。
除了大模型,百度当日还发布了多款AI应用,AI数字人直播效果也更逼真。
此次开发者大会,百度还有一个大动作,去年百度网盘和文库共同打造的自由画布,今年沉淀为完整的技术底座,发布了AI内容操作系统沧舟OS。
沧舟OS融合了不同形态和格式的内容,可实现全模态输入输出,多智能体调用,提供更完整交付。沧舟OS最大的价值是打通百度旗下文库、网盘等产品,结合私域、公域的数据打造个人知识库。
百度称,百度文库的付费用户已超4000万,AI月活用户达到9700万;百度网盘AI月活用户超过8000万。
通用智能体赛道竞争也更加激烈,用户希望更直观感受到AI带来的便利,不再满足简单的对话,更希望像个人助手一样,帮助执行任务,但行业仍面临技术壁垒,产品如何创新以及如何打造用户个性化服务问题。
百度也发布了通用智能体APP心响,可执行一些复杂任务,无论是知识解析、儿童故事定制、办公图表自动生成还是旅游规划,都可以输入指令轻松搞定。
在此次开发者大会上,百度宣布,昆仑芯P800的三万卡集群也成功点亮,一个机柜最多可放置64张P800,相比于前代方案,卡间互联带宽提升8倍,单机训练性能提升10倍,单卡推理性能提升13倍。
作为AI行业先行者,百度也从最初不断完善AI的技术能力和基建,转向生态协同,赋能千行百业AI应用变革。据统计,今年一季度,百度智能云继续位居国内的大模型中标项目数量和金额第一。
来源:另镜