摘要:当前大模型产品演进方向无非两个大头:一个是 AI Chat 方向,一个是 AI Agent 方向。前者主打对话“获取信息”,后者主打“解决问题”。
当前大模型产品演进方向无非两个大头:一个是 AI Chat 方向,一个是 AI Agent 方向。
前者主打对话“获取信息”,后者主打“解决问题”。
Chat 方向,要往“IM 化”极致交互体验去做。
Agent 方向,要让 AI 变成你的“管家”,你交待他事情,他负责统筹去搞定之后给你结果。
这是两条完全不同的道路。
当然 Chat 作为 Agent 的一个前端方式,两者自然也是可以协同起来的。
Agent 这个方向主要是技术层面当前还需要不断演进,但这是一个比较长远的路,或许是所谓的 AGI 要达成的。
AI 只是个 Agent,一个代理,一个特工,帮你搞定不同的事情,所谓丰富多样的“Multi Agents”,而上层对到用户只需要一个“总管”、“管家”来统筹之。
其中各种 Agent 具体能力的实现,当然又包含了软件层面和硬件层面,软件层面诸如“Agent 帮我直接完成了一篇图文并茂的论文”,硬件层面主要是“传统硬件驱动”,比如调度显示器、鼠标啥的,与更大头的具身智能方向。具身智能已经自成体系了,具体情况专业人士再去探讨吧,按下不表。
此处点一下“MCP”这个协议,它恰好是实现涉及软、硬件能力 AI Agent 的桥梁,驱动软的又可以驱动硬的,而驱动硬件部分才是我觉得它最牛逼的地方,任督二脉打通之。
Agent 方向实际情况来看,当下我们能做的只是去不断补足基础设施的生态,以及能力,比如前边说到的 MCP 这种基础设施,简单讲的话,你看,我为什么说它驱动硬件部分才是最牛逼的地方,就因为它直接体系化地为 Agent 方向引入了调度硬件的能力,开阔了一片天。
至于大模型能力本身,那是另一个大话题,对数据的转化、扩散、对数据的训练、权重、微调、性能调优、GPU 加速、上下文窗口、大模型、小模型、模型“热进化”等等,自不必提,大模型技术专家去探索之。
而大模型这么一个“封闭的黑盒”,我们在演进 Agent 方向,需要找到一个怎样的核心思路呢?
我的抽象提炼是:我们要让人类能更好地参与到大模型封闭黑盒中,也就是输入。
包括在基础设施生态层面、在具体技术能力层面、在工程化层面、在流程化层面、在上层产品操作等等层面去输入给大模型。
那么,诸如下边随便列举这些点(当然还有更多,以及后边还会新突破的更多点),本质上都是在往这个方向上叠 buff:Prompt 工程本身、自动化 Prompt 调优、RAG、调用链、rules、function calling / tools、记忆层、MCP、A2A、结构化 JSON 返回、自动化 builder、效果即时预览、可视化编排、多模型调度、任务管理……
再来看看 Chat 方向。这个方向需要往“IM 化”极致交互体验去做。
底层核心理念是这样的:跟 AI Chat 助手对话就和我跟别人进行 IM 聊天是一样的,只不过对面是一个 AI,仅此而已。
这个月 7 号我还在跟人聊到 IM 化的话题,16 号腾讯就上线了可以把元宝添加成微信好友的功能,腾讯产品经理还是有点东西的。
从用户角度来看,将 AI 聊天助手当作人类,深度融入 IM 平台能够带来“便利性”与“熟悉感”的双重红利。(不扯什么与 AI 产生感情那套)
首先,用户无需下载额外应用或跳转界面,就能在日常使用最频繁的聊天工具中直接调用 AI 服务,大大提升了接入效率。
其次,AI 助手以“联系人”形式出现在熟悉的聊天列表中,降低了学习成本,让人仿佛在与朋友对话般自然流畅。
同时,通过持续学习用户的对话习惯与偏好,助手还能提供高度个性化的建议与提醒,并且全天候在线,随时响应用户的需求。
从行业视角来看,IM 平台嵌入 AI 聊天助手不仅是提升竞争力的关键举措,也能开辟全新的生态与商业空间。
一方面,通过丰富平台功能与智能化服务,能够显著提升用户停留时长和活跃度,进而增强用户黏性。
另一方面,AI 与用户的互动数据为产品优化和新业务开发提供了宝贵洞察。
此外,借助 AI 助手拓展文档处理、内容创作、电商推荐等多场景应用,IM 平台可从单一通讯工具升级为综合性数字生活入口,进一步实现高级功能订阅、企业解决方案等商业化变现。
还有一个很重要的是:在当前 AI Chat 产品能力普遍不咋滴的情况下,直接有效复用 IM 那个成熟领域。
对于腾讯来说,首先自然是充分利用了微信超过十三亿日活用户的规模,而背后其实是“在全球范围内,IM 平台用户规模已接近 52 亿”。
这里也再下一个自然而然的预测:企业微信后边会是元宝发力赚钱的大头。
但说实在的,目前腾讯这东西离“极致用户体验的 IM 化 AI Chat”还远得很。别的不说,先按微信目前的功能补上来,让元宝真的就像背后是“女装加强版 QQ 马化腾”以假乱真,然后再谈 AI 向的极致用户体验(比如前边扯到的模块化引用之类的东西)。
也必须得说一下,AI Chat IM 化不 IM 化,这个有点见仁见智了,我也说不出个必然要这样的逻辑,只是目前行业 Chat 的产品能力来看,如果像我表达的“像与人类对话一样,自然需要引用功能”,那么 AI Chat 产品形态往 IM 化去做,确实就是存在既有经验的,而且是大量与深入研究过的:照着做 IM 的产品思考,直接把行业关于 IM 产品的思考与能力搞上去再说,多么多快好准。
最后简单看一个 Chat 与 Agent 方向的协同示例。对话方式输入需求,GenSpark Agent 给我 Web 落地页:
本文是针对当前人类发展大模型产品的趋势的一个高度抽象,细的不谈,业内人士顺着这抽象逻辑往下走,自然知道该有哪些细的东西去探索,包括基础设施生态、具体技术能力、产品形态,甚至商业模式等。希望多少能有一点价值。
下次再聊,886,我是尼克劳斯,欢迎留言探讨。
来源:小黄科技频道