让 AI 做 AI 擅长的事，让人更像人

摘要：在 AI 技术狂飙突进的当下，微软中国 CTO 韦青与至顶科技 CEO 兼总编辑高飞在微软创想未来峰会的创想未来坊环节中进行了一场深度对话，聚焦大模型在企业级应用中的迷思与破局之道。

在 AI 技术狂飙突进的当下，微软中国 CTO 韦青与至顶科技 CEO 兼总编辑高飞在微软创想未来峰会的创想未来坊环节中进行了一场深度对话，聚焦大模型在企业级应用中的迷思与破局之道。

01 AI 技术发展太快

我们还追得上吗？怎么追？

左一：韦青，微软中国首席技术官

右一：高飞，至顶科技CEO兼总编辑

高飞：

今年有一个流行语叫做“ AI 一天，人间一年”，现在模型数量特别多，好像晚上睡觉起来，早上就发现了新的模型。然后不同的参数，云端的、本地的、开源的、闭源的，所以第一个问题想请教韦青老师的是，您如何看待当前模型领域在数量和种类上所呈现的复杂性？

韦青：

您刚才说的这个情况，其实在技术的发展史上屡次出现。它有一个核心的观点，就是我们到底是因为先有一个问题，然后找工具去解决这个问题，还是说因为手上有把锤子到处去敲钉子？那么以我的观察来讲，我觉得这应该是一个“工具箱”的概念，就是说现在这种工具叫做人工智能，它也无非就是一种工具，它是很强大的工具，但是它是用来解决问题的。

如果是这样的话，大家是否还需要担心今早起来之后，又有一个新的模型出来，我就是不是赶不上时代了呢？我记得我在年轻时候，公司一位研发前辈曾经说一句让我一辈子受益的话，英文原话才叫：“There is a limit of physics”，就是说所有事物都是有物理性局限的。如果大家都很焦虑，比方说模型的快速发展是否会对我们的职业生涯构成威胁？我们应该如何应对这种变革？真正的局限其实不是技术，是人的能力。

近期有报告分析了人类大脑的信息处理机制，作为碳基生命，你再怎么样去看，再去读怎么样的内容，处理信息的速率就是每秒10 bit。因此，有人可能会提出利用脑机接口能够再让他快点。

这个就是一种系统工程的观点，它恰恰不在乎哪块板谁最长，因为系统工程观点在于专注解决问题，专注于那个最终交付物。一旦咱们用那种交付物的观点，就能理解，先进技术当然很重要，但是一般来说体系都是因为最短的那块板，或者由于那个衔接点没有衔接好断掉的，比如像几十年前有一架航天飞机爆炸，就是因为很小的一个橡胶管，那么这个才是真相。所以习惯于用一种工程思维想问题的话，我们来思考追新技术的问题。要不要追？肯定要追，但是就不会那么怵了，就变成什么呢？一定是一个要尊重常识，尊重规律，按照客观规律办事，就是由问题导向、流程导向、工具箱理论的导向，认识到无论是开源、闭源、大型、小型以及不同参数规模的，都具有其各自的价值。

所以这对于模型、工具、技术都是一样的，它不在于你的技术先进性与否，而在于这个工具是否能够恰好解决你的问题。还有一个关键点在于「匹配」，即使存在能够满足特定需求并解决相应问题的工具，如果流程设计与实际需求不匹配，最终仍可能无法有效解决问题。所以我特别建议大家用一种系统思想、系统工程的角度来看待这个问题。

高飞：

那这么看就是模型不是万能的，不要指望一天早上起来后，一个模型把所有问题都解决了，换言之，如果模型能够完全解决所有相关问题，那么个人的价值可能会受到显著影响，是吧？

韦青：

其实大家，包括我们在内，都生活在信息茧房里，所以就会有种倾向性，就是你越想听什么你越能听到什么，因为咱们的所有行为都有一种模式，它都会被背后的大模型学到，之后反过来又给你推送你想听的。

我还是比较倾向于借鉴 Andrej Karpathy，也就是原 OpenAI 联合创始人之一，他就曾在一次给初创企业的演讲中说“Demo is easy”，就是演讲、演示比较容易，但是要花费10年时间从 demo 变成 product。大家可能都有这种感觉，就是演示起来，或者说一开始用特别厉害，但一旦开始用到解决我的具体问题上了，就会开始掉链子。为什么呢？就是说模型厉害不厉害？模型一定非常厉害，但模型不是最终的解决方案。

点击文末 “阅读原文”,

查看完整对谈视频。

02 AI 技术落地

人才、文化、问题意识同样重要

高飞：

面对市场上众多模型，特别是对于传统型企业而言，您会提供哪些方面的建议？例如，在流程优化、实施步骤以及方法论选择等方面。

韦青：

我曾经借鉴业界的俗话，提出过一个例子，叫“五个馒头”，比方一个人很饿了，去店里吃馒头，吃了第一个没饱，第二个、第三个、第四个都没饱，吃第五个才饱了，结果这个人没有感谢店家，反而是埋怨店家，说你为什么不把那第五个馒头放在第一个直接给我吃完不就饱了吗？在行业内，人们普遍认为，大部分企业从上到下都想吃那第五个馒头，为什么呢？因为第五个馒头更能拿到预算、让上级赏识。

然而，问题在于，如果我们认为第五个馒头能够带来饱腹感，那么前提是必须先吃完前四个馒头，我想进一步阐述这五个馒头分别代表什么。倒推的话其实大家都已经知道了，有智能的话必须得有数据，“Model is as good as your data”。模型它再厉害，它不会超越你数据质量的边界，数据质量决定了你模型的最高线。

并非所有数据都具备学习价值，只有那些具有实际应用价值的数据才值得被模型学习。此外，由于缺乏流程再造，许多人误以为预训练模型能够解决所有问题，但实际上，预训练模型提供的只是通用知识，真正具有应用价值的是在线学习 online learning，即模型在实际应用过程中持续学习并不断进行纠偏的，那叫 online learning，然而，当前的流程通常缺乏提供这种在线学习能力的机制。

其他“馒头”还包括企业文化改造，重塑对数据驱动的信任，因为现在很多企业所谓的 “数据驱动”仅仅停留在口号层面，要实现真正的数据驱动，你需要数据驱动流程进行彻底的再造、更需要对数据驱动算法的可靠性给予充分的信任。

而且就算这样，五个馒头吃完之后还是会发现远远不够，因为还需要有问题驱动和真正的产品产出。因为产品不是模型，用户也不会直接用模型，用户用的是那个最终的产品。所以萨提亚・纳德拉有句名言叫“Model is not your product, model is part of your product”，即模型不是你的产品，模型是你产品的一部分。也就是说，都想为最后的产品买单，没人做模型，没人做数据，没人做流程再造，没人做人才培养，没有做企业文化再造——这么一堆事情做完之后才能有产品，这多难啊？

高飞：

我们的下一个问题是我在接触到很多企业时意识到的，他们总会谈到一个很流行的词叫“幻觉”，但这里有一对矛盾：在消费级AI应用场景中好像幻觉就不是一个严重的问题，甚至说幻觉越多越好，越有创意，但企业端好像对幻觉这个事就很困扰、“痛恨”幻觉。您怎么看待这个企业场景中的幻觉问题？

韦青：

这也是一个特别好的问题，大家都在说幻觉要尽量减少，但是有没有发现，如果你真让一个概率型模型没有幻觉之后的话，它也就没能力了。为什么呢？因为幻觉本身不是 bug，而是 feature、是功能，而不是它的问题。但是确实过多的幻觉那是不行的，这需要靠各种后期训练微调或者提示词来避免，但是，如果完全清除了模型的幻觉，那么我们又该如何定义“生成”这一概念？生成式模型不正是通过引入一定程度的不确定性来实现内容创造的吗？”

所以阿尼尔·赛斯写过一本书叫 Being You，中文版翻译叫《意识机器》，他就挑战这个概念，说人的思维就是一种“可控的幻觉”，你想咱们人能够重复做一件事吗？重复性任务类似于背文章，我们能够记住某些内容，但对于那些需要抽象理解才能表达的内容，实际上是一种受控的幻觉。

其实我们要的不是一个没有幻觉的大模型，我们要的是一个像人一样受控的幻觉，那么要控到什么程度才是一个最麻烦的地方。比方说小孩经常说“为什么不能这样？”“Why not？”但大人被异化成了机器，所以我们不敢说why not 了，也不敢说why了，这是否意味着一切都被简化为直接执行指令？我们成了机器人。所以当我们在谈这个幻觉的时候，其实是误会了它的功能。

微软也有一个副总裁就说叫软件1.0，他称呼AI技术或者大模型是软件2.0，之前的软件是1.0，1.0和2.0各司其职。近期，一个引发热议的话题是让大模型比较9.9跟9.11谁大谁小？令人费解的是，不是说它不能做，为何仍要强求模型执行其不擅长的任务？大模型最擅长的什么？最擅长的是知道了a等于9.9，b等于9.11，然后它可以给你做规划，做战略，做调整。大型模型在进行具体数值a的比较方面，例如区分9.9与9.9999999，并不具备优势。

为何不将a的赋值运算交由软件1.0执行，以发挥其在数值计算方面的优势。那么大模型擅长做的事情是告诉你，如果a比b大了之后你该怎么做。所以这整个流程中，既有需要精准的工作、也有需要概率的工作，但你非用一个概率工具去做精准的事，并非不行，但那就叫舍本逐末了。

03 创新与整合

AI 时代的书同文、车同轨、行同轮

高飞：

其实说到 AI 应用，现在也有另外一个大家关心的问题，就是 Agent 或者智能体又衍生出来很多的概念，比如说 MCP、A2A 这样的协议，那韦青老师您怎么看待Agent和这些协议之间的关系？

韦青：

我想到一个说法，就是微软 CTO Kevin Scott在2022年12月跟《雪崩》作者 Neal Stephenson 聊天的时候，问了他一个问题，说“你如何看待 AI 技术”？咱们现在很火的阿凡达、元宇宙这些概念和词汇都是 Neal Stephenson 发明的。

他说这些东西确实很先进，但实际上都是在实现过去的人们的愿景，只不过现在实现得更好了，而在他看来“Once AI is done, we call it software”, 即 AI 技术成熟之后、能开始用了，我们就会把它称作软件。

那么为什么要说这个呢？我相信现在应该有蛮多软件工程师朋友们，可能也学过这个所谓 OOP 编辑的对象编程里面有一个 Solid Principle，那么当初 Alan Kay（面向对象编程之父）在一次采访中聊到关于 OOP 编程范式的时候，就说他其实挺后悔的，因为他们那时候推 OOP 这个概念推太猛了，结果大家都追这个概念去了，但是他当初做这个软件架构的唯一原因，就是希望软件与软件之间沟通的能够有效一点。

这就好像今天我们说 MCP、ANP、A2A 等等，今天为什么行业想要做MCP 和 A2A，其实就是在软件2.0的范式下，大模型所产生的结果类型在不同情况下是不兼容、不统一的，这就会产生歧义。那么就得有人出来做一个类似于 AI 软件工程领域的 OOP 的做法。如果把它抽象理解为一种说法叫“所有的新技术都是没有被用好的老技术”，那么所有软件或者AI技术体现的能力的，其实都是人类智慧的结晶，而人类历史上就曾经有一套高效管理机制的例子，叫做“书同文、车同轨、行同轮”。

那么我们看回企业场景，我们应该特别希望公司里的人是“行同轮”的，大家最好能步调一致，集中力量干大事。我们同样也希望智能体是“行同轮”的，但如果“书同文、车同轨”没实现之前，也很难直接做到“行同轮”，那么请问 MCP 和 A2A 是不是就是“书同文、车同轨”？一旦“书同文、车同轨”之后，智能体是不是就能“行同轮”了？这么来看，我们就能知道，咱们要追的应该是名词背后的本质，理解完之后话，你也可以做 MCP，你也可以写 A2A，都是可行的。

高飞：

就这个东西好像没有那么神秘了。我们下一个问题是，您怎么看待微软生态和大模型的关系？因为大模型发展好像和微软参与紧密关联，包括之前与 OpenAI 的合作，那我们现在也是在这个场合中谈大模型，那微软生态在这个模型时代，从操作系统到模型，它的独特性在哪里？怎么看待我们能够从微软的生态当中得到什么样的帮助？

韦青：

我一直和微软的合作伙伴说，微软是一个系统化的公司，尽管它可能某些产品会在某个时间段会比较强，比方说 Windows、后来是 Office，然后又有云计算，现在是模型，但其实微软真正强的是系统，就是它能把这些东西连起来，因为你想我还是坚信真正的用户他也不是要一个操作系统，他也不是要 Office，不是要云计算，也不是要一个 AI 应用，他要的是解决问题，那么解决问题就一定是把东西整合在一起解决的。

所以像 NASA 的 JPL 实验室（喷气推进实验室）首席工程师 Gentry Lee ( 詹崔·李 ) 也一直在讲创新，他说“Integration is also Innovation”，整合也是创新。他还举例说何为工具、何为解决方案？在他看来，达利是著名画家，他用他手上那杆笔就能画世界名画，那么如果我拿到达利手上那根笔，我能画出一幅世界名画吗？

所以微软是什么角色呢？它是确实是有一个比方说达利手上那杆笔，但好多人忽略了其实达利最重要，但咱们都不是达利，那怎么办呢？微软的做法就是让那杆笔有一定的自动化和工具化能力，即便你不是达利，但你也能拿微软给你做的这个笔，画出一幅类似达利的画出来。

04 在雾里看花的时代

重拾洞察问题的能力

高飞：

至此，我们已较为清晰地探讨了模型的体系和方法论。我想到韦青老师一直在谈到一个问题，就是“找问题”，找问题很关键，然后找到问题，解决问题或者解决客户的问题才是你的价值所在。那我们怎么去找到问题和定义问题？这其实一种工程师思维了，那您觉得在这么一个看起来有挑战、不明朗的这么一个雾里看花的时代中，我们怎么去找问题，定义问题？

韦青：

其实这是个特别好的问题，大家知道，我们一定要学会区分工具和方法论，其实工具是一直在变的，AI 技术它既包含了方法论的进步，又有工具型的进步。那么如果这么来，看到了什么叫找到好问题，关于在方法论上面，其实我觉着截止到现在为止，起码“设计思维”这种方法一直没有过时。设计思维它其实就是一种科学方法，你先观察、再假设，然后再有同理心，然后再去做出一个实验，再去验证，当然实验也是一种快速迭代的实验。

在当今，尤其是当工具飞速进步的时候，我们一定不要被工具给带偏了，我们一定要先问我们的基本核心的方法论是什么。因为这就是当工具变了之后，但你的方法论还在的时候，你就会发现原来我无非就是当有新工具能力出现时候的，可以把所有的现象全都重新质疑。未来塑料杯和椅子的设计是否需要重新审视？为什么？因为现在有了新的工具，当用这种想法去思考，你会发现其实咱们周围一切都是问题，就是我们要回归到赤子之心、孩子之心。

养过小孩子的话，就知道什么孩子从小到大一直在问为什么，而孩子什么时候开始停止问为什么的？就是在被异化成机器人之后。所以其实我们才是机器人，如果我们是人的话，人本来保留的就是问题的能力，就是那个“Why”“What”“How”，但今天的人过多地异化成了去解决“How”，实际上人真正最擅长的是那个“Why”。

高飞：

我突然想到看到的一个故事，辛顿教授说其实很多时候我们认为习以为常的事情，其实不一定是对的。例如我们看牙的时候，牙科医生说你把它咬下去，但是你动嘴的时候会发现其实你动的是下颌，其实是咬上去，而不是咬下去。所以很多时候就是我们对太多事情都认为是习以为常了，但如果挑战这种常识就能发现创新的机会，但有时，我们又不尊重常识，就像我们可能看到 MCP 火了，又忘了它其实可能只是基本的面向对象的一种方法。

韦青：

对，其实我觉得方法真的甚至要回到2000年前，就是几何原本。我认为几何原本的那种论证思路在现在永远不过时，咱们现在为什么会有这些问题？第一，定义没有统一。第二，公识，就是大家公认的假设。第三，公理，公认的道理。当你定义好共识和公理之后，再论证，你会发现的可能好多，那些话题就不在了。

大家想想现在这个模型叫“大语言模型”，那么我们反问大家，它到底是“大语言模型”还是“大文字模型”？语言跟的是口，而文字跟的是字。当我们知道中文是象形文字，与拼音方式不同，而只有在拼音文字中，文字跟语言才是不分的，所以才叫大语言模型。但来了中国，你觉得你用的是大语言模型还是大文字模型？这个最基本的概念好像也没人去问。

高飞：

对，我觉得和韦青老师交流之后最大的好处就是，我的焦虑感没有那么重了。然后我觉得对于我们每一位的启发就是，我们应该活得更像人，而不是像活得像机器。我们正在让机器更像人，但是我们不要让人更像机器。好，特别感谢各位的聆听，也感谢韦青老师的分享。

韦青：

谢谢大家，祝大家远离焦虑，拥抱希望。

*本订阅号所发布的内容均为微软原创作品或经权利人授权发布。未经许可，任何单位或个人不得复制、发行、传播、改编、翻译或汇编。