摘要:一路走来,纳德拉经历了数字技术革命的四次变革,首先是PC,随后来临的是移动互联网,再然后是移动云,现在是AI。在移动互联网中无所作为的微软颇受诟病,好在纳德拉上任CEO后将微软重心转向云计算(Azure)和AI,推动Azure成为全球第二大云服务提供商,让微软
出生于印度、现年58岁的萨提亚·纳德拉,1992年加入微软,2014年上任CEO。
一路走来,纳德拉经历了数字技术革命的四次变革,首先是PC,随后来临的是移动互联网,再然后是移动云,现在是AI。在移动互联网中无所作为的微软颇受诟病,好在纳德拉上任CEO后将微软重心转向云计算(Azure)和AI,推动Azure成为全球第二大云服务提供商,让微软没有再次落伍。在AI时代尚未到来的2019年,微软又投资了OPENAI。担任CEO以来,公司股价上升了33倍,这背后离不开纳德拉的领导能力和管理智慧。
以下是纳德拉对AI产业的观点和判断。本文根据纳德拉2017年以来的公开演讲和分享。
AI发展趋势判断
现在我更关注的是行业正在形成的新结构:单纯的模型已经不足以支撑竞争,完整的系统架构和成功的产品才是关键。
未来AI发展有三个明确的方向:
一是真实世界的AI应用:不仅仅是数字世界,AI如何真正影响现实世界的物理操作和交互?这涉及机器人、自动化生产、供应链优化等领域。
二是科学领域的AI模型:无论是化学、生物学,还是其他基础科学领域,AI模型正在成为科学研究的新基石。这些模型虽然与语言模型有一定的技术交叉,但它们的发展也有其独立性。
三是系统架构的创新:AI系统的底层架构需要怎样的演进,才能支撑未来的计算需求?如果我们仔细观察当前的发展趋势,会发现AI时代的计算架构正处于一个关键的变革节点。
当前被忽略的两个方向:
一个被忽略的方向。我认为,我们并没有从第一性原理的角度真正对系统架构进行重新设计。我们沉迷于AI加速器,把大量计算资源堆进现有数据中心,然后希望它们 “自求多福”。虽然这已经取得了一定成果,但现在是时候思考:
下一代超融合基础设施(Hyper-Converged Infrastructure)应该是什么样的?
我们应该如何重新定义计算、存储和AI加速器的协同?在分布式同步训练任务中,引入强化学习和自动评分机制后,系统应该如何运作?
甚至在数据中心领域,人们常说 “数据中心就是一台计算机”,但我们是否已经到了需要构建它的2.0版本的阶段?
另一个被忽略的方向是客户端。如今,大家都在谈论混合AI(Hybrid AI),但我们还没有真正破解模型架构的问题。为什么我们没有一个分布式推理模型架构?我说的不是分布式训练,而是在运行时进行分布式计算。
为什么我不能让我的Copilot PC上运行的 45 TOPS NPU(神经处理单元)与云端协同运算?
目前,我们能运行一些辅助函数,但是否可以从根本上重新思考模型架构?或许这需要一个数学上的突破才能实现。
开源社区在提高现有基础设施的计算效率上做得很好,比如DeepSeek的工作非常出色。
但为什么没有人真正破解如何在边缘侧利用现有的大量计算资源?这是一个被忽略的重要机会。
AI 是新的计算机,那么它还没有迎来自己的 “存储-程序架构时刻(Store-Program Moment)”。
今天的AI系统缺乏以下几个核心要素:
1、 没有一个真正强健的存储系统,尤其是支持多模态存储的架构;
2、 工具链仍然过于 “手工艺化”,开发者体验仍然有待改进;
3、 缺乏系统级的整合,目前AI产品更像是零散的组件,而不是一个自洽的系统。
当然,在这些方向上已经有很多优秀的研究正在进行,这也是为什么我觉得我们还处于AI系统建设的早期阶段。
令人欣慰的是,我们不仅看到越来越多的基础模型,还看到了越来越多专注于AI系统架构的创业公司。
真正的智能体是什么样子的?
当我们谈论 “真正的智能体” 时,我想要的是一个能够主动推理、适应不同环境,并且可以与现实世界进行深度交互的AI。
它不仅仅是一个工具,而是一个能够执行复杂任务的协作伙伴。
这个愿景会如何影响我的日常生活?它需要具备以下特性:
1、自主规划与执行。智能体可以自己制定计划,而不是仅仅等待人类的输入;
2、跨模态能力。它需要整合视觉、文本、语音、代码等多种模态,而不仅仅是基于自然语言;
3、个性化适应。它可以根据用户的习惯和偏好不断优化自身行为,而不是一个固定的 “助手” 角色。
真正的AI智能体,应该是能够帮助我们创造、执行和优化任务的合作伙伴,而不仅仅是一个增强版的搜索引擎或聊天机器人。
如果能实现这一点,那将是计算机行业继 PC、互联网和移动计算之后的第四次革命。
未来对AI的期待
个人生活:我希望 AI 是我的朋友、教练、顾问。
工作场景:我希望 AI 是我的幕僚长、研究员、咨询师,帮助我完成所有的工作任务。
我认为,这将是我与 AI 的未来关系,并且希望它能够彻底改变知识工作的枯燥部分。
AI的交互方式
我最喜欢的一种交互方式是Copilot的语音接口。比如,我在iPhone的CarPlay上设置了快捷键,让AI与我进行语音交互。这种对话能力是前所未有的体验,完全改变了信息消费方式。这就像自动补全一样,一旦你用上了,就再也回不去了。
量子计算的挑战
首先,微软已经在这个领域坚持了超过 20 年,我可能是第三任资助量子计算研究的 CEO。
我们要打造真正的 “实用级量子计算机”。但要做到这一点,我们首先需要解决量子比特的稳定性问题。这是整个行业的关键挑战之一。要构建稳定的量子比特,我们需要在物理学上取得突破。
微软在这方面的研究走了一条独特的道路,我们探索了一种叫作马约拉纳粒子(Majorana Particles)的现象。这种粒子是由一位1930年代的科学家理论预测的,但几十年来一直没有实验证据。经过20年的研究,我们终于证明了马约拉纳零能态(Majorana Zero Modes)的存在。不仅如此,我们还能够逐个原子地制造这些粒子,并展示它们能够以稳定的方式隐藏量子信息,从而减少误差校正的需求。这意味着,我们可以真正将其扩展成可实际运行的量子芯片。
目前来看,量子计算仍然处于研究阶段,但已经开始出现一些早期应用案例:在材料科学、药物研发等领域,量子计算已经展现了潜力;金融行业正在探索如何利用量子计算进行更复杂的风险分析;现在,量子计算的发展变得比2014年时更容易推进,因为我们已经解决了最核心的物理学挑战。
未来的计算架构将是 “经典计算+量子计算”
未来,AI 与量子计算结合可能会带来更强的计算能力。量子计算不会取代经典计算,而是二者结合才能发挥最大的作用。
举个例子:我们在研究马约拉纳粒子时,采用的是逐个原子构建的方式。如果我们当时拥有一台量子计算机,整个研究过程会快得多。
因为量子计算机的核心优势是模拟自然界的复杂现象,它可以帮助我们探索数据空间,但它并不适用于数据密集型的计算任务。
这意味着,未来的计算架构将是 “经典计算+量子计算” 的组合:
量子计算:擅长探索大规模数据空间,模拟物理、化学、生物过程;
经典计算:擅长处理海量数据,进行 AI 推理、存储与操作。
比如,在科学建模方面,我们可以使用量子计算来生成训练数据,然后用传统的 AI 模型进行推理。这正是Azure Quantum目前正在做的事情。
现在,即便只有10个或100个逻辑量子比特,它们在化学和生物学领域已经能发挥作用。
AI对知识工作者的影响
未来依然会有知识工作者,但他们从事的工作层级会不同,他们的工作方式将发生巨大的变化。
在20世纪90年代,Word、Excel 和 PowerPoint 是知识工作者的核心工具;Copilot是它们的1.0版本,而下一代AI工具将会是2.0版本。那么,3.0 版本是什么?这正是我们正在努力构想的方向。
AI时代最重要的能力是保持好奇心和批判性思维
我们必须教会孩子们如何与AI协作,让AI增强他们的创造力、批判性思维和独立决策能力,而不是让他们被AI替代。
未来社会最重要的能力,可能已经不是掌握某种专业技能,而是保持好奇心和批判性思维。
我们是否需要重新思考教育的本质?
如果未来的孩子可以用AI去构建任何他们想要的东西,那么是否应该更多地培养他们的探索精神和自信心,而不是过分强调考试和传统意义上的 “知识储备”?!
AI服务器:基础设施领域,永远不会出现赢家通吃
我一直觉得,基础设施(比如服务器)领域,永远不会出现赢家通吃的情况。你所需要做的,是以有价值的主张进入游戏。
我们构建云,不是为了一个大型应用程序,我们构建云是为了许多异构的企业工作负载,我认为长远看,这才是所有推理需求所在,它与数据、应用服务器相连接。AI现在是云的核心组成部分。
我认为基础设施层会有多个赢家,即使在模型层面,每个超大规模公司也会有一堆模型,围绕它们的应用服务器。
每个应用,包括现在的Copilot,都只是一个多模型应用,存在一个全新的应用服务器。就像每个人一样,曾经有移动应用服务器,也有Web应用服务器,现在有了AI应用服务器。
对我们,那就是Foundry,我们正构建,其他人也会构建,会有多个这样的服务器。
所有的业务逻辑,都将转移到这些AI Agent上。这些AI Agent,将进行跨存储库的CRUD操作。它们不会区分后端是什么,它们会更新多个数据库,所有的逻辑都将存在AI层。一旦AI层成为所有逻辑所在地,人们会开始替换后端。
我认为,在一个每个AI应用程序都是有状态的应用程序,都是AI Agent应用程序的世界中,该AI Agent执行操作。经典的应用程序服务器,加上AI应用程序服务器,再加上数据库,都是必需的。
(数据中心)是一个资本密集型产业,同时也是一个软件密集型产业。你可以利用软件来提高资本的投资回报率ROIC,这就像早期人们问超大规模云计算服务商如何赚钱一样,新的超大规模云计算服务商与老牌主机托管商的区别在于软件,我认为这甚至适用于现在GPU领域。
我们目标是通过AI创造运营杠杆,我认为员工总成本会下降,我们人均成本会上升,每个研究人员的GPU数量会上升,我是这样看待这个问题的。
AI产品Copilot
Copilot就是所有这些人工智能的用户界面。
现在我们有了大规模的证据表明,这些工具正在从根本上改变工作方式,既提高了价值,也减少了浪费。
AI代理技术栈
对于任何开发AI应用程序的开发者来说,另一个非常重要的考虑因素就是数据。无论是用于训练还是推理,或是检索增强生成,你都需要处理好自己的数据。这意味着你需要能够将所有数据迁移到云端,并与AI相结合。实际上,AI计算在哪里,数据就会在哪里。因此,我们在确保无论你是使用Oracle、Snowflake还是其他数据源,你都能将它们带到云端。
在此基础上,我们还在构建一流的云原生数据基础设施,涵盖了从OLTP(在线事务处理)到分析的所有内容,比如Cosmos DB、SQL、Postgres,或者为AI时代打造的Fabric数据分析系统。我们的数据基础设施已经成为AI发展的关键所在。实际上,考虑到AI与数据的结合,没有任何AI应用是无状态的,尽管AI API是无状态的,但一旦它们与实际应用和工作负载结合,就变得非常有状态。以ChatGPT为例,它是Cosmos DB和Azure Search的最大用户之一。正如你所看到的,一旦你构建了像Copilot或ChatGPT这样的应用程序,你就需要一个强大的数据基础设施来支撑。而现在,我们再次迎来了一个新的应用服务器时代。回顾ChatGPT的底层架构,每个GPU背后都有一套与AKS配合的常规计算资源。因此,应用服务器是起点。
在拥有了最广泛的模型之后,AI应用服务器的下一步就是支持监督微调(SFT)。我们甚至提供了微调即服务,帮助你在所有这些模型之上进行微调,以便你将其集成到你的应用程序中。我们正在用AI来构建AI工具,从而构建更好的AI。
Copilot+PC
现在,我想转到最后一个平台,也就是Copilot+PC。这是我们推出的Copilot设备和Copilot+PC平台。这标志着一个全新时代的到来,CPU、GPU和NPU都可以在边缘设备上使用。如果你回顾到目前为止,扩展法则在云端非常有效,但我认为未来,AI时代不仅仅会由云端定义,边缘设备的作用也会越来越大。实际上,在一些模型架构中,我们将看到突破性的进展,允许这种混合使用的分布式架构展开。
就像当初人们为PC开发新应用一样,现在我们将进入一个NPU+GPU+CPU的世界,这将是一个非常有趣的世界。
技术最终必须转化为现实世界的影响——一人一企,一步一步地,在英国推动经济增长,真正改善经济体中的成果。
微软的使命
我们的目标是赋能每个人和每个组织,特别是在英国的企业,让他们能够实现更多——无论是提高小企业的生产力,还是帮助大型跨国企业在全球竞争中变得更具竞争力,或者是公共部门变得更加高效,提升健康和教育成果。这才是我们的使命所在。
价值投资理念、知识经验学习与交流平台,投资风险教育平台。
发现价值,践行价值。书会长期开展独立投研活动,定期发布原创研究报告,组织线下分享活动。
“行稳致远”,秉持“专业、谨慎、诚信”的精神,努力与会员和客户共同实现长期价值稳步成长。
来源:巴菲特读书会周立秋