微软 CEO Satya Nadella 近期访谈:从带领微软转型到对AI智能体未来的分析|Bolt荐阅

360影视 2025-01-03 19:00 4

摘要:重塑微软辉煌:Satya Nadella 强调“成长型心态”和文化变革,引导微软从自满中走出,重塑使命与战略,以一致性和长期努力推动公司实现转型与持续成功。

🔍 内容摘要

1. 重塑微软辉煌:Satya Nadella 强调“成长型心态”和文化变革,引导微软从自满中走出,重塑使命与战略,以一致性和长期努力推动公司实现转型与持续成功。

2. 投资 OpenAI:微软对 OpenAI 的持续投资表明其对大模型技术和 AI 算力潜力的重视,这不仅是一项技术合作,更是微软强化其云计算和 AI 产品竞争力的长期战略。

3. 传统搜索与消费级 AI 的挑战:传统搜索是无状态的,但 AI 的“有状态化”能力,让用户可以进行更复杂的多轮交互式搜索,显著提升了信息获取的效率和精确度,重新定义了搜索引擎的核心价值。

4. AI 智能体的未来发展:未来的智能体不仅需要具备记忆和复杂任务执行能力,还必须在数据安全、隐私保护和透明治理方面满足用户和监管的要求,以实现真正的普及化。

5. 智能体在 Windows 和开放平台的潜力:Windows 的开放性允许用户拥有更多控制权,但需要通过增强安全措施(如权限管理)来防范风险。

6. 智能体的突破方向:实现记忆功能、优化任务执行效率并完善权限管理是 AI 智能体未来发展的关键,这些将决定其能否在更广泛的应用场景中胜出。

图|播客 Shownotes

微软转型

1) Brad Gerstner:你于 1992 年加入微软;2007 年接手在线业务;2009 年推出 Bing 搜索引擎;2011 年负责服务器业务,并推出 Azure(微软的云计算平台);2014 年成为微软 CEO。在你的领导下,Azure 的营收从 10 亿美元增长到 660 亿美元,推动公司总营收提升了 2.5 倍,总利润增长超过 3 倍,股价几乎翻了 10 倍,为微软市值增加了近 3 万亿美元。

回顾过去十年,哪些关键改变帮助你释放了公司的潜力,改变了微软的方向,并带来了如此非凡的成功?

Satya Nadella:对我来说,这是一段从 1992 年持续至今的旅程,尽管 2014 年是一个重要节点,标志着我承担了更大的责任。我的核心理念很简单:观察我们何时成功、何时失败,然后更多地重复成功,尽量避免失败。

1992 年,我加入微软,当时公司刚推出 Windows 3.1。我原本在 Sun Microsystems(太阳微系统公司)工作,计划去读商学院,但接受了微软的邀请,这是我做过的最明智的决定。那时,Windows NT(1993 年推出的操作系统系列)和 x86(1978 年推出的英特尔处理器架构)让我意识到客户端的变化将传导至服务器端。微软作为一家平台和合作伙伴公司,会顺应这波浪潮蓬勃发展。

随后,互联网兴起带来了新的转型。我们在浏览器领域取得了一定成功,却错失了“搜索”这一互联网的核心组织层。当时,微软没有意识到搜索的重要性。移动领域亦如此,尽管我们参与其中,但未能抓住机会,而 iPhone 的出现改变了一切。幸运的是,我们在云计算方面做对了决策。

如今,我们正迎来 AI 带来的第四次转型。回顾这些经验,我学到的一个重要教训是:不要因为竞争对手的举动而盲目跟随。快速跟随有时是有效的,但如果仅仅出于嫉妒去模仿,是无法成功的。关键在于你所做的事情与公司的利益、品牌精神是保持一致的。并清楚我们能够做得更好。

例如,Jeffrey Moore(知名作家、演讲者和顾问)曾告诉我:“做那些客户期待你去做的事情。”我非常认同这个观点。以云计算为例,刚接触 Azure 时,很多人告诉我云计算是一场赢家通吃的竞争,Amazon 已经赢了。但我并不认同,因为在服务器领域与 Oracle 和 IBM 竞争的经历让我深知,基础设施领域不可能是赢家通吃的局面。

关键在于识别自身的结构性优势,以及合作伙伴和客户对我们的期望,并基于此采取行动。我认为这是战略的核心,也是我们取得成功的原因之一。当然,文化、使命感和目标也是实现成功的必要条件。但从战略角度来看,识别并利用结构性优势以及客户的“许可”,是我认为自己做得比较成功的地方。

2) Bill Gurley:有些人认为微软的黄金时代已经过去了,那么,作为新任 CEO,你具体做了什么来重塑企业文化并推动公司走向新的方向?对其他新任 CEO,你有什么建议?

Satya Nadella:我认为我的最大优势在于,我是一个彻头彻尾的“内部人士”。我的整个职业生涯几乎都在微软度过。因此,当我批评公司文化时,实际上也是在批评自己。从某种意义上说,这让我避免了外来者批评内部人员时可能带来的对立局面。更多的时候,我是在反思自己的行为,因为我本身就是这家公司文化的一部分。正是这样的背景,使我在推动文化变革时,能够更自然地指出问题,而不会让人感到我是从外部视角在评判公司。

我记得微软第一次成为市值最高的公司时,我走在公司园区,深刻感受到当时我们,包括我自己,都有一种自满的情绪,仿佛一切的成功都归功于我们的聪明才智。但那种感觉提醒我,这种文化是绝对需要避免的。正如我经常说的,从古希腊到现代硅谷,唯一会让文明、国家和公司衰落的东西就是傲慢。

在成为 CEO 的前几年,我的妻子曾向我推荐了 Carol Dweck 的《Mindset》。我最初是为孩子的教育读这本书,但后来发现,书中的“成长型心态”理念不仅对教育有帮助,也完全适用于工作和生活。事实上,这种理念也成为了微软推动文化变革的核心。这不仅是一个管理理论,它贯穿于生活的方方面面:你可以成为更好的父母、伴侣、朋友、邻居、经理,甚至是领导者。

我常用一句话来总结这一点:从“无所不知”转变为“无所不学”。但这并不是一个可以抵达的终点,因为一旦你觉得自己已经具备成长型心态,实际上就违背了这种心态的本质。

推动文化变革需要时间、耐心,以及自上而下和自下而上的共同努力。无论是在公司全员会议,还是我的高管团队会议中,我都会以使命和文化为讨论的起点和终点。在过去近 11 年里,我始终坚持这样的框架:使命、文化,以及具体的战略与产品方向。每一个词都是经过精心选择的,我反复强调这些核心理念,甚至到让自己都觉得重复得有些乏味,但正是这种一致性,使文化变革真正生根发芽。

Part.02

投资 OpenAI

3) Brad Gerstner:微软错过了搜索和移动,但搭上了云计算的末班车。当你开始考虑下一个阶段的转变时,似乎很早就意识到 Google 可能在 AI 领域凭借 DeepMind 处于领先地位。于是,你们决定投资 OpenAI。是什么让你坚定了这个方向,而不是继续专注于微软内部的 AI 研究?

Satya Nadella:微软在 AI 领域的投入已经持续了很长时间。1995 年,比尔·盖茨创立了微软研究院(MSR),其早期研究方向之一就是自然用户界面(NUI),旨在通过自然直观的方式让用户与设备交互。他对此非常感兴趣,第一个研究团队专注于语音技术,Rick Rashid(微软前首席研究官)和李开复(曾任微软亚洲研究院院长)都参与其中。我们始终致力于攻克 NUI,尤其在语言处理方面投入了大量精力。事实上,Geoffrey Hinton(深度学习之父)早期在 MSR 期间就从事深度神经网络(DNN)的研究,后来被 Google 聘用。

然而,在 2010 年代初期,我们错失了一些关键时机,未能像 Google 那样大力投资 DeepMind 等项目。这让我感到遗憾,但我一直想找到突破口,比如 Skype Translate,这是我早期非常关注的项目之一。在这个项目中,我们首次发现了迁移学习的潜力:训练一个语言对(language pair:一对源语言和目标语言)的模型能够提升其他语言对的表现。这让我对语言处理技术充满兴趣,也促使我和 Kevin Scott(微软首席技术官)持续关注这一领域。

我第一次接触 OpenAI,是因为 Elon Musk 和 Sam Altman 希望使用微软的 Azure 资源(微软提供的一项云计算平台服务)。当时他们主要专注于强化学习(RL)和 Dota 2 等项目。后来,他们再次找到我们,讨论语言处理技术,尤其是 Transformers 和自然语言模型。这是一个关键时刻,因为涉及到我们的核心业务。

这也涉及我曾经对微软的战略定位的思考——微软在信息管理领域的结构性定位究竟是什么?想要在已有的模型结构中找到非线性的增长突破,就像 Bill 你总说(Bill 指本 Podcast 主持人 Bill Gurley,投资机构 Benchmark 合伙人),在数字世界里,关键在于信息管理。我们来整理和表达数字世界。因此,微软曾尝试通过 WinFS 等项目将所有信息进行模式化,但实践证明,这几乎是不可能的。突破点在于如何通过语言和推理来实现这一目标。

这些因素促使我选择与 OpenAI 合作。他们团队的野心让我印象深刻,尤其是在 Scaling Laws 上的研究,我当时看了 Dario(原 OpenAI 研究副总裁,现 Anthropic 创始人兼 CEO)写的关于 Scaling Law 的研究,当时 Ilya也还在 OpenAI,我们决定赌一把,事实证明这是正确的选择。比如 GitHub Copilot 的成功案例,就进一步增强了我们在这一领域深耕的信心。

Part.03

传统搜索和消费级 AI

4) Brad Gerstner:从应用层面来看,消费级 AI 正在对传统搜索引擎带来巨大的挑战。现在的消费者更倾向直接获取答案,而不是通过搜索引擎寻找信息。你怎么看这种变化?在“答案时代”,Google 和 Bing 是否还能继续发展传统搜索业务?应该采取哪些措施才能与 ChatGPT 竞争?

Satya Nadella:“聊天与答案的结合”是 ChatGPT 的独特之处。无论是品牌还是产品,它都像一个有状态化的智能体,有状态化。而传统搜索尽管拥有搜索历史,本质上仍然是无状态的。我与苹果尝试达成搜索合作已有十年。当库克最终与 Sam 合作时,我是最开心的人。我宁愿 ChatGPT 获得这次合作机会,因为微软与 OpenAI 之间有商业与投资关系。

分发能力在这一领域尤为重要,这是 Google 的巨大优势。他们在苹果设备和安卓系统上都是默认搜索引擎,可以帮他们触达广泛的用户群体。而用户习惯一旦形成,很难改变。比如,许多人仍会直接在浏览器地址栏输入问题,即使我更倾向于使用 Copilot(微软 AI 助手),但在导航性搜索时,我依然会选择 Bing。不过,对于大多数其他查询,我已经转向使用 Copilot。这种用户行为的转变正在越来越多的发生。

在一些领域,比如购物和旅行,我们只差一两个强大的AI代理,便可实现彻底变革。这可能成为传统搜索被颠覆的关键点。企业级搜索虽然尚未完全迁移到聊天界面,但一旦这一变化开始,转变将非常迅速。

Mustafa(DeepMind 联合创始人之一)的团队有三个核心产品:Bing、MSN(微软门户网站和新闻服务)以及 Copilot。这三者形成了一个生态系统:信息流、传统搜索和新的智能体界面。它们都与内容提供商建立了社交契约,例如流量、支持付费墙和广告等模式。此外,微软也有分发优势,比如 Windows,这始终是我们的强项。

虽然我们曾在浏览器领域输给 Chrome,但现在通过 Edge 和 Copilot,我们有机会重新争夺市场。即便是像 Gemini 这样的新玩家,也必须努力争取用户。不管怎么说,Windows 是一个开放系统,在这个平台上,Gemini 有机会,ChatGPT 也有机会。

Part.04

AI 智能体的未来

5) Bill Gurley:大家都在讨论智能体的未来,尤其是在跨应用或系统数据上的操作问题。微软掌控着 Windows 生态系统,同时也在 iPhone 和 Android 上推出了应用程序。那么,苹果是否会允许微软控制 iOS 上的其他应用吗?微软会允许 ChatGPT 在 Windows 上启动应用并且获取应用的数据吗?如果考虑一下搜索和商业化的关系,那就可以再延伸这个问题到,例如Booking 是否会允许 Gemini 在未经许可或知情的情况下执行交易?

Satya Nadella:我们目前还无法预测这一切会如何发展。不过可以参考一些传统做法,比如早期商业应用如何通过连接器和连接器许可实现互操作性,并因此形成了一种商业模式。SAP(服务访问点)是一个经典案例:只要拥有连接器,就可以访问 SAP 的数据。我认为,随着智能体之间的接口出现,类似的模式也可能在智能体中出现。

在消费领域,情况更为不确定。在企业领域,规则可能更明确。如果你想在我的“操作空间”内执行任务,或从我的“数据模型”中提取数据,可能需要通过某种许可的接口。以微软的 Copilot 为例,目前我可以通过连接器访问 Adobe、SAP,甚至CRM(客户关系管理)等系统。

我们订阅了大量 SaaS 应用,但实际上很少直接使用,更多是通过团队中的某个人输入数据。在 AI 时代,数据使用强度大幅提升,因为所有数据变得触手可及。一个简单的查询就能调用所有数据源。例如,我可以发起一个请求:“告诉我 Benchmark(硅谷著名风投公司)投资的所有公司信息。”系统就能从网络和 CRM 数据库中整合数据,生成一份详细笔记。所以在某种程度上,所有这些都可以被商业化。

6) Bill Gurley:你们会允许 ChatGPT 在 Windows 操作系统上随意打开各种应用吗?

Satya Nadella:关于这种“超越计算”(over-the-top computing)的行为,控制权到底掌握在谁手里——是用户,还是操作系统?这是一个值得探讨的问题。在 Windows 这样的开放平台上,最终的控制权更多掌握在用户手里。除了设置一些安全护栏,我们并没有太多方法阻止用户自主选择这些行为。这让我最担忧的一点是安全风险。如果恶意软件被下载并开始自动执行操作,可能会造成严重后果。因此,我们需要在操作系统层面加入更多防护措施,比如提升访问权限管理、明确设置特权,以规范这些计算行为。

而对于苹果和谷歌,他们的平台显然更加封闭,拥有更大的控制权。他们可能根本不会允许这种情况发生。从某种意义上看,这是他们的优势,但也取决于未来的反垄断法规如何裁决。这一领域的发展值得持续关注。

7) Bill Gurley:你会允许 Android AI,或 iOS AI,通过微软客户端访问手机上的电子邮件吗?

Satya Nadella:我们曾授权 Apple Mail 与 Outlook 实现同步。从表面看,这种做法似乎会导致价值外泄(开放某些核心功能可能弱化自身竞争优势)。但从长远看,这其实是维持 Exchange 市场份额的关键。如果当时我们没有这么做,影响可能更为严重。

我们需要围绕 Microsoft 365 建立一套信任机制。这种信任框架有两个核心原则:

1. 数据所有权和客户授权:这些数据属于客户,而非微软。任何代理都需经过客户同意,同时需要客户的 IT 部门批准。这不是微软可以一键设置的某种通用权限,而是需要明确的客户授权流程。

2. 建立信任边界:在接入代理的过程中,我们必须定义清晰的信任边界。这种机制类似于苹果在其生态系统中构建的信任体系。例如,Apple Intelligence 在用户隐私和数据保护上设置了严格的规则。我们会围绕 Microsoft 365 采取类似的方式,通过建立高度透明的权限管理和合规体系,确保每一次数据调用和操作都在信任框架内完成。

8) Brad Gerstner:Mustafa 说 2025 年将是拥有“无限记忆”的一年,而我们认为下一个 10 倍的突破点可能是将持久记忆与执行任务的能力结合起来。我们已经看到一些雏形,我也相信 2025 年记忆问题大致能解决。

那么,我何时可以对 ChatGPT 说:“帮我订下周二西雅图四季酒店的最低价房间”?你认为计算机操作会成为早期的试验案例吗?你觉得实现这个目标会很难吗?

Satya Nadella:是的,目前最开放的任务执行领域依然面临巨大挑战。然而,除了提升模型本身及其基础能力之外,还有两三个方向值得重点关注:

1. 记忆:让模型拥有更持久的记忆能力以及上下文感知能力。

2. 工具使用或任务执行:让代理能够执行更复杂的操作。

3. 权限管理:以微软内部的 Purview 产品为例(一款数据治理和合规性解决方案),权限管理在确保用户以安全方式访问内容、同时具备治理功能方面,变得愈发重要。

如果能够将这三个方向整合在一起,打造具备管理能力、可验证性以及记忆能力的智能体,自主工作这个领域将进入一个全新的阶段。

尽管如此,我仍然认为 Co-pilot 是 AI 界面设计的关键。即使在完全自主化的未来,某些例外情况依然需要通过请求许可或确认调用来处理。因此,UI 层将在组织工作、成果展示和流程管理中起到核心作用。

目前,GPT-4.0 模型已经在功能调用方面表现良好。在 ToB 场景中,它的功能更加完善,但在 ToC 应用上仍面临更大的挑战。原因在于开放式的网络功能调用难度较高。例如,在多个网站上完成功能调用相对简单,但当任务涉及到预订票务等情境时,后端架构的变化可能会导致模型出错。

我认为 O1 版本或许能够更进一步。如果它可以实现可验证、自适应,会更具突破性。然而,要真正实现大范围的自动化任务执行,可能还需要一到两年的时间。

不过,从企业视角来看,当前我们已经可以通过 Dynamics 系统(微软的企业资源规划和客户关系管理系统)实现一些自主任务。例如,销售代理、市场代理和供应链代理能够自动完成供应商沟通、更新数据库、调整库存等任务。在某些特定场景下,这些功能已经能够有效运行。

Part.05

AI 重塑工作与应用

9) Brad Gerstner:现在很多人都在讨论如何衡量投资回报率(ROI)。微软有超过 22.5 万名员工,你们是否在利用 AI 提升生产力、降低成本、增加收入?如果有,最大的实例是什么?

当我问黄仁勋他如何实现营收 2 到 3 倍增长时,他预计员工数量仅增加 25%,因为有 10 万个 AI Agents 帮助完成工作。如果 Azure 要实现 2 到 3 倍的营收增长,你是否也预计员工数量会有类似的杠杆效应?

Satya Nadella:这个问题不仅是微软关注的重点,也是客户的关注点。我将其视为知识工作的“精益生产”管理。在工业领域,“精益”通过提高价值和减少浪费,实现增长。而 AI 可以看作知识工作的“精益”,推动端到端流程优化,自动化并提高效率。

在具体应用上:

1. 客户服务:我们在客户服务上的年投入约 40 亿美元,从 Xbox(微软游戏机)到 Azure,通过前端拦截率的提高降低成本,同时提高客服效率和客户满意度。

2. GitHub Copilot:Copilot 完全改变了开发者工作流,从问题到计划,再到多文件编辑,流程更加高效。

3. Microsoft 365 Copilot:这是最广泛的应用之一,比如我每次准备客户会议,Copilot 会从 CRM、邮件、Teams 会议记录及网络信息中整合所有内容,生成动态报告,与团队实时共享。过去需手动准备的 CEO 简报流程被直接简化为一个搜索查询。

此外,供应链通常滞后于实时数据,而 AI 可以实时提供决策支持,改变传统的滞后流程。总体目标是通过 AI 实现运营杠杆,以减少总体人力成本,提高单人产出效率和研究员的 GPU 使用率。

来源:新浪财经

相关推荐