黄仁勋谴责美国：把全球AI发展变成一场“围堵游戏”，只会促使对方更伟大

摘要：他表示：“我会毫不犹豫地选择雇佣一个年薪 10 万美元的智能体。”因为企业雇用一个人动辄几十万美元，如果可以用 10 万美元显著提升这些人的效率，那是显而易见的（明智）选择。黄仁勋认为，现在的 AI 工厂需要处理覆盖帕累托分布的 token 需求曲线：创建一个

原创学术头条学术头条

他表示：“我会毫不犹豫地选择雇佣一个年薪 10 万美元的智能体。”因为企业雇用一个人动辄几十万美元，如果可以用 10 万美元显著提升这些人的效率，那是显而易见的（明智）选择。黄仁勋认为，现在的 AI 工厂需要处理覆盖帕累托分布的 token 需求曲线：创建一个系统能同时满足不同需求，在基础的服务中能够生成免费 token，在复杂任务和高要求的任务中生成高质量 token。这就提出了一个架构难题：不能只针对某一种 token 做最优设计。他强调，如果架构过于碎片化，那么在不同部分之间来回移动工作负载就会变得困难；当设计一个在高速 token 率方面表现出色的系统时，通常它的整体吞吐量就会很低——“你可以挨着 X 轴（低延迟）做一个点，也可以贴着 Y 轴（高吞吐）做一个点，但很难覆盖整个帕累托曲线。”为了解决这个问题，英伟达推出了 Dynamo，一个面向推理优化的数据中心级系统。Dynamo 将所有处理过程进行分解，并在数据中心内智能地分散这些处理任务，同时测量工作量以及处理器的负载情况，这确实是非常复杂的事情。在黄仁勋看来，大模型推理并不是单一任务，而是一个由预填充（pre-fill）与解码（decode）组成的链式过程。预填充阶段需要从用户对话历史、文档中抽取信息并形成上下文，是一个极度依赖浮点计算的过程；而解码阶段则像是“思考”与“推理”，更依赖带宽，对精度的要求反而没那么高。“Dynamo 本质上是一个 AI 工厂的操作系统。”黄仁勋说，Dynamo 就是在处理这些差异极大的需求中智能分配的核心系统，让整个数据中心像一个“超级 GPU”一样调度资源，使 token 的每一次生成都尽可能高效。完整访谈链接：https://stratechery.com/2025/an-interview-with-nvidia-ceo-jensen-huang-about-chip-controls-ai-factories-and-enterprise-pragmatism/作者：锦鲤原标题：《黄仁勋谴责美国：把全球AI发展变成一场「围堵游戏」，只会促使对方更伟大》

来源：小鱼科技频道

标签：游戏黄仁勋 token 帕累托 dynamo

本文地址：https://news.43u.com.cn/a/1717426.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!