黄仁勋谴责美国:把全球AI发展变成一场“围堵游戏”,只会促使对方更伟大

360影视 国产动漫 2025-05-22 14:40 2

摘要:他表示:“我会毫不犹豫地选择雇佣一个年薪 10 万美元的智能体。”因为企业雇用一个人动辄几十万美元,如果可以用 10 万美元显著提升这些人的效率,那是显而易见的(明智)选择。黄仁勋认为,现在的 AI 工厂需要处理覆盖帕累托分布的 token 需求曲线:创建一个

原创 学术头条 学术头条他表示:“我会毫不犹豫地选择雇佣一个年薪 10 万美元的智能体。”因为企业雇用一个人动辄几十万美元,如果可以用 10 万美元显著提升这些人的效率,那是显而易见的(明智)选择。黄仁勋认为,现在的 AI 工厂需要处理覆盖帕累托分布的 token 需求曲线:创建一个系统能同时满足不同需求,在基础的服务中能够生成免费 token,在复杂任务和高要求的任务中生成高质量 token。这就提出了一个架构难题:不能只针对某一种 token 做最优设计。他强调,如果架构过于碎片化,那么在不同部分之间来回移动工作负载就会变得困难;当设计一个在高速 token 率方面表现出色的系统时,通常它的整体吞吐量就会很低——“你可以挨着 X 轴(低延迟)做一个点,也可以贴着 Y 轴(高吞吐)做一个点,但很难覆盖整个帕累托曲线。”为了解决这个问题,英伟达推出了 Dynamo,一个面向推理优化的数据中心级系统。Dynamo 将所有处理过程进行分解,并在数据中心内智能地分散这些处理任务,同时测量工作量以及处理器的负载情况,这确实是非常复杂的事情。在黄仁勋看来,大模型推理并不是单一任务,而是一个由预填充(pre-fill)与解码(decode)组成的链式过程。预填充阶段需要从用户对话历史、文档中抽取信息并形成上下文,是一个极度依赖浮点计算的过程;而解码阶段则像是“思考”与“推理”,更依赖带宽,对精度的要求反而没那么高。“Dynamo 本质上是一个 AI 工厂的操作系统。”黄仁勋说,Dynamo 就是在处理这些差异极大的需求中智能分配的核心系统,让整个数据中心像一个“超级 GPU”一样调度资源,使 token 的每一次生成都尽可能高效。完整访谈链接:https://stratechery.com/2025/an-interview-with-nvidia-ceo-jensen-huang-about-chip-controls-ai-factories-and-enterprise-pragmatism/作者:锦鲤原标题:《黄仁勋谴责美国:把全球AI发展变成一场「围堵游戏」,只会促使对方更伟大》

来源:小鱼科技频道

相关推荐