摘要:黄仁勋指出,在未来几年,人类每年生产的数据量将超过此前人类历史上生产的总和。这些数据正变得多模态化,包括视频、图像和声音等形式。这些海量数据可以用来训练 AI 的基础知识体系,为 AI 奠定坚实的知识基础。
北京时间1月7日 (星期二)上午10:30,英伟达创始人兼 CEO 黄仁勋在CES展会上带来了一场里程碑式的主题演讲,揭示 AI 与计算的未来。
从生成 AI 的核心 token 概念,到全新 Blackwell 架构 GPU 的发布,再到 AI 驱动的数字化未来,这场演讲将以跨领域的视角深刻影响整个行业。
黄仁勋指出,在未来几年,人类每年生产的数据量将超过此前人类历史上生产的总和。这些数据正变得多模态化,包括视频、图像和声音等形式。这些海量数据可以用来训练 AI 的基础知识体系,为 AI 奠定坚实的知识基础。
他认为,通用机器人的时代即将到来。推动这一领域突破的关键在于训练。而 黄仁勋的目标,是满足世界上所有数据中心的算力需求。
这应该不仅仅指现有的算力需求,他还想要创造更多的需求。在演讲中,黄仁勋还正式介绍了其世界基础模型NVIDIA Cosmos和语言基础模型NVIDIA Llama Nemotron。作为一个物理模型,Cosmos能够生成海量仿真物理数据,帮助自动驾驶和机器人企业训练自己的算法。
并且,Cosmos是一个开源模型。作为算力基础设施提供者的英伟达,正试图把模型也变成标准化的基础设施,而使用模型的企业也会与英伟达算力深度绑定。
黄仁勋的目光,已经投向AGI时代的大一统。
美东时间1月7日盘前,在CES上表现高调的英伟达股价涨近2.4%,现报每股153美元有望刷新历史新高。
有网友评论称:“牛,今晚超越苹果,全球市值第一。” 截至美东时间 1月6 日收盘,苹果总市值 3 .7 万亿 ,为全球第一大市值公司,英伟达总市值 3.66万亿,位列第二。黄仁勋身价1260亿美金。
新系列显卡冲上热搜
在大会上,黄仁勋发布了全新的RTX 50系列显卡,一月下旬上市。新一代基于Blackwell架构的RTX 5090正式发布,拥有920亿个晶体管,1999美元起。黄仁勋称,这款新显卡将成为英伟达游戏芯片业务的支柱。
此消息一出,立刻冲上微博热搜。
网友纷纷留言。有的表示要“冲”,也有表示“太贵”。
据了解,该系列采用英伟达Blackwell架构,主要面向游戏玩家、创作者和开发者,在AI驱动渲染方面取得突破。
其中,GeForce RTX 5090 GPU拥有920亿个晶体管,提供每秒超过3.352千万亿次AI操作的计算能力,是迄今为止最快的GeForce RTX GPU。在Blackwell架构创新和DLSS 4 的加持下,RTX 5090的性能比RTX 4090高出了2倍。RTX 5090显卡采用Blackwell AI技术为游戏提供电影般的图形效果,尤其是在被称为“着色器”的领域,例如,它可以通过在陶瓷茶壶表面添加瑕疵和指纹点,使陶瓷茶壶等图像看起来更逼真。
图片来源:官方直播截图
同时,黄仁勋透露称,英伟达Blackwell芯片已全面投入生产,所有主要云服务提供商均已建立系统,提供约200种不同型号和配置,来自约15家硬件制造商。
“机器人的ChatGPT时刻”
大模型遵循扩展定律(Scaling Laws),最近 AI 领域正在热烈地讨论的是规模是否走到头了。
在英伟达看来,Scaling Laws 仍在继续,所有新 RTX 显卡都在遵循三个新的扩展维度:预训练、后训练和测试时间(推理),提供了更佳的实时视觉效果。
黄仁勋宣布推出Llama Nemotron语言基础模型,分为Nano、Super和Ultra三个版本,以推进代理AI(agentic AI)的发展。
Llama Nemotron模型使用英伟达的最新技术和高质量数据集进行修剪和训练,以增强代理能力。它们擅长指令遵循、聊天、函数调用、编码和数学,同时经过尺寸优化,可以在各种英伟达加速计算资源上运行。
英伟达另一个意义重大的发布是Cosmos。
Cosmos的含义是“宇宙”,体现出英伟达对这个世界模型寄予的极大期望。
其实去年年中,Cosmos项目就已经引起外界注意。为了获取现实世界数据,据说英伟达从YouTube及其他视频平台大规模下载视频内容作为训练数据喂给Cosmos,引发了一些版权争议。谷歌和Netflix公开声明,禁止任何未经授权的内容抓取行为。
Cosmos究竟扒了多少数据?这次黄仁勋给出了答案——2000万小时的视频训练。
黄仁勋介绍,Cosmos优先考虑了自动驾驶和机器人行业的需求,开发者可以使用NVIDIA Omniverse构建基于物理的、地理空间精确的场景,然后将Omniverse渲染输出到Cosmos,后者生成逼真的、基于物理的合成数据,涵盖不同的物体、环境以及天气、时间或极端情况等条件。
相较于语言模型可以使用全网语料训练,自动驾驶和机器人的训练需要来自真实世界的训练素材,获取成本高昂,成为具身智能发展的最大障碍。为解决真实数据难以获得的问题,很多企业都转向了使用机器生成的仿真数据进行训练。
而Cosmos有望为大量无力自己生产仿真数据的企业,提供一个廉价方案。
作为自动驾驶领军者的特斯拉,会不会感受到巨大的威胁?
X平台知名博主Sawyer Merritt对此评论说,Cosmos看上去是为传统汽车制造商准备的,它们的现实世界数据收集几乎为零,落后特斯拉多年,合成数据有望解决这一问题,但未必能完全解决,因为合成驾驶数据有点像使用 ChatGPT,数据质量未必完全可靠。
马斯克转发了这条博文,并评论说——正确(correct)。
但黄仁勋已经发出了宣言:希望开源的Cosmos能像LLAMA 3改变企业AI一样,改变机器人和工业AI领域,通用机器人即将迎来“ChatGPT时刻”。
展示合作伙伴
除了秀技术之外,黄仁勋演讲中还展示了英伟达的合作伙伴。
在介绍Cosmos模型时,黄仁勋在台上一口气请出了14台不同品牌的机器人产品,其中6台来自中国,分别是宇树、智元、星动纪元、银河通用、傅利叶和小鹏的产品。
比亚迪、理想、小米、极氪等中国新能源车企,将搭载英伟达下一代智能驾驶芯片Thor。
而丰田则将与英伟达合作开发下一代自动驾驶汽车。同日,丰田也在CES 2025上宣布,其下一代汽车将具有自动驾驶功能,由英伟达的Drive AGX Orin超级计算机和以安全为重点的操作系统DriveOS提供支持。DriveOS是英伟达自动驾驶汽车平台的操作系统,该平台承诺安全、实时的人工智能处理,并集成了先进的驾驶和驾驶舱功能。
受此消息影响,丰田股价午后扩大涨幅,一度上涨3.9%。收涨1.36%。
让 AI 超级计算触手可及
黄仁勋还宣布将于5月份推出一款名为Project Digits的个人AI超级计算机,其核心是新的GB10 Grace Blackwell超级芯片,它具有足够的处理能力来运行复杂的AI模型,同时又比较小巧,可以放在桌面上,仅需标准电源插座即可运行(过去,要达到这种处理能力,需要更大、更耗电的系统)。
黄仁勋表示,“我们的目标是创建一个名为Grace Blackwell NVLink72的巨型芯片,该芯片将使用72个Blackwell GPU或144个芯片,超越世界上最快的超级计算机的能力。”他还称,创建NVLink的根本目的是围绕代理AI,它展现了延长测试时间和提升客户互动的完美模型。
图片来源:官方直播截图
外媒称,Project Digits看上去很像苹果的Mac Mini,可以处理多达2000亿个参数的AI模型,起价为3000美元。每个Project Digits系统都配备了128GB的统一连贯内存和高达4TB的NVMe存储。对于要求更高的应用,两个Project Digits系统连接在一起,可以处理多达4050亿个参数的模型。
用户还可以访问英伟达的AI软件库,包括开发工具包、协调工具以及通过Nvidia NGC目录提供的预训练模型。该系统在基于Linux的英伟达DGX操作系统上运行,支持PyTorch、Python和Jupyter笔记本等流行框架。开发人员可以使用英伟达 NeMo框架对模型进行微调,并使用英伟达RAPIDS库加速数据科学工作流。
来源:凤凰网财经plus