一文看懂英伟达的产品体系和命名规则
例如,基于Volta(伏特)架构的V100,基于Ampere(安培)架构的A100,基于Hopper(赫伯)架构的H100、H200,基于Blackwell(布莱克威尔)架构的B100、B200等。
dpu 英伟达 cuda infiniband b200 2025-05-13 13:29 1
例如,基于Volta(伏特)架构的V100,基于Ampere(安培)架构的A100,基于Hopper(赫伯)架构的H100、H200,基于Blackwell(布莱克威尔)架构的B100、B200等。
dpu 英伟达 cuda infiniband b200 2025-05-13 13:29 1
资深数码硬件爱好者朋友都知道: GeForce RTX 4090的位宽为384bit,电路板上有12个显存焊位,分别焊接了12颗单颗容量为2GB的GDDR6X显存,因此,它的总显存容量是24GB。
前言:西装革履里的芯片赌局2025年4月17日深夜,北京首都机场的停机坪上,英伟达CEO黄仁勋脱下标志性皮衣换上西装,三步并作两步钻进黑色轿车——这是他在美国H20芯片禁令生效48小时后的第二次中国行。车上摆着三份文件:55亿美元亏损财报、华为昇腾910B性能
NVIDIA CEO黄仁勋在对美国议员的讲话中写道:“我们正处于一个转折点,美国必须决定是继续引领全球人工智能的发展和部署,还是撤退和收缩。
本周三,知名 AI 创业公司,曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习,用于编写 CUDA 内核的大模型Kevin-32B。
NVIDIA近日发布了CUDA 12.9工具包,明确指出下个大版本发布将不再支持Maxwell、Pascal、Volta三大架构,而此前的CUDA 12.8版本已经有所预告。
大家知道,对于中美的科技战尤其是人工智能争霸大战,美国一直是有两种观点的。企业界一直希望的是通过倾销,使得中国企业的产品卖不出去,最终退出市场,这种观点的代表是比尔-盖茨。政客们的想法则是搞封锁,任何先进的东西都不卖给中国,让中国企业始终只能使用落后一两代的产
今年初,随着Blackwell架构的到来,英伟达在CUDA 12.8的发布说明里,提及了即将发生的变化,预计将逐步放弃对Maxwell、Pascal和Volta架构GPU的支持,提醒开发人员抓紧时间选择转向更为现代的架构。
本文解析阿里巴巴达摩院开源的EchoMimicV2技术,一款基于语音驱动的数字人生成工具,一张照片+一段语音+一段手势,就能让虚拟人物开口说话、摇头晃脑,像真人一样活灵活现!
数字 开源 阿里巴巴 cuda echomimicv2 2025-05-05 04:23 3
NVIDIA(英伟达)A100/H100 GPU:基于Ampere和Hopper架构,支持大规模AI训练与推理,适用于数据中心和超算。Jetson系列(如Jetson AGX Orin):面向边缘计算和机器人场景的低功耗AI芯片。技术特点:CUDA生态优势,兼
近期,上海交通大学与 AI Infra 创企魔形智能联合研究团队在由 IEEE 计算机协会主办的 HPCA 2025(International Symposium on High-Performance Computer Architecture)会议上,发
汽车就像时间胶囊,它们会告诉你很多关于它们制造时代的信息。20 世纪 70 年代是汽车设计的关键十年。在 70 年代初期,大多数主要汽车制造商都陷入了激烈的竞争,不断突破马力和速度的极限。这最终导致了一些世界上最强大、最具攻击性的肌肉车的诞生。但肌肉车的黄金时
科技圈又爆大新闻——华为即将测试的昇腾910D芯片,被曝要直接挑战英伟达的"AI芯片天花板"H100。这消息一出,连英伟达CEO黄仁勋都坐不住了,公开称华为是"中国最强科技公司"。这背后的故事,远不止一块芯片的较量,更是一场关于技术话语权、地缘政治和产业未来的
自semianalysis在 2024 年 12 月发表一篇详细分析 AMD 软件平庸且缺乏可用性的文章后,AMD 加快了他们的步伐,并在过去4个月针对文章所指的问题取得了快速进展。本文认为,AMD 新的紧迫感是其追赶英伟达过程中的一大积极因素。AMD 现在处
最近一段时间,小编分享了很多GeForce RTX 5060 Ti 16GB的性能测试。可能有一部分读者注意到了,会产生这样一种质疑:为什么没有关于GeForce RTX 5060 Ti 8GB和性价比更高的、关注度更高的GeForce RTX 5060的相关
上市 geforce rtx cuda geforcertx 2025-04-26 09:06 5
时值世界读书日,本文特别为您精选了 NVIDIA GTC 2025 的 12 场热门会议,邀您共同探索 AI 的下一步发展。
4月16日凌晨,英伟达在向美国证券交易委员会(SEC)提交的8-k文件中表示,公司已经接到美国特朗普政府通知,在没有得到许可的情况下,未来将无限期暂停对中国出口H20芯片。
之前尝试过用huggingface的transformer的library来下载bertmodel,并且简单的跑了一下。今天就打算测试一下CPU和gpu跑模型的性能,然后用trtllm优化一下,看能够优化到多少。
最近工作时出现了需要对稀疏矩阵的非零元素进行频繁的增删改查的场景。为了提高对稀疏矩阵的操作的速度,一个可行的做法就是使用哈希表构建稀疏矩阵,使用键 Key 和值 Value 分别存储矩阵的行列 index 与非零元的实际值。一般在 CPU 上实现的话,C++
哈希表 gpu cuda cucollections typ 2025-04-22 00:35 4
4年图形驱动(熟悉 GPU 架构,Shader instruction,以及大量 Shader debug 经验) 加一年图形编译器(LLVM)经验,想转 AI 编译器。下面是自己的准备内容。