科技丨开发者手记:国产芯片这三年,我摸了4家的卡,差别真挺大
近期,一位知友总结了自己最近三年在国产芯片硬件性能优化方向的工作经历。他接触了多家国产芯片公司的产品(代号 A、B、C、D),分享了在这些项目中遇到的各家芯片在硬件架构、软件编程及优化上的很具体的实操问题。有的太原始难用,有的学国际主流走得顺,有的想创新却没做
近期,一位知友总结了自己最近三年在国产芯片硬件性能优化方向的工作经历。他接触了多家国产芯片公司的产品(代号 A、B、C、D),分享了在这些项目中遇到的各家芯片在硬件架构、软件编程及优化上的很具体的实操问题。有的太原始难用,有的学国际主流走得顺,有的想创新却没做
通用图形处理器(GPGPU)是GPU(图形处理器)的一种。GPGPU更强调通用计算能力,相比于GPU应用于图像处理,GPGPU更多应用于通用计算任务中。GPU具有并行计算能力强大、高带宽内存等特性,在处理大规模数据集及计算密集型任务时表现出色。近年来,随着技术
•Python 3.10.12:性能比3.8提升15%,错误提示更人性化,完美支持PyTorch 2.0+新特性
近日特斯拉解散Dojo团队、负责人离职的消息甚嚣尘上,也让观众们唏嘘不已。近几年来,对于一众摊开身子去做训练芯片的大公司也好,初创企业也好,都是血淋淋的教训:Graphcore一度号称“IPU对抗GPU”,最终被软银收购,结束独立冲锋;英特尔/Habana(G
在资本市场,有些公司的上涨是周期性的反弹;而有些公司的上涨,则是一个时代的开启。毫无疑问,英伟达属于后者。
刚好最近有时间,聊聊这三年在国产芯片上的工作经历。一方面是记录一下这三年做的一些事,一方面是基于这三年的工作经验引发的一些思考。我是在22年年中的时候离开一家大公司去了一家小公司,主要是做高性能计算,针对各种硬件做性能优化。这三年陆陆续续地接触了几款国产芯片,
8月5日的北京,一场关乎 AI 江湖格局的盛会正在上演。在当天举行的昇腾计算产业发展峰会上,华为轮值董事长徐直军重磅宣布:昇腾硬件使能 CANN 全面开源开放!这消息一出,就像给 AI 圈投下了一颗 “重磅炸弹”,瞬间点燃了全场热情。
人工智能浪潮已然席卷全球,将人工智能加速器和处理器整合到各类应用中也变得愈发普遍。然而,围绕它们是什么、如何运作、能如何增强应用,以及哪些是真实情况而哪些只是炒作,仍存在诸多误解。
基于这一背景下,徐直军在会上宣布华为昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用。
7月31日,中国互联网监管机构国家互联网信息办公室约谈英伟达,要求该公司就对华销售的H20算力芯片“后门”风险问题进行说明。
GoCV作为Go语言访问OpenCV的接口,近年来在图像处理和计算机视觉领域得到了广泛应用。2025年最新发布的gocv v0.42.0版本带来了众多重要更新和功能优化,特别是升级到了OpenCV 4.12.0,新增了gpu加速支持、视频跟踪器实现及构建体积优
在显卡战场上,新老旗舰的碰撞总是充满看点。当采用Blackwell架构的RTX 5070 Ti遇上上代次旗舰RTX 4080,一场跨越世代的性能对决就此展开。究竟是新架构更胜一筹,还是老将宝刀未老?
在2025年的显卡市场中,NVIDIA与AMD两大阵营的竞争进入白热化阶段,新一代显卡凭借架构革新与AI技术加持,重新定义了游戏与生产力场景的性能边界。本文基于3DMark Time Spy、GeForce Experience等权威测试数据,结合实际游戏帧率
在过去二十年里,英伟达(NVDA)已迅速成为全球关注的焦点。这家半导体公司被视为计算机芯片设计与制造领域的国际领导者,并助力推动了人工智能(AI)的革命性崛起。除了在游戏、数据和 AI 领域的优势,英伟达于今年 3 月宣布在波士顿设立量子研究中心,其首席执行官
机器之心报道编辑:杜伟在 AI 领域,英伟达开发的 CUDA 是驱动大语言模型(LLM)训练和推理的核心计算引擎。不过,CUDA 驱动的 LLM 推理面临着手动优化成本高、端到端延迟高等不足,需要进一步优化或者寻找更高效的替代方案。近日,CMU 助理教授贾志豪
显卡作为计算机中负责处理图形数据并输出图像到显示器的核心硬件,其功能丰富多样,远不止 “显示画面” 这么简单,以下是对显卡功能的详细解析。
对于未来的业绩增长,博通很乐观。博通CEO陈福阳表示,已有3家大型客户计划在2027年部署超百万颗AI加速芯片集群,同时预计还将新增4家客户,未来三年AI芯片市场规模有望达到600–900亿美元。博通公司预计,第三季度公司AI相关芯片收入将增长至51亿美元。这
上个月NVIDIA发布了RTX 5060,也是赶上了618的首班车。至此RTX50系列的绝大部分显卡均已上市,纵览整个系列,RTX 5060可以说是其中代际提升最大,最有性价比的,RTX 5070也比较全面,在3个分辨率下都有一战之力。
各位 GPU 极客和 AI 爱好者们,大家好。今天我们暂时放下模型,直接进入硬件对决的战场——我们将对比 NVIDIA 的 RTX 5090 和当前王者 RTX 4090,看看它们在微调(fine-tuning)和推理(inferencing)大语言模型(LL
在人工智能(AI)领域竞争激烈的重要时刻,DeepSeek发布了V3/R1等基础大模型产品,性能比肩国际领先机构OpenAI,不仅展现了中国AI领域科技创新的实力,更为全球AI发展提供了来自中国的创新路径:一是低成本训练推理,打破高端算力的垄断封锁,降低研发应