2024：盘点10大国产AI芯片

摘要：广义上来讲，AI芯片指的是能够运行AI算法的芯片，但业界通常是指对AI算法做了特殊加速设计的芯片，能够处理AI应用中大量计算任务的模块，因此，AI芯片也被称为加速卡、加速器。

广义上来讲，AI芯片指的是能够运行AI算法的芯片，但业界通常是指对AI算法做了特殊加速设计的芯片，能够处理AI应用中大量计算任务的模块，因此，AI芯片也被称为加速卡、加速器。

芯片是AI技术的核心基础，随着百亿、千亿级参数大模型的出现，AI算力已经增至千卡、甚至万卡的新阶段。在AI产业的强势推动下，全球厂商争相布局AI，我国也不例外，本次我们就来盘点一下近年来，我国主流AI芯片，主要来源于以下厂商（排名不分先后）

一、华为昇腾

华为昇腾的AI算力产品目前可以说是国内最丰富的，无论是产品性能，还是市场情况都是国内领先。华为主打 AI 芯片产品有昇腾310和昇腾910。昇腾310 偏推理，当前主打产品为910，拥有FP32和FP16两种精度算力，可以满足大模型训练需求。910单卡和单台服务器性能对标 A800/A100。

【昇腾910】——基于7nm+EUV工艺制造，拥有32核自研达芬奇架构，其半精度（FP16）算力达到256 Tera-FLOPS，整数精度（INT8）算力达到512 Tera-OPS，这使得它成为全球算力最强的AI处理器之一。在实际测试中，昇腾910的功耗仅为310W，低于设计规格的350W，显示出其出色的能效比。

二、寒武纪

中科寒武纪成立于2016年，专注于人工智能芯片产品的研发与技术创新，致力于打造人工智能领域的核心处理器芯片，让机器更好地理解和服务人类。寒武纪提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。

【思元370】——2021年11月，寒武纪发布第三代云端AI芯片思元370、基于思元370的两款加速卡MLU370-S4和MLU370-X4。基于7nm制程工艺，思元370是寒武纪首款采用chiplet（芯粒）技术的AI芯片，集成了390亿个晶体管，最大算力高达256TOPS(INT8)，是寒武纪第二代产品思元270算力的2倍。凭借寒武纪最新智能芯片架构MLUarch03，相较于峰值算力的提升，思元370实测性能表现更为优秀：以ResNet-50为例，MLU370-S4加速卡（半高半长）实测性能为同尺寸主流GPU的2倍；MLU370-X4加速卡（全高全长）实测性能与同尺寸主流GPU相当，能效则大幅领先。

三、燧原科技

燧原科技成立于2018年，专注于研发人工智能领域云端算力产品，提供AI加速卡、系统集群和软硬件解决方案，涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统，燧原科技的产品的核心竞争点是AI算力，例如其研发的推理加速卡，如云燧i10和云燧i20。

【云燧T10】——适用于多种训练场景，针对云端推理场景设计的高性能计算卡，提供低延迟、高能效的推理服务，适用于视频分析、语音识别等应用场景。进阶版的云燧T20和T21，可支持更高性能计算需求，适合大规模AI模型的训练。

四、昆仑芯科技

昆仑芯科技前身为百度智能芯片及架构部，于2021年4月完成独立融资，原百度芯片首席架构师欧阳剑担任昆仑芯科技CEO，2018年7月发布昆仑芯一代，2021年8月发布昆仑芯二代，目前市场销售的产品以AI加速卡R200和芯AI加速器组R480-X8为主。

【昆仑芯AI加速卡R200】——是昆仑芯科技推出的一款高性能AI加速卡，它基于昆仑芯2代AI芯片打造。这款加速卡专为深度学习、机器学习算法的云端和边缘端计算而设计，提供了强大的AI负载运行效率，适用于计算机视觉、自然语言处理、大规模语音识别、大规模推荐等场景。

五、天数智芯

天数智芯是上海天数智芯半导体有限公司注册品牌，产品主要分为推理和训练两个系列，分为智铠和天垓。主要产品包括：芯片卡、集成电路卡等。2021年，天数智芯发布国内首款通用GPU产品——天垓100。目前最新的天垓150属于旗舰训练GPU卡，但官网尚未公开。

【天垓100 GPGPU】——目前已量产（2022年天垓100系列产品累计订单接近2亿人民币)，可适配主流CPU芯片/服务器厂商，能够支持国内外主流软硬件生态和各种深度学习框架、算法模型和加速库。

七、摩尔线程

摩尔线程近年来因为白宫严选清单而名声大噪，公司比较年轻，成立于2020年，创始人是英伟达前全球副总裁张建中。2022年、2023年分别发布了苏堤、春晓、曲院三款芯片，产品只要面向消费级和数据中心级，目前最新在售的数据中心卡是MMT S4000，主打全功能服务，集训练推理为一体。

【MTT S4000】——摩尔线程大模型智算加速卡，主要作用于摩尔线程智算中心全栈解决方案，基于MTT S4000和双路8卡 GPU服务器 MCCX D800，以一体化交付的方式，解决大规模GPU算力的建设和运营问题。

八、壁仞科技

壁仞科技成立于2019年，在2022年3月点亮首款通用GPU芯片，同年8月正式发布BR100，自主原创架构，7nm工艺，770亿个晶体管。同时，壁仞科技还规划了新一代BR200。但或许是因为太过高调(一度去HotChips大会宣传)，壁仞科技随后被美国列入黑名单，无法开发新品，无法寻求台积电代工。无奈之下，壁仞科技重新开发了BR106B、BR106C PCIe计算卡，BR106M OAM模组产品，但不再公布具体参数和性能指标，只说前两者功耗为300W、150W。

【BR106B/BR106C】——分别对于OAM和PCle，壁仞基于自研的Blink技术，OAM八卡机可以实现最高8卡全互联，卡间256GB/s。BR106B、BR106C产品形态为PCIe板卡，其中BR106B峰值功耗300W，BR106C峰值功耗150W，能够为数据中心广泛应用的PCIe形态GPU服务器提供灵活部署的强大的通用算力。

九、阿里平头哥

平头哥是阿里旗下半导体公司，公司技术团队由原中天微、高通、AMD、华为海思等拥有丰富研发经验的人员构成。平头哥有两条研发主线，一是利用 ARM 的 IP 为阿里云数据中心研发芯片，在云端提供普惠算力，即倚天系列和含光系列；另一边集中在 RISC-V处理器架构的研发，如玄铁系列，主要应用是在 AIoT 领域。2021年10月19日，2021云栖大会现场，阿里巴巴旗下半导体公司“平头哥”发布自研云芯片倚天710。

【倚天710】——采用5nm工艺制造，纯64位Armv9指令集架构，128核心，每核心1MB二级缓存，共享64MB三级缓存，最高主频3.2GHz，支持八通道DDR5内存、96条PCIe 5.0通道。阿里称它是业界性能最强的ARM服务器芯片，领先超过业界标杆20％，能效比也提升50％以上，主要用于阿里云数据中心。

十、海光DCU

海光是国内唯一同时拥有信创CPU和DPU（GPGPU）的IC设计公司（技术源自AMD），主流DCU是K100系列标卡，分为K100标准版和AI版本，性能在国内相对领先，应用生态完善，覆盖全精度场景。

【海光K100AI版】——是一款高性能的AI计算单元，其主要特性和性能如下：在FP32（单精度浮点运算）模式下，K100 AI版的峰值算力为49 T；在TF32（混合精度浮点运算）模式下，其峰值算力为96；在BF16/FP16（半精度浮点运算）模式下，其峰值算力为192 T；在INT8（整数8位运算）模式下，其峰值算力为392 T，总体性能达到了A100性能的60%；

随着人工智能技术的快速发展，AI芯片已经成为了推动AI应用的关键因素。在中国，众多企业和研究机构正在积极布局AI芯片领域，力图在这一高技术领域取得突破。从阿里平头哥的倚天710到华为的昇腾910，再到寒武纪的思元370和昆仑芯科技的昆仑芯AI加速卡R200，每一款产品都代表了中国在AI芯片领域的进步和创新。

这些AI芯片不仅在性能上不断提升，满足日益增长的计算需求，而且在能效比、软硬件协同、生态建设等方面也不断优化，为AI技术在各行各业的应用提供了强有力的支持。同时，这些芯片的成功研发和应用，也展示了中国在全球AI芯片竞争中的实力和潜力。

未来，随着技术的不断进步和市场需求的不断扩大，中国的AI芯片产业有望迎来更广阔的发展空间，为全球AI技术的发展贡献更多的中国智慧和中国方案。

来源：智慧信息堂

标签：芯片加速卡 r200

本文地址：https://news.43u.com.cn/a/146221.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!