摘要:广义上来讲,AI芯片指的是能够运行AI算法的芯片,但业界通常是指对AI算法做了特殊加速设计的芯片,能够处理AI应用中大量计算任务的模块,因此,AI芯片也被称为加速卡、加速器。
广义上来讲,AI芯片指的是能够运行AI算法的芯片,但业界通常是指对AI算法做了特殊加速设计的芯片,能够处理AI应用中大量计算任务的模块,因此,AI芯片也被称为加速卡、加速器。
芯片是AI技术的核心基础,随着百亿、千亿级参数大模型的出现,AI算力已经增至千卡、甚至万卡的新阶段。在AI产业的强势推动下,全球厂商争相布局AI,我国也不例外,本次我们就来盘点一下近年来,我国主流AI芯片,主要来源于以下厂商(排名不分先后)
一、华为昇腾
华为昇腾的AI算力产品目前可以说是国内最丰富的,无论是产品性能,还是市场情况都是国内领先。华为主打 AI 芯片产品有昇腾310和昇腾910。昇腾310 偏推理,当前主打产品为910,拥有FP32和FP16两种精度算力,可以满足大模型训练需求。910单卡和单台服务器性能对标 A800/A100。
【昇腾910】——基于7nm+EUV工艺制造,拥有32核自研达芬奇架构,其半精度(FP16)算力达到256 Tera-FLOPS,整数精度(INT8)算力达到512 Tera-OPS,这使得它成为全球算力最强的AI处理器之一。在实际测试中,昇腾910的功耗仅为310W,低于设计规格的350W,显示出其出色的能效比。
二、寒武纪
中科寒武纪成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片,让机器更好地理解和服务人类。寒武纪提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。
【思元370】——2021年11月,寒武纪发布第三代云端AI芯片思元370、基于思元370的两款加速卡MLU370-S4和MLU370-X4。基于7nm制程工艺,思元370是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。凭借寒武纪最新智能芯片架构MLUarch03,相较于峰值算力的提升,思元370实测性能表现更为优秀:以ResNet-50为例,MLU370-S4加速卡(半高半长)实测性能为同尺寸主流GPU的2倍;MLU370-X4加速卡(全高全长)实测性能与同尺寸主流GPU相当,能效则大幅领先。
三、燧原科技
燧原科技成立于2018年,专注于研发人工智能领域云端算力产品,提供AI加速卡、系统集群和软硬件解决方案,涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统,燧原科技的产品的核心竞争点是AI算力,例如其研发的推理加速卡,如云燧i10和云燧i20。
【云燧T10】——适用于多种训练场景,针对云端推理场景设计的高性能计算卡,提供低延迟、高能效的推理服务,适用于视频分析、语音识别等应用场景。进阶版的云燧T20和T21,可支持更高性能计算需求,适合大规模AI模型的训练。
四、昆仑芯科技
昆仑芯科技前身为百度智能芯片及架构部,于2021年4月完成独立融资,原百度芯片首席架构师欧阳剑担任昆仑芯科技CEO,2018年7月发布昆仑芯一代,2021年8月发布昆仑芯二代,目前市场销售的产品以AI加速卡R200和芯AI加速器组R480-X8为主。
【昆仑芯AI加速卡R200】——是昆仑芯科技推出的一款高性能AI加速卡,它基于昆仑芯2代AI芯片打造。这款加速卡专为深度学习、机器学习算法的云端和边缘端计算而设计,提供了强大的AI负载运行效率,适用于计算机视觉、自然语言处理、大规模语音识别、大规模推荐等场景。
五、天数智芯
天数智芯是上海天数智芯半导体有限公司注册品牌,产品主要分为推理和训练两个系列,分为智铠和天垓。主要产品包括:芯片卡、 集成电路卡等。2021年,天数智芯发布国内首款通用GPU产品——天垓100。目前最新的天垓150属于旗舰训练GPU卡,但官网尚未公开。
【天垓100 GPGPU】——目前已量产(2022年天垓100系列产品累计订单接近2亿人民币),可适配主流CPU芯片/服务器厂商,能够支持国内外主流软硬件生态和各种深度学习框架、算法模型和加速库。
七、摩尔线程
摩尔线程近年来因为白宫严选清单而名声大噪,公司比较年轻,成立于2020年,创始人是英伟达前全球副总裁张建中。2022年、2023年分别发布了苏堤、春晓、曲院三款芯片,产品只要面向消费级和数据中心级,目前最新在售的数据中心卡是MMT S4000,主打全功能服务,集训练推理为一体。
【MTT S4000】——摩尔线程大模型智算加速卡,主要作用于摩尔线程智算中心全栈解决方案,基于MTT S4000和双路8卡 GPU服务器 MCCX D800,以一体化交付的方式,解决大规模GPU算力的建设和运营问题。
八、壁仞科技
壁仞科技成立于2019年,在2022年3月点亮首款通用GPU芯片,同年8月正式发布BR100,自主原创架构,7nm工艺,770亿个晶体管。同时,壁仞科技还规划了新一代BR200。但或许是因为太过高调(一度去HotChips大会宣传),壁仞科技随后被美国列入黑名单,无法开发新品,无法寻求台积电代工。无奈之下,壁仞科技重新开发了BR106B、BR106C PCIe计算卡,BR106M OAM模组产品,但不再公布具体参数和性能指标,只说前两者功耗为300W、150W。
【BR106B/BR106C】——分别对于OAM和PCle,壁仞基于自研的Blink技术,OAM八卡机可以实现最高8卡全互联,卡间256GB/s。BR106B、BR106C产品形态为PCIe板卡,其中BR106B峰值功耗300W,BR106C峰值功耗150W,能够为数据中心广泛应用的PCIe形态GPU服务器提供灵活部署的强大的通用算力。
九、阿里平头哥
平头哥是阿里旗下半导体公司,公司技术团队由原中天微、高通、AMD、华为海思等拥有丰富研发经验的人员构成。平头哥有两条研发主线,一是利用 ARM 的 IP 为阿里云数据中心研发芯片,在云端提供普惠算力,即倚天系列和含光系列;另一边集中在 RISC-V处理器架构的研发,如玄铁系列,主要应用是在 AIoT 领域。2021年10月19日,2021云栖大会现场,阿里巴巴旗下半导体公司“平头哥”发布自研云芯片倚天710。
【倚天710】——采用5nm工艺制造,纯64位Armv9指令集架构,128核心,每核心1MB二级缓存,共享64MB三级缓存,最高主频3.2GHz,支持八通道DDR5内存、96条PCIe 5.0通道。阿里称它是业界性能最强的ARM服务器芯片,领先超过业界标杆20%,能效比也提升50%以上,主要用于阿里云数据中心。
十、海光DCU
海光是国内唯一同时拥有信创CPU和DPU(GPGPU)的IC设计公司(技术源自AMD),主流DCU是K100系列标卡,分为K100标准版和AI版本,性能在国内相对领先,应用生态完善,覆盖全精度场景。
【海光K100AI版】——是一款高性能的AI计算单元,其主要特性和性能如下:在FP32(单精度浮点运算)模式下,K100 AI版的峰值算力为49 T;在TF32(混合精度浮点运算)模式下,其峰值算力为96;在BF16/FP16(半精度浮点运算)模式下,其峰值算力为192 T;在INT8(整数8位运算)模式下,其峰值算力为392 T,总体性能达到了A100性能的60%;
随着人工智能技术的快速发展,AI芯片已经成为了推动AI应用的关键因素。在中国,众多企业和研究机构正在积极布局AI芯片领域,力图在这一高技术领域取得突破。从阿里平头哥的倚天710到华为的昇腾910,再到寒武纪的思元370和昆仑芯科技的昆仑芯AI加速卡R200,每一款产品都代表了中国在AI芯片领域的进步和创新。
这些AI芯片不仅在性能上不断提升,满足日益增长的计算需求,而且在能效比、软硬件协同、生态建设等方面也不断优化,为AI技术在各行各业的应用提供了强有力的支持。同时,这些芯片的成功研发和应用,也展示了中国在全球AI芯片竞争中的实力和潜力。
未来,随着技术的不断进步和市场需求的不断扩大,中国的AI芯片产业有望迎来更广阔的发展空间,为全球AI技术的发展贡献更多的中国智慧和中国方案。
来源:智慧信息堂