三位前AMD同事,做出国产高性能GPU独角兽

摘要:11月29日,沐曦与加佳科技共同启动曦源一号SADA万卡集群算力项目,其第一期千卡集群在上海正式落地。同时,加佳科技SADA 1+2智算产业应用生态发展项目也正式启动。

11月29日,沐曦与加佳科技共同启动曦源一号SADA万卡集群算力项目,其第一期千卡集群在上海正式落地。同时,加佳科技SADA 1+2智算产业应用生态发展项目也正式启动。

曦源一号SADA万卡集群以国产自主可控的沐曦GPU芯片技术产品为核心,着力构建集算力、算法、数据、产业应用为一体的人工智能产业新生态。

曦源一号SADA万卡集群-上海智算中心现场

针对当前国产算力生态支持不足与兼容性不高两大挑战,沐曦与加佳科技共同牵手构建了基于「全通用、全自研、全兼容」的软硬件技术架构。

在全面兼容CUDA生态的同时,支持各类应用的轻松适配和无缝融合。基于此,曦源一号SADA万卡集群也将引领国内「国产替代+国际兼容」型万卡集群的发展。

沐曦也继华为昇腾、摩尔线程之后开始构建自研GPU芯片万卡集群。

1、发展历程

1995年,沐曦创始人陈维良进入电子科技大学攻读微电子专业,本科毕业后进入清华大学,2002年研究生毕业,拿到清华大学微电子学研究所工学硕士学位后回到上海进入集成电路行业,长期就职于国际旗舰芯片厂商,负责GPU设计及产品研发,主导并完成15款通用GPU产品的流片与量产。

2020年,陈维良洞察到「东数西算」工程为国内芯片产业带来的巨大机遇,并预见到下游应用行业对数据处理需求的迅猛增长,这将直接推动算力芯片的发展。基于此,他与彭莉和杨建共同在上海自贸区临港新片区创立了沐曦。

在这个团队中,陈维良负责整体战略,彭莉主管硬件,杨建负责软件。

他们在Trident和AMD时期的合作经验,以及在大规模芯片和GPU软硬件设计领域积累的十余年甚至二十年的专业经验,为沐曦的成立奠定了坚实的基础。

沐曦从一开始目标就定在打造完全自主知识产权的高性能GPU IP,并基于自主研发的高性能GPU IP打造高性能GPU产品,并构建兼容全球主流GPU生态的软件生态MACAMACA,从而建立起技术护城河。计划两年内设计出一款全球领先的旗舰级产品。

杰出的创始团队使得沐曦得到资本市场的青睐,成立不到1年内,迅速完成从天使轮到A轮四轮融资,融资金额达数十亿。

在获得充沛资金后,沐曦自主完成研发高性能GPU IP,拥有了完全自主知识产权的指令集和架构。

沐曦按通用计算、智算推理、图形渲染推进三条产品主要管线。

2022年1月,沐曦首款采用7nm工艺的异构GPU推理芯片「曦思N100」正式流片,从立项到流片仅用了13个月。

曦思 N100内置 MXN100 异构 GPGPU 处理器以及 HBM2E 显存,单卡算力达 160TOPS(INT8)和 80TFLOPS(FP16)。

2022年8月,曦思N100回片并完成测试。并于2023年初实现规模量产。

沐曦的通用GPU也迅速推进,「曦云C500」于2023年6月完成点亮及回片。

曦云C500是对标英伟达 A100 / A800 的算力芯片,目标 FP32 算力 15 TFLOPS(英伟达 A100 的 FP32 性能为 19.5 TFLOPS),采用通用 GPU 架构,兼容 CUDA。

曦云C500在2023世界计算大会上获评「世界计算大会专题展优秀成果」,预计将于2023年底实现规模量产。

2023年10月,美国升级AI芯片和半导体设备禁令,美国商务部工业和安全局(BIS)公布新的先进计算芯片、半导体制造设备出口管制规则,限制中国购买和制造高端芯片的能力,并将两家中国GPU企业摩尔线程、壁仞科技及其子公司列入了实体清单。

沐曦虽然没被直接列入清单,但也在代工方面受到一定影响。

2、团队构成与专业背景

沐曦拥有技术完备、设计和产业化经验丰富的团队,核心成员平均拥有近20年高性能GPU产品端到端研发经验,曾主导过十多款世界主流高性能GPU产品研发及量产,包括GPU架构定义、GPU IP设计、GPU SoC设计及GPU系统解决方案的量产交付全流程。

陈维良——创始人、董事长&CEO

陈维良,沐曦创始人、董事长兼CEO,清华大学微电子学研究所硕士,曾任AMD全球GPGPU设计总负责人,负责全球通用计算GPU产品线的整体设计与管理,主导并完成15款高性能GPU产品的流片与量产,拥有近20年的芯片设计、技术研发和量产管理经验。

杨建——联合创始人、CTO兼首席软件架构师

杨建,沐曦联合创始人、CTO兼首席软件架构师,浙江大学博士,具备超过20年大规模芯片及GPU软硬件架构设计经验。

杨建曾是AMD大中华区第一位科学家(Fellow),曾参与及主导数十款GPU产品量产及交付全流程,并作为三维图形与科学计算生态专家,拥有多项发明专利。

此外,他还历任Trident、S3、ATI/AMD、海思等公司芯片架构师、软件架构师、首席架构师等职位。

彭莉——联合创始人、CTO兼首席硬件架构师

彭莉,沐曦联合创始人、CTO兼首席硬件架构师,上海交通大学电子工程系硕士。

彭莉是AMD全球首位华人女科学家,拥有15年高性能GPU芯片设计经验,历任AMD首席SOC架构师、系统架构师、GFXIP架构师等职务,主导过多款GPU产品从架构到量产的全流程。

周昆——图形计算首席科学家

周昆,沐曦图形计算首席科学家,现任浙江大学计算机辅助设计与图形学国家重点实验室主任,计算机学院副院长,教育部长江学者特聘教授,国家杰出青年科学基金获得者。

2002年获浙江大学工学博士学位,2002至2008年就职于微软亚洲研究院,历任副研究员、研究员和研究主管,2008年全职回到浙江大学工作。研究领域为计算机图形学、人机交互和虚拟现实。近年来在图形学基础算法、图形软件开发平台和GPU并行计算等方向取得多项创新成果,发表高水平论文70余篇,论文他引3000多次。获得发明专授权30多项。

3、主要业务

沐曦打造全栈GPU芯片产品,推出曦思N系列GPU产品用于智算推理,曦云C系列GPU产品用于通用计算,以及曦彩G系列GPU产品用于图形渲染,满足「高能效」和「高通用性」的算力需求。

沐曦产品均采用完全自主研发的GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA®),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是「双碳」背景下推动数字经济建设和产业数字化、智能化转型升级的算力基石。

(1)GPU产品

曦云C系列(通用GPU)

曦云C系列通用GPU芯片是针对智算及通用计算的完美解决方案,沐曦自主知识产权架构提供强大高精度及多精度混合算力,可广泛应用于智算以及通用计算、教育和科研等场景。

曦云C系列旗舰产品曦云C500基于自主研发的高性能GPU IP;基于全自研 GPU 指令集打造的MXMACA软件栈,全面兼容CUDA生态,实现用户零成本迁移;通过自主知识产权的MetaXLink实现单机8卡GPU全互联,提供构建高密度算力和云计算部署的优秀国产GPU解决方案;可广泛应用于推荐系统、自动语音识别、语音合成、图像分割检测、数据库加速等多种场景。

该产品已于2023年6月13日回片并完成测试。沐曦同时打造曦云C500液冷工作站,相对于传统的空冷系统具备高效散热、低噪音、适应性强等优势,能够更好地控制温度、保持稳定的工作状态、提供更高性能且易于维护,尤其适用于科研机构、学校等办公场景。

曦思N系列(AI推理GPU)

曦思N系列是面向云端应用的智算推理产品,采用高带宽内存,提供强大的算力和领先的视频编解码能力,可广泛应用于智慧城市、公有云计算、智能视频处理、云游戏等场景。

核心产品为曦思N100。

曦思N系列首款产品曦思N100(MXN100)是一款面向云端数据中心应用的人工智能推理GPU,内置MXN100异构GPGPU处理器以及HBM2E高带宽显存,单卡算力达160TOPS(INT8)和80TFLOPS(FP16),兼备高带宽和低延时的特性,能够提供高达128路编码和96路解码的高清视频处理能力, 兼容HEVC、H.264、AV1、AVS2等多种视频格式, 最高支持8K分辨率。

同时配备自主研发的MXMACA软件栈,与硬件架构紧密耦合,支持多种主流框架的网络模型,并支持主流计算机视觉处理和多媒体处理框架。通过持续完善的ModelZoo,让客户开箱即用,实现了各类应用场景和业务模型的快速迁移。

曦思N100可广泛应用于智慧城市、智慧安防、智慧交通、云计算、智能视频处理等场景。目前,该产品已实现规模量产。

曦彩G系列(图形处理GPU)

曦彩G系列GPU是针对图形渲染加速的解决方案,沐曦自主知识产权架构提供卓越的图形图像渲染与视频处理能力, 可广泛应用于元宇宙、云桌面、云游戏、云手机、数字孪生、XR等场景。

(2)MXMACA异构计算平台

MXMACA是由沐曦推出的一种采用通用并行计算架构解决复杂计算问题的运算平台。它包含了自研指令集架构(ISA)以及GPU内部的并行计算引擎,集成了通用计算和机器学习框架,为科学家、研究员以及各个应用领域的行业专家们提供了高灵活性和高性能的开放式软件平台。

该运算平台提供了一种简单易用的类C编程语言,供用户为MXMACA架构编写程序,使其在METAX GPU处理器上以超高效率运行。该编程语言语法简单灵活,易读易写,并且表达能力出众;同时能够兼容主流的C/C++异构计算语言,使得用户获得便捷软件适配与高效客户算子开发。

MXMACA异构计算平台支持多种开源技术,包括AI神经网络框架(TensorFlow/PyTorch等)、库(Blas/DNN等)和Linux Kernel支持等,通过不断地优化来实现更高的性能和可扩展性,帮助用户更好地用AI赋能社会。同时,MXMACA运算平台提供了丰富的系统和应用管理工具,方便用户能够更高效地进行灵活的开发、验证、环境部署及质量监控等。

4、估值及融资情况

沐曦目前完成8轮融资,最新一轮投后估值130亿人民币(来自IT桔子),融资情况如下:

5、小结

沐曦,这家由AMD团队成员创立的GPU企业,凭借其三位创始人在技术领域的互补优势,组建一支具备十余年高性能GPU设计和量产经验的完整团队。

这使得沐曦能够迅速推进自主研发的GPU IP,并在通用GPU、AI推理GPU和图形处理GPU三个方向上实现快速发展。

随着美国开始关注国内领先的GPU企业,沐曦逐渐保持低调,期待沐曦未来的发展。

来源:事故神探所

相关推荐