双剑破局!从“突破封锁”到“融合开放”,高性能计算迎来曙光

360影视 动漫周边 2025-09-12 13:55 1

摘要:导语 :曙光重磅新品的问世,不仅是一次产品迭代,更浓缩了中国高性能计算三十年从追赶到引领的探索历程,宣告着中国算力产业正式迈入“超智融合+AI集群”双轮驱动的新纪元。

导语 :曙光重磅新品的问世,不仅是一次产品迭代,更浓缩了中国高性能计算三十年从追赶到引领的探索历程,宣告着中国算力产业正式迈入“超智融合+AI集群”双轮驱动的新纪元。


2025年盛夏,算力热度持续攀升。8月中旬,鄂尔多斯2025 CCF全国高性能计算学术大会上,国内首个标准化超智融合算力平台曙光Nebula 800正式发布,让超算与智算的边界突破成为行业热议焦点。

仅隔半月,重庆2025世界智能产业博览会再传重磅消息,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布了国内首个AI计算开放架构,并推出AI超集群系统,开放多项技术能力。这一系列举措不仅标志着中国智能计算产业进入全面开放、紧密协作的新阶段,更有力推动“安卓模式”加速到来。

为什么需要“开放架构”?据笔者观察,中国AI产业正面临诸多挑战,应用场景丰富、市场需求多元,高端算力供给不足等。在这种情况下,开放架构成为最大化利用现有资源的更优途径。它能够让不同厂商的硬件和软件协同工作,形成合力,避免重复建设和资源浪费。

但机遇与挑战共存,中国AI算力领域存在明显的碎片化问题。各厂商采用不同的技术标准和接口协议,导致算力资源难以高效共享和利用。开放架构的出现正在改变这一局面。通过制定统一的技术标准和接口规范,不同厂商的产品可以实现互联互通。

如今,开放架构正在推动形成产业共识。越来越多的企业认识到,在当前的技术环境下,没有任何一家企业能够独立解决所有问题。通过开放协作,可以实现资源共享、风险共担、成果共享。这种共识的形成,为整个产业的健康发展奠定了重要基础。


曙光

AI超集群

中科曙光推出的AI超集群系统就展示了这种可能性:其支持多品牌加速卡,兼容主流软件生态,大幅降低用户的硬件成本和软件开发成本。这种开放性和兼容性为整个产业带来了新的可能性。

笔者看来,曙光重磅新品的问世,不仅是一次产品迭代,更浓缩了中国高性能计算三十年从追赶到引领的探索历程,宣告着中国算力产业正式迈入“超智融合+AI集群”双轮驱动的新纪元。

01

1990-2000

破局者的觉醒:从实验室走向产业化

高性能计算从萌芽走向蓬勃发展,深刻地改变了人类探索世界、解决复杂问题的方式。

上世纪,当我国对高性能计算的需求如饥似渴时,却遭遇了来自外部的重重技术封锁。西方国家出口到中国的高性能计算机,不仅被限制用途,还被置于“玻璃房子”的严苛监管之下,这无疑是对我国科技发展的极大掣肘。

然而,困境激发了国人自主创新的决心,1986年,“863计划”应运而生,开发研制中国自主知识产权的高性能计算机成为其中的重要使命。1990年,国家智能计算机研究开发中心的成立,也为曙光公司的诞生埋下了第一粒种子。

国家智能计算机研究开发中心的成立

1993年深秋,北京中关村的一间实验室里,科研人员盯着屏幕上跳动的字符屏住呼吸。当"曙光一号"成功完成每秒6.4亿次定点计算的瞬间,整个团队爆发出压抑已久的欢呼。这是我国首台全对称共享存储多处理并行计算机,其不仅打破了国外对高端计算设备的封锁,更在三天后迫使美国解除10亿次计算机对华禁运。这声欢呼,拉开了曙光三十年高性能计算发展的序幕。

曙光一号

1995年是曙光发展史上的重要分水岭。6月,曙光团队以"曙光一号"2000万元知识产权评估为基础,成立曙光信息产业有限公司,标志着我国高性能计算开始走向以市场与应用为导向的创新之路。

当时全球超算界仍沉迷于“拼算力”的竞赛,多数产品采用非服务器架构,而曙光团队通过分析市场趋势发现:互联网的崛起将催生海量信息服务需求,算力的易用性比峰值性能更重要。最终,曙光2000果断采用支持互联网的Cluster集群架构,成为中国第一台能兼容上万种商用软件的高性能服务器。

曙光2000-Ⅱ 超级服务器

中国高性能计算与存储领域的著名科学家郑纬民回忆道,那时我们和曙光团队常交流,核心共识是:中国高性能计算不能从零造轮子,要在软件层找突破口,这成为了后来三十年的核心方法论,从曙光一号的油气勘探系统、智能开发环境到曙光2000的自主研发机群操作系统,这些应用与市场需求的结合,让“国产算力”真正具备了替代进口的实用价值。

02

2001-2010

追跑者的跨越:从千万亿次到世界前列

进入21世纪,全球高性能计算迎来“万亿次”竞赛。

2004年,曙光4000A以8.06万亿次/秒的实测性能闯入全球TOP500前十,让中国成为继美、日之后第三个能制造10万亿次级商用超算的国家。

曙光4000A

上海超级计算中心的工程师记得,这台机器落户后,短期内就服务了300多家用户,汽车碰撞模拟、船舶流体力学计算、钢铁冶炼优化……以前只能求助国外超算的活儿,现在家门口就能干。

2010年,曙光6000(星云)再次刷新纪录:1271万亿次/秒的实测性能位列全球第二,成为中国首台千万亿次超算。更关键的是,它选择的CPU+GPU异构架构,前瞻性地契合了后来AI算力的需求。

曙光

6000高效能计算机系统

据曙光研发负责人讲述:当时很多人质疑为什么不用纯CPU,但我们看到了AI计算的潜力,事实证明,这种架构让星云系统在十年后仍能支持早期AI模型训练。

这十年,曙光最显著的突破是打通了“算力到生产力”的转化通道。

2002年,曙光3000支撑完成水稻基因测序,相关成果登上《Science》封面,这是中国农业科研首次借助国产超算实现世界级突破。2008年的曙光5000A除了科学计算,还能直接运行证券指数计算、电力安全评估等商业应用,用户不需要改一行代码,就能把普通服务器上的软件迁过来,这在以前想都不敢想。

中国计算机学会高专委专家评价:这十年,曙光的价值不仅是造机器,更在于证明了国产超算能解决“卡脖子”的实际问题。在石油行业,曙光超算将地震资料处理时间从3个月压缩到1周;在气象领域,支撑起我国首个区域精细化预报系统,台风路径预测精度提升20%。这些看得见的产业价值,让国产算力从备选变成了首选。

03

2011-2020

引领者的蜕变:从技术创新到标准制定

2015年,曙光“硅立方”的发布让全球超算界侧目。这台采用浸没式相变液冷技术的超级计算机,将PUE降至1.04,这意味着几乎所有能源都用于计算,而非散热。

更惊人的是,它的单机柜功率密度达160kW,是传统风冷机组的4-5倍,CPU主频还能提升15-20%。曙光工程师笑称:当时国外同行来参观,摸着浸满冷却液的机器说“这简直是魔法”。

曙光

“硅立方”系列高性能计算机

这项历时十年攻克的技术,不仅解决了超算“能耗黑洞”的难题,更成为数据中心节能的全球范本。截至2020年,基于“硅立方”技术的液冷方案已在全国多个超算中心落地,每年节省电量相当于3个中型水电站的发电量。

在标准制定方面,2007年曙光牵头成立“高性能计算机标准工作委员会”,这是中国高性能计算从“技术跟随”到“规则制定”的关键一步。以前我们买国外设备,得跟着他们的标准走;现在我们要让全球看到,中国方案也能成为标杆。

这一转变在2017年的“派-曙光”气象系统中体现得淋漓尽致。作为中国气象局首台采用国产卫星数据、运行国产模式的超算,它的性能是进口系统的8倍,更关键的是建立了双系统备份、数据实时同步等气象超算标准。在北京冬奥会期间,它将降雪预报精度提升至90%以上,为赛事调度提供了核心支撑。这不仅是一台机器,更是一套让气象业务放心用、高效用的标准体系。


-曙光

这十年,中国超算在全球TOP 500榜单中的数量持续领先,而曙光连续近十年占据国内TOP 100市场份额第一。但更值得关注的是“质”的变化:曙光超算的应用领域从最初的7个扩展到30多个,从科研机构延伸到企业、政府、民生服务等场景。

04

2021-2025

超智融合的新纪元:Nebula系列的突破与使命

2023年,AI大模型的爆发像一场“算力海啸”,彻底改变了行业需求。“以前超算和智算是两条平行线,超算管科学计算,智算管模型训练,”中科曙光高性能计算产品事业部总经理李柳观察到,“但大模型需要科学计算的精度+AI训练的速度,单一算力根本扛不住。”

这种需求催生了“超智融合”的新范式。2024年,曙光联合中国信通院、中国智能计算产业联盟发布首个超智融合白皮书,系统描绘了“算力融合”的技术路径;2025年,《超智融合集群能力要求》行业标准出台,首次明确了融合算力平台的能力规范——中国HPC开始从“技术输出”转向“规则输出”。

2025年发布的曙光Nebula 800,正是这一理念的落地载体。它基于紧耦合分布式异构并行体系结构,将超算的高精度计算、智算的大规模并行训练能力熔于一炉。

在算力层,支持双精度、半精度等全精度计算,既能跑材料分子模拟,又能训千亿参数大模型;在管理层,智能调度系统能自动匹配任务与算力,将中山大学附属第一医院的全基因组测序时间从4小时压缩到30分钟;在能效层,继承硅立方的液冷技术,PUE低至1.04,每年为某省气象局节省电费超千万元。

曙光Nebula 800

中国信通院研究员评价道,曙光牵头的超智融合标准,填补了国内空白,它证明中国高性能计算不仅能做技术,更能定规则,截至2025年,已有12家国内外企业宣布遵循该标准,曙光Nebula 800的技术方案被纳入国际超算协会的参考案例,中国高性能计算,正在从“参与者”变成“引领者”。

而曙光最新发布的AI超集群系统则更聚焦于支撑大模型前沿技术创新。该系统以GPU为核心,实现了“算、存、网、电、冷、管、软”一体化紧耦合设计,具备“超高性能、超高效率、超高可靠、全面开放”四大特点,可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S等场景提供高效算力底座。

05

2025-未来

下一个三十年:开放生态的比拼

从“曙光一号”突破封锁,到Nebula系列融合创新,中国高性能计算三十年的发展,是自主创新与开放协作的辩证统一。从“数值模拟仿真”到“AI for Science”,曙光一系列创新的技术成果加速了科技迈入智能世界。

全球AI竞争正在进入新阶段,技术路线选择比技术本身更重要。中国选择的开放架构路径,既符合技术发展趋势,又适应产业现实需求。这或许就是中国AI产业的"安卓时刻",通过开放协作实现后来居上,在全球AI竞争中走出一条特色发展道路。

开放架构的价值不仅在于解决当前问题,更在于为未来产业发展奠定基础。它可能催生新的产业形态和商业模式,推动整个AI产业向更加开放、协同的方向发展。

未来,以中科曙光为代表的国产厂商还将带给我们哪些高性能计算新产品、新技术惊喜?让我们拭目以待。

来源:IT168企业级

相关推荐