【文/观察者网 心智观察所】

6月23日,德国汉堡举行的ISC2026国际超算大会上,最新一期全球超级计算机TOP500榜单公布,来自中国的“灵晟”(Lineshine)系统以2.19EFlops的持续计算性能排名全球第一,成为世界上首个持续性能突破2EFlops的超级计算机。

这是中国超算时隔九年再次回到世界之巅。

上一次,中国占据TOP500榜首还是2017年的“神威·太湖之光”。此后多年,在芯片出口管制、技术封锁以及国际竞争加剧的背景下,中国超算逐渐淡出国际排行榜的聚光灯。很多系统没有继续参与测试提交,外界对中国超算的发展状况也逐渐失去清晰认知。

直到“灵晟”出现。

如果仅仅从榜单角度看,它代表的是一次排名回归。但如果把目光放到机柜内部,会发现这次登顶最值得关注的,不光是2.19EFlops这个数字代表的算力,而是一项此前鲜少被公众关注的技术突破——中国首颗工程化应用的国产HBM(高带宽内存)首次出现在世界第一超算系统之中。

在很多业内人士看来,这甚至比登顶本身更重要。

因为在AI时代,决定计算机性能上限的关键因素已经不再只是处理器本身,而是数据能否以足够快的速度送到处理器面前。而HBM,正是解决这一问题的核心技术。

某种意义上说,“灵晟”的登顶,既是中国超算的一次回归,也是中国高端存储产业的一次成人礼。


一场持续九年的沉默冲刺

过去几年,中国超算给外界留下了一种奇特印象。

它似乎突然“消失”了。

2019年以后,美国持续扩大对中国高性能计算领域的出口限制。从先进CPU到高端GPU,从EDA软件到先进制造设备,越来越多环节被纳入限制范围。与此同时,中国超算系统逐渐减少向TOP500榜单提交测试结果。

在国际媒体视角里,世界超算竞争似乎变成了美国与欧洲之间的角逐。

美国的Frontier率先实现Exascale计算,美国的El Capitan继续刷新性能纪录,欧洲则推进JUPITER等新一代超算建设计划。

但中国超算并没有停下来。

过去九年,中国超算产业实际上经历了一场方向深刻变化的技术重构。与其说是在追求更高排名,不如说是在重新搭建一套完整的自主计算体系。从处理器、网络互连、存储系统到操作系统和基础软件,越来越多关键环节开始摆脱对国外供应链的依赖。

“灵晟”的出现,本质上是这一轮长期积累的集中释放。

此次排名中,美国劳伦斯·利弗莫尔国家实验室的El Capitan达到1.809EFlops,美国橡树岭国家实验室的Frontier达到1.353EFlops,而“灵晟”则以2.19EFlops位居榜首。更值得注意的是,这套系统并没有采用当前全球最主流的“CPU+GPU”路线,而是走出了一条不同的道路。

这也是它引发广泛关注的重要原因。

AI时代最大的瓶颈,不是算不动,而是喂不饱

过去二十年,半导体行业最重要的竞争指标一直是计算能力。

CPU比拼主频和核心数,GPU比拼浮点运算能力。芯片产业长期遵循一个简单逻辑:晶体管越多,性能越强。

但大模型时代到来后,这套逻辑开始发生变化。

越来越多芯片工程师发现,限制系统性能增长的因素不再是算力本身,而是数据搬运能力。

以英伟达H100为例,其双精度计算能力达到数十TFLOPS级别,但如果数据无法及时送达计算单元,大量晶体管只能处于等待状态。计算资源明明存在,却无法得到充分利用。

这就是业内著名的“内存墙”(Memory Wall)问题。

在传统服务器架构中,CPU通常通过DDR内存获取数据。虽然DDR技术不断升级,但带宽提升速度远远赶不上处理器性能增长速度。过去几年,大模型参数规模从数十亿增长到数万亿,科学计算数据量同样呈指数级膨胀,处理器越来越像一辆拥有上千马力发动机的赛车,却只能通过一条狭窄的乡村公路获取燃料。

发动机已经足够强大,道路却跟不上。

于是行业开始重新审视存储系统的重要性。

如果说GPU是发动机,那么HBM就是输油管道。

在很多场景中,输油管道甚至比发动机本身更加重要。

今天的大模型训练、药物发现、气候模拟、核聚变计算以及材料科学研究,本质上已经从算力竞争演变为数据流动能力竞争。谁能更快地搬运数据,谁就能释放更多计算潜力。

而HBM正是在这样的背景下走向舞台中央。

国产HBM突破的真正意义,并不只是存储器

很多人把HBM理解为一种先进内存。

但对于产业界来说,HBM更像是一套复杂工程体系。

传统DDR内存通过主板插槽与CPU连接,数据需要跨越厘米级距离传输。而HBM则完全不同。它将多层DRAM芯片垂直堆叠,通过TSV硅通孔技术连接,并与计算芯片共同放置在硅中介层上。

原本以厘米计算的距离,被缩短到毫米级。带宽随之实现数量级提升。

但真正困难的地方并不在DRAM本身,而在封装。

从TSV工艺、晶圆减薄、微凸点焊接,到硅中介层制造、热管理设计以及大规模量产控制,HBM背后几乎集合了先进封装领域最复杂的一系列技术。

过去几年,全球HBM市场基本被韩国SK海力士、三星以及美国美光控制。表面上看是存储器竞争,本质上却是先进封装竞争。

英伟达H100、H200以及最新一代B系列芯片之所以能够实现惊人的性能,很大程度上依赖于台积电CoWoS先进封装技术与HBM的结合。

这也是为什么近年来台积电先进封装产能甚至比先进制程更加紧张。

真正稀缺的资源已经从晶圆制造转向先进封装能力。

从这个角度看,“灵晟”实现国产HBM工程化应用,其意义远超一颗存储芯片的突破。它意味着中国正在打通先进封装产业链最困难的几个环节。这背后涉及存储厂商、封装企业、设备供应商以及系统集成商的共同进步。

很多时候,人们关注的是处理器型号,却忽视了处理器下面那块面积更大的硅中介层。而对于HBM来说,后者恰恰是整个产业链最难跨越的门槛之一。

灵晟挑战的,其实是英伟达定义的计算范式

过去十年,全球高性能计算的发展路线几乎高度一致。CPU负责调度,GPU负责计算。从美国Summit到Frontier,从El Capitan到欧洲JUPITER,本质上都遵循这一思路。

原因并不复杂。GPU拥有远高于CPU的并行计算密度,在AI训练和科学计算领域拥有天然优势。英伟达因此成为AI时代最大的赢家。

但这种架构并非没有代价。

随着模型规模不断扩大,CPU与GPU之间的数据交换越来越频繁,通信成本开始快速上升。很多应用需要在CPU和GPU之间来回搬运海量数据,系统复杂度和功耗同步增长。

灵晟提出的Online Acceleration架构,试图绕开这一问题。

其核心思想并不是让CPU继续承担传统CPU角色,而是将大量原本属于GPU的矩阵计算能力直接嵌入CPU内部。

换句话说,它试图让CPU变得更像GPU。

LX2处理器内部集成矩阵加速单元,支持多精度计算和AI加速能力,同时配合HBM提供超高带宽数据供给。原本需要CPU和GPU协同完成的任务,可以在同一颗处理器内部完成。

这种设计最大的价值不光体现在性能数字,更关键的是减少数据搬运。

数据停留在同一个处理器体系内部,通信路径被显著缩短,系统复杂度同步下降。

对于科学计算与AI融合场景而言,这是一条值得关注的新路线。

过去几年,人们普遍认为未来计算体系一定是GPU主导。但灵晟提供了另一种可能:通过CPU、AI加速单元与HBM深度融合,同样能够实现超大规模智能计算。

这未必会取代GPU路线,却为未来计算体系增加了一种新的选择。

从一颗HBM到一条产业链

如果把视角进一步拉高,会发现灵晟最大的价值其实不在超算领域,而在产业链。

过去几年,美国针对中国AI产业的限制主要集中在GPU。A100、H100、H200、B200陆续进入限制名单。

但越来越多业内人士开始意识到,即便能够获得先进GPU,如果缺乏HBM,同样难以构建高性能AI系统。没有HBM,再先进的计算芯片也无法发挥全部性能。

HBM正在成为AI时代最重要的战略资源之一。

根据多家市场研究机构预测,未来几年HBM市场规模增速将远超传统DRAM市场。全球主要存储厂商几乎都在扩大HBM投资,英伟达、AMD、谷歌、微软、亚马逊等客户则提前锁定未来数年产能。

产业竞争焦点正在从“谁能设计芯片”转向“谁能获得HBM”。在这种背景下,国产HBM实现工程化落地,其意义已经超越超算本身。

未来无论是国产GPU、国产AI加速卡、国产服务器CPU还是国产云计算基础设施,都需要高带宽存储体系支撑。

如果HBM始终依赖进口,那么整个国产AI产业链都会面临不确定性。而灵晟的成功至少证明了一件事:国产HBM不再停留在实验室样品阶段,而是已经能够进入全球最顶级计算系统并稳定运行。

对于整个产业而言,这种验证远比论文和实验数据更有价值。

中国超算竞争的新阶段

从2017年的神威·太湖之光到2026年的灵晟,中国超算性能提升超过二十倍。但真正发生的重要变化,并不在于榜单上的数字,而在于技术体系本身。

九年前,人们讨论中国超算,更多聚焦于单一芯片或者单一系统。今天,人们开始讨论国产CPU、国产HBM、国产高速互连网络、国产先进封装、国产操作系统以及国产基础软件如何共同构成一个完整生态。这种变化意味着中国高性能计算正在从单点突破进入体系竞争阶段。

对于未来计算产业而言,体系能力往往比单项冠军更加重要。因为任何一块短板,都可能成为整个系统的瓶颈。

灵晟登顶世界第一,看上去只是一台超级计算机的胜利。但机柜内更深层的变化,有着更大的战略意义:国产CPU第一次与国产HBM深度融合;先进封装、存储技术和系统架构完成了一次协同验证;中国计算产业跨过了过去多年最难跨越的一道门槛。

从神威太湖之光到灵晟的九年间,中国超算重新回到世界第一。这一次,最值得关注的已经不再是榜单上的排名,而是排名背后那条正在逐渐成形的产业链。

中国正在尝试回答一个比“谁是第一”更重要的问题:

当全球算力竞争进入深水区,中国能否建立一套属于自己的计算体系。


本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。