国产HBM破局：“灵晟”登顶超算背后的自主技术,灵晟光电科技有限公司

【文/观察者网心智观察所】

6月23日，德国汉堡举行的ISC2026国际超算大会上，最新一期全球超级计算机TOP500榜单公布，来自中国的“灵晟”（Lineshine）系统以2.19EFlops的持续计算性能排名全球第一，成为世界上首个持续性能突破2EFlops的超级计算机。

这是中国超算时隔九年再次回到世界之巅。

上一次，中国占据TOP500榜首还是2017年的“神威·太湖之光”。此后多年，在芯片出口管制、技术封锁以及国际竞争加剧的背景下，中国超算逐渐淡出国际排行榜的聚光灯。很多系统没有继续参与测试提交，外界对中国超算的发展状况也逐渐失去清晰认知。

直到“灵晟”出现。

如果仅仅从榜单角度看，它代表的是一次排名回归。但如果把目光放到机柜内部，会发现这次登顶最值得关注的，不光是2.19EFlops这个数字代表的算力，而是一项此前鲜少被公众关注的技术突破——中国首颗工程化应用的国产HBM（高带宽内存）首次出现在世界第一超算系统之中。

在很多业内人士看来，这甚至比登顶本身更重要。

因为在AI时代，决定计算机性能上限的关键因素已经不再只是处理器本身，而是数据能否以足够快的速度送到处理器面前。而HBM，正是解决这一问题的核心技术。

某种意义上说，“灵晟”的登顶，既是中国超算的一次回归，也是中国高端存储产业的一次成人礼。

一场持续九年的沉默冲刺

过去几年，中国超算给外界留下了一种奇特印象。

它似乎突然“消失”了。

2019年以后，美国持续扩大对中国高性能计算领域的出口限制。从先进CPU到高端GPU，从EDA软件到先进制造设备，越来越多环节被纳入限制范围。与此同时，中国超算系统逐渐减少向TOP500榜单提交测试结果。

在国际媒体视角里，世界超算竞争似乎变成了美国与欧洲之间的角逐。

美国的Frontier率先实现Exascale计算，美国的El Capitan继续刷新性能纪录，欧洲则推进JUPITER等新一代超算建设计划。

但中国超算并没有停下来。

过去九年，中国超算产业实际上经历了一场方向深刻变化的技术重构。与其说是在追求更高排名，不如说是在重新搭建一套完整的自主计算体系。从处理器、网络互连、存储系统到操作系统和基础软件，越来越多关键环节开始摆脱对国外供应链的依赖。

“灵晟”的出现，本质上是这一轮长期积累的集中释放。

此次排名中，美国劳伦斯·利弗莫尔国家实验室的El Capitan达到1.809EFlops，美国橡树岭国家实验室的Frontier达到1.353EFlops，而“灵晟”则以2.19EFlops位居榜首。更值得注意的是，这套系统并没有采用当前全球最主流的“CPU+GPU”路线，而是走出了一条不同的道路。

这也是它引发广泛关注的重要原因。

AI时代最大的瓶颈，不是算不动，而是喂不饱

过去二十年，半导体行业最重要的竞争指标一直是计算能力。

CPU比拼主频和核心数，GPU比拼浮点运算能力。芯片产业长期遵循一个简单逻辑：晶体管越多，性能越强。

但大模型时代到来后，这套逻辑开始发生变化。

越来越多芯片工程师发现，限制系统性能增长的因素不再是算力本身，而是数据搬运能力。

以英伟达H100为例，其双精度计算能力达到数十TFLOPS级别，但如果数据无法及时送达计算单元，大量晶体管只能处于等待状态。计算资源明明存在，却无法得到充分利用。

这就是业内著名的“内存墙”（Memory Wall）问题。

在传统服务器架构中，CPU通常通过DDR内存获取数据。虽然DDR技术不断升级，但带宽提升速度远远赶不上处理器性能增长速度。过去几年，大模型参数规模从数十亿增长到数万亿，科学计算数据量同样呈指数级膨胀，处理器越来越像一辆拥有上千马力发动机的赛车，却只能通过一条狭窄的乡村公路获取燃料。

发动机已经足够强大，道路却跟不上。

于是行业开始重新审视存储系统的重要性。

如果说GPU是发动机，那么HBM就是输油管道。

在很多场景中，输油管道甚至比发动机本身更加重要。

今天的大模型训练、药物发现、气候模拟、核聚变计算以及材料科学研究，本质上已经从算力竞争演变为数据流动能力竞争。谁能更快地搬运数据，谁就能释放更多计算潜力。

而HBM正是在这样的背景下走向舞台中央。

国产HBM突破的真正意义，并不只是存储器

很多人把HBM理解为一种先进内存。

但对于产业界来说，HBM更像是一套复杂工程体系。

传统DDR内存通过主板插槽与CPU连接，数据需要跨越厘米级距离传输。而HBM则完全不同。它将多层DRAM芯片垂直堆叠，通过TSV硅通孔技术连接，并与计算芯片共同放置在硅中介层上。

原本以厘米计算的距离，被缩短到毫米级。带宽随之实现数量级提升。

但真正困难的地方并不在DRAM本身，而在封装。

从TSV工艺、晶圆减薄、微凸点焊接，到硅中介层制造、热管理设计以及大规模量产控制，HBM背后几乎集合了先进封装领域最复杂的一系列技术。

过去几年，全球HBM市场基本被韩国SK海力士、三星以及美国美光控制。表面上看是存储器竞争，本质上却是先进封装竞争。

英伟达H100、H200以及最新一代B系列芯片之所以能够实现惊人的性能，很大程度上依赖于台积电CoWoS先进封装技术与HBM的结合。

这也是为什么近年来台积电先进封装产能甚至比先进制程更加紧张。

真正稀缺的资源已经从晶圆制造转向先进封装能力。

从这个角度看，“灵晟”实现国产HBM工程化应用，其意义远超一颗存储芯片的突破。它意味着中国正在打通先进封装产业链最困难的几个环节。这背后涉及存储厂商、封装企业、设备供应商以及系统集成商的共同进步。

很多时候，人们关注的是处理器型号，却忽视了处理器下面那块面积更大的硅中介层。而对于HBM来说，后者恰恰是整个产业链最难跨越的门槛之一。

灵晟挑战的，其实是英伟达定义的计算范式

过去十年，全球高性能计算的发展路线几乎高度一致。CPU负责调度，GPU负责计算。从美国Summit到Frontier，从El Capitan到欧洲JUPITER，本质上都遵循这一思路。

原因并不复杂。GPU拥有远高于CPU的并行计算密度，在AI训练和科学计算领域拥有天然优势。英伟达因此成为AI时代最大的赢家。

但这种架构并非没有代价。

随着模型规模不断扩大，CPU与GPU之间的数据交换越来越频繁，通信成本开始快速上升。很多应用需要在CPU和GPU之间来回搬运海量数据，系统复杂度和功耗同步增长。

灵晟提出的Online Acceleration架构，试图绕开这一问题。

其核心思想并不是让CPU继续承担传统CPU角色，而是将大量原本属于GPU的矩阵计算能力直接嵌入CPU内部。

换句话说，它试图让CPU变得更像GPU。

LX2处理器内部集成矩阵加速单元，支持多精度计算和AI加速能力，同时配合HBM提供超高带宽数据供给。原本需要CPU和GPU协同完成的任务，可以在同一颗处理器内部完成。

这种设计最大的价值不光体现在性能数字，更关键的是减少数据搬运。

数据停留在同一个处理器体系内部，通信路径被显著缩短，系统复杂度同步下降。

对于科学计算与AI融合场景而言，这是一条值得关注的新路线。

过去几年，人们普遍认为未来计算体系一定是GPU主导。但灵晟提供了另一种可能：通过CPU、AI加速单元与HBM深度融合，同样能够实现超大规模智能计算。

这未必会取代GPU路线，却为未来计算体系增加了一种新的选择。

从一颗HBM到一条产业链

如果把视角进一步拉高，会发现灵晟最大的价值其实不在超算领域，而在产业链。

过去几年，美国针对中国AI产业的限制主要集中在GPU。A100、H100、H200、B200陆续进入限制名单。

但越来越多业内人士开始意识到，即便能够获得先进GPU，如果缺乏HBM，同样难以构建高性能AI系统。没有HBM，再先进的计算芯片也无法发挥全部性能。

HBM正在成为AI时代最重要的战略资源之一。

根据多家市场研究机构预测，未来几年HBM市场规模增速将远超传统DRAM市场。全球主要存储厂商几乎都在扩大HBM投资，英伟达、AMD、谷歌、微软、亚马逊等客户则提前锁定未来数年产能。

产业竞争焦点正在从“谁能设计芯片”转向“谁能获得HBM”。在这种背景下，国产HBM实现工程化落地，其意义已经超越超算本身。

未来无论是国产GPU、国产AI加速卡、国产服务器CPU还是国产云计算基础设施，都需要高带宽存储体系支撑。

如果HBM始终依赖进口，那么整个国产AI产业链都会面临不确定性。而灵晟的成功至少证明了一件事：国产HBM不再停留在实验室样品阶段，而是已经能够进入全球最顶级计算系统并稳定运行。

对于整个产业而言，这种验证远比论文和实验数据更有价值。

中国超算竞争的新阶段

从2017年的神威·太湖之光到2026年的灵晟，中国超算性能提升超过二十倍。但真正发生的重要变化，并不在于榜单上的数字，而在于技术体系本身。

九年前，人们讨论中国超算，更多聚焦于单一芯片或者单一系统。今天，人们开始讨论国产CPU、国产HBM、国产高速互连网络、国产先进封装、国产操作系统以及国产基础软件如何共同构成一个完整生态。这种变化意味着中国高性能计算正在从单点突破进入体系竞争阶段。

对于未来计算产业而言，体系能力往往比单项冠军更加重要。因为任何一块短板，都可能成为整个系统的瓶颈。

灵晟登顶世界第一，看上去只是一台超级计算机的胜利。但机柜内更深层的变化，有着更大的战略意义：国产CPU第一次与国产HBM深度融合；先进封装、存储技术和系统架构完成了一次协同验证；中国计算产业跨过了过去多年最难跨越的一道门槛。

从神威太湖之光到灵晟的九年间，中国超算重新回到世界第一。这一次，最值得关注的已经不再是榜单上的排名，而是排名背后那条正在逐渐成形的产业链。

中国正在尝试回答一个比“谁是第一”更重要的问题：

当全球算力竞争进入深水区，中国能否建立一套属于自己的计算体系。

本文系观察者网独家稿件，文章内容纯属作者个人观点，不代表平台观点，未经授权，不得转载，否则将追究法律责任。关注观察者网微信guanchacn，每日阅读趣味文章。