中国算力产业正经历一场前所未有的从“受制于人”到“自主可控”的破局之战。2025 WAIC展会集中展现了国产算力在超节点架构、光互连、异构协同以及算力集群化、全链路国产化等方面的重大突破,这是一场由底层硬件创新驱动、产业协同赋能的生态系统性突围。
其中核心技术路线包括曦智科技联合壁仞科技、中兴推出全球首款分布式光交换(dOCS)超节点,通过采用硅光芯片实现GPU间光互连,以及华为昇腾384超节点打破英伟达NVLink的私有协议垄断,为国产万卡集群提供可扩展架构新范式,同时更多国内AI芯片企业展示的系统级创新、软硬协同,打通了从技术攻坚到商业落地的正循环“最后一公里”。
这体现出国产算力逐渐从“替代备份”走向“技术引领”,其中关键胜负手在于超节点集群打破算力密度天花板,光互连/液冷等技术破解物理限制,以及开放异构生态化解碎片化困局。而以智能计算超节点应运而生并成为解决算力瓶颈的关键方案为代表,这场国产算力破局之战不仅是技术维度的创新突破,更是中国AI产业从“硬件依赖”到“系统定义”的范式跃升。
AI超节点成解决算力瓶颈关键路径
在大模型参数指数级增长推动下,业界对GPU集群的规模需求也在快速扩大,从千卡级、万卡级再到十万卡级等,这体现出对算力的需求增长速度逐步远超芯片性能提升曲线。
对于未来如何构建越来越大规模的GPU算力集群?解决路径是Scale Up和Scale Out。其中,Scale Up(纵向扩展)增加单节点资源数量,Scale Out(横向扩展)增加节点的数量。简单理解,每台服务器里面多塞几块GPU,这时一台服务器就是一个节点,即Scale Up。而通过网络将多台电脑(节点)连接起来就是Scale Out。
据了解,Scale Out考验的是节点之间通信能力,而Scale Up在性能、成本、组网和运维等方面具有重要优势。在AI训练过程中,通常包括多种并行计算方式,其中PP(流水线并行)和DP(数据并行)的通信量较小,一般交由Scale Out处理。而TP(张量并行)、 EP(专家并行)的通信量大,这就需要交由Scale Up(超节点内部)处理。
当前,超节点作为Scale Up的最优解,通过内部高速总线互连,能够有效支撑并行计算任务,加速GPU之间的参数交换和数据同步,缩短大模型的训练周期。其核心技术优势在于突破单服务器限制,数十块甚至数百块GPU集成在一个机架内;超带宽域(HBD)技术可将GPU间通信时延压缩至百纳秒级,实现GPU间数据交换的无缝衔接,并大幅降低组网复杂度;以及支持Scale Up与Scale Out融合,实现“乐高式”灵活搭建。
超节点最初是英伟达提出的概念,并将以超大带宽互联16卡以上GPU-GPU的Scale Up系统称为超节点。历经多年发展和数次迭代,2024年3月,英伟达发布NVL72超节点,可以将36个Grace CPU和72个Blackwell GPU集成到一个液冷机柜中,实现总计720 PFLOPs的AI训练性能,或1440 PFLOPs的推理性能。
从NVL72开始,超节点概念在算力行业内被频繁提及,并逐渐从蓝图走向现实。在2025WAIC现场,中国企业也带来了超节点技术方案,而且成为大会最大看点之一。
国内首个光互连光交换GPU超节点亮相
在2025WAIC“智算云启,共绘生态”论坛上,上海仪电联合曦智科技、壁仞科技、中兴通讯正式发布国内首个光互连光交换GPU超节点解决方案——光跃LightSphere X。
据悉,该超节点以曦智科技全球首创的分布式光交换(dOCS)芯片为核心,通过基于壁仞科技自主原创架构的大算力通用GPU液冷模组壁励166L与全新载板互连,并搭载中兴通讯高性能AI国产服务器及仪电开放智算云平台软件,构建起高带宽、低延迟、灵活可扩展的自主可控智算集群生态,即将于上海仪电智算中心落地。
鉴于算力集群迈入“万卡协同”时代,当前业界一种常见方案是通过提升单机柜功耗来部署更多GPU,但受限于数据中心单机柜的功耗天花板,单机柜GPU密度提升存在瓶颈。
对此,光跃LightSphere X采用光互连技术,通过增加机柜数量构建超节点,突破传统互连方式下超节点的物理限制。相比铜缆,光缆的远距离传输优势可实现交付与机柜解耦,其核心价值在于:突破单机柜功耗束缚,支持万卡级弹性扩展,兼容现有机房设施降低部署成本,并可按算力需求动态调整超节点规模,实现分阶段建设。
同时,光跃LightSphere X的曦智科技分布式光交换(dOCS)技术进一步提升了超节点的灵活度和系统可扩展性,从而达到提升系统性价比的目的。得益于多计算Chiplet与CoWoS 2.5D封装协同设计的GPU模组,光跃LightSphere X拥有强大算力。该模组基于壁仞科技的大算力(单卡1P级)通用GPU液冷模组,极大增强了集群训推性能。
未来,光跃LightSphere X将成为仪电首个采用该方案的超节点国产算力集群,其灵活的拓扑结构和规模适应不同模型的通信需求,开放的协议架构打破厂商壁垒,构建了从光芯片、GPU模组、到液冷服务器及高速域算力集群的全栈自主可控生态,可全面赋能千亿级参数大模型训练与推理需求,为我国人工智能跨越式发展提供澎湃动力。
各大AI芯片企业向“系统化”奋进
在算力基础设施的务实转型浪潮中,系统化创新、全链路国产化的推进节奏成为新焦点。因为大模型的快速发展和迭代,不仅改变了以往模型碎片化的产业生态,更驱动算力基础设施朝着系统化和集群化发展。对此,国产AI芯片企业均在不同维度的系统化攻坚奋进。
其中,摩尔线程以全功能GPU为核心底座构建的“云边端”全栈AI产品和解决方案亮相2025WAIC展览区,包括KUAE2智算集群解决方案面向大规模智算中心,集成计算、存储、网络硬件及分布式计算软件,最高支持10240个全功能GPU部署。
摩尔线程还提出,公司将通过系统级工程创新,打造生产先进模型的“AI工厂”,实现先进架构、芯片算力、单节点效率、集群效率优化与可靠性等协同跃升的深度技术创新。
目前,芯片、超节点、网络、并行计算以及云架构下的大模型适配环环相扣,为算力与大模型的协同创新与发展提供了巨大空间。鉴于此,燧原科技打出“组合拳”,在大会期间首次展出燧原S60高性能人工智能推理加速卡和DeepSeek一体机系列产品,同时还发布第四代训推一体产品燧原L600,以及推出全新计算系统——云燧OGX系列产品。
沐曦集成在大会上首次展示了旗舰训推一体GPU曦云C600以及从芯片到集群的立体化呈现。据悉,曦云C600性能全面对标国际旗舰GPU产品,包括搭载当前业界前沿的HBM3e显存等。而基于上代产品曦云C500系列芯片,沐曦在现场展示了PCIe服务器、OAM服务器和光互连服务器解决方案,这些服务器基本都实现了“全链路国产化”。
此外,无问芯穹首次发布展示了三大“操作系统级”产品——“无穹AI云”“无界智算平台”与“无垠终端智能解决方案”,分别面向跨地域智算网络、智算集群与多形态智能终端等全规模场景,统一适配多元算力,提供从模型调度、性能优化到AI应用部署的全链路支持。
据了解,无问芯穹展示的全球首创单任务千卡异构混训系统及Infini-AI异构云平台,突破异构芯片、异地集群、异属算力统一管理的技术瓶颈,算力利用率高达97.6%。
中国智算超节点首度上演“集体秀”
伴随着国内智算集群建设从单点突破迈向系统攻坚阶段,国产AI超节点无疑是系统级创新的重要体现,不仅要设计好底层芯片以及将大量芯片连接起来的“神经网络”,还需通过优化节点内的高速互联、存储架构和软件栈,最大化发挥国产芯片集群的整体效能。
在2025WAIC上,尤为受关注的是耗费数十亿元的华为昇腾384超节点真机。作为展区“镇馆之宝”,其通过总线技术达成384个NPU之间的大带宽低时延互联,有效解决集群内计算、存储等各资源之间通信瓶颈。同时,昇腾384超节点单卡推理性能提升4倍,Decoding吞吐达到2300+Tokens,通讯时延降低至50ms以下,MFU算力使用率达50%,在业界位居领先水平。
据官方公告,华为AI算力集群解决方案CloudMatrix 384,通过全互连拓扑架构实现芯片间的高效协同,可提供达300 PFLOPs密集BF16算力,性能接近英伟达NVL72系统两倍。按照国外投行观点,华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”,并且认为中国在AI基础设施上取得的突破,将对全球AI产业格局产生深远影响。
同时,中兴展示了架构代际领先的智算超节点服务器,算力高密集成、高效互联,为超大参数规模的模型训练和推理打造高算效的硬件底座。其单机柜可搭载64个GPU,内置16个计算节点,8个交换节点,机内Scale up可扩展至2048张算力卡,机间支持Scale out拓展至万卡规模。据了解,相比起华为单机搭载32卡,中兴可以做到单机搭载64卡。
此外,新华三展出的是超节点产品H3C UniPod S80000全球首秀。这是专为万亿级大模型的训练与推理需求量身打造的核心设备,支持单机柜、多机柜等多种形态,Scale-up互联规模提升300%;依托以太互联协议,可实现Scale-up南向互联;以及能够实现单机柜64卡(与中兴一样)高密部署及互联互通,并同时具备向1024卡互联演进的能力。
超聚变则带来了全球首个多元智算即插即用超级集群系统,实现全面软硬件基础设施技术和算力生态,能够兼容10+加速卡,提供双生态南北向安全异构算力。同时,其做到单柜128个AI加速卡,112G/224G的高速互连;使用第5代100%原生液冷,可实现节能超20%。
结语
在大模型时代,面对算力的需求增长速度逐步远超芯片性能提升曲线,单芯片性能差异的重要性逐渐让位于整个集群的总体效能。鉴于芯片性能、开发成本和国际限制等因素,国内要达到与国际主流方案相当的总算力需“以量补质”。这使得AI超节点成为势必被催生的高效、可扩展、标准化的算力集群架构,并且是我国构建大规模算力基础设施的现实可行方向。
可喜的是,2025WAIC显示出以壁仞科技、华为为代表的中国AI智算企业正在不断努力,攻坚从人工智能产业的核心底座——以芯片、板卡、服务器、计算集群等为核心构成的算力基础设施,再到与本土行业应用的深度创新协同,促使一条贯穿大模型生态的国产化链条加速成型。而这场中国智算超节点的“集体秀”,不仅是技术路线选择,更关乎整个产业发展命脉。