泡股 发表于 2025-12-25 22:25:40

互联总线——Scale-Up能力跃升的关键通路 (附股)

一、高速互联协议服务于大模型时代下的Scale-Up

服务器常见的计算机总线协议包括PCIe、Ethernet等,Switch设备负责Scale-Up中的主机通信与扩展系统宽带和设备数量。在大模型时代Scale-Up对高速互联协议产生新需求,主流的互联协议包括:NVLink、UALink、SUE、CXL、HSL、UB等。

二、Scale-Up中高速互联协议NVLink领先、众厂商追赶

1)PCIe协议与交换机是传统的计算机扩展总线标准,随技术迭代速率提升,但CPU、GPU等各设备间通信速度仍存瓶颈。

2)NVLink实现了Scale-Up中GPU与GPU间高速互联;NVSwitch则是多GPU互联推理的硬件支持;NVLink C2C则实现了Scale-Up中实现CPU与CPU、CPU与GPU间的高速互联,第五代NVLink单通道的带宽为200Gbps,而PCIe Gen5为32Gbps。

3)华为灵衢(UB)中UB Processing Unit是支持UB协议栈的处理单元,其内嵌UB Switch,实现多级UB Switch扩展组网,并支持通过UBoE与以太Switch融合组网。

4)UAlink利用以太网基础设施实现Scale-Up,每通道最高200GT/s的数据传输速率,每四条物理通道组合构成一个UALink基本单元组,在发送(TX)和接收(RX)方向上各提供最大800Gbps的带宽。

5)博通SUE借助以太网实现网络总线化,SUE在于以低延迟、高带宽的方式实现高效部署,支持以高效面积和功耗实现多实例化。

6)海光信息在光合组织2025人工智能创新大会上发布海光系统互联总线协议(HSL)1.0规范,并公布HSL未来三年的开放路线图,旨在打破技术壁垒,促进国产计算产业生态的协同创新。

三、NVLink走向开源,互联技术应服务高带宽和低延时

1)NVLink Fusion部分开源合作。MediaTek、Marvell、Alchip Technologies、Astera Labs、Synopsys和Cadence为首批合作厂商;支持定制化芯片Scale-Up以满足模型训练和推理需求;云服务商可以使用自定义ASIC、NVIDIA机架级系统和NVIDIA端到端网络平台。

算力需求演进对互联技术实现高带宽、低时延提出更高要求。随着模型规模、数据集规模及训练计算量的增加,语言建模性能呈现平滑提升趋势,要获得最优性能,上述三个因素必须同步提升;当前大型语言模型存在显著训练不足的问题,这是近期在保持训练数据量不变的情况下过度追求模型规模扩张的结果。

总线互联#有利于1)处理器与GPU:海光信息、寒武纪;2)内存互联芯片:澜起科技;3)服务器整机:工业富联、中科曙光、浪潮信息、华勤技术、紫光股份、中国长城、软通动力、神州数码、烽火通信;4)核心部件:①光模块:新易盛、天孚通信、中际旭创、光迅科技、华工科技;②散热:曙光数创、飞荣达、英维克、申菱环境、高澜股份;③铜连接:沃尔核材、华丰科技;5)IDC:奥飞数据、光环新网、大位科技、云赛智联、数据港、科华数据、世纪互联、万国数据。

页: [1]
查看完整版本: 互联总线——Scale-Up能力跃升的关键通路 (附股)