泡股 发表于 2025-12-23 21:16:35

从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期(附股)

复盘本轮AI驱动的存储逻辑,从“周期”走向“成长”的三大结构性变化:

驱动一:训练端由“存容量”转向“保吞吐”,利好高性能SSD。

原生多模态趋势下,GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及,使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求,存储不仅仅是仓库,更是保障算力效率的流水线。

驱动二:推理端长上下文与慢思考,重构SSD与DRAM规格。

长上下文缓存和思维链(System2)的引入,将推理服务器转变为“热数据交换中心”。

SSD主要用于对RAG索引和思维链日志的高频读写;DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池,以承载活跃的KVCache。

驱动三:记忆压缩算法迭代打破长记忆瓶颈,打开B端与端侧存储空间。

今年ChatgptGrok陆续发布全历史回溯功能,更高效的压缩算法(如Titans)逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在:

B端:解决了企业级应用“记不住用户习惯”的痛点,显著提升客户付费意愿。

端侧:应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级,推动需求超预期。

建议关注:

看好存储及存储设备产业链

国产算力:寒武纪、海光、华为链、沐曦、摩尔线程

从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期【天风计算机缪欣君团队】

复盘本轮AI驱动的存储逻辑,从“周期”走向“成长”的三大结构性变化:

驱动一:训练端由“存容量”转向“保吞吐”,利好高性能SSD。

原生多模态趋势下,GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及,使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求,存储不仅仅是仓库,更是保障算力效率的流水线。

驱动二:推理端长上下文与慢思考,重构SSD与DRAM规格。

长上下文缓存和思维链(System2)的引入,将推理服务器转变为“热数据交换中心”。

SSD主要用于对RAG索引和思维链日志的高频读写;DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池,以承载活跃的KVCache。

驱动三:记忆压缩算法迭代打破长记忆瓶颈,打开B端与端侧存储空间。

今年ChatgptGrok陆续发布全历史回溯功能,更高效的压缩算法(如Titans)逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在:

B端:解决了企业级应用“记不住用户习惯”的痛点,显著提升客户付费意愿。

端侧:应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级,推动需求超预期。

建议关注:

看好存储及存储设备产业链

国产算力:寒武纪、海光、华为链、沐曦、摩尔线程

大模型:Minimax、智谱、

AIAgent:深信服、金蝶国际、金山办公、虹软科技、科大讯飞、软通动力、京东工业、汉得信息、鼎捷数智、税友股份、聚水潭、天润云、医脉通、京东健康、北森控股、百融云、能科科技。

页: [1]
查看完整版本: 从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期(附股)