从大模型迭代看存储：高吞吐与长记忆加速存储需求，关注B端落地进展或超预期（附股）

泡股发表于 2025-12-23 21:16:35

复盘本轮AI驱动的存储逻辑，从“周期”走向“成长”的三大结构性变化：

驱动一：训练端由“存容量”转向“保吞吐”，利好高性能SSD。

原生多模态趋势下，GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及，使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求，存储不仅仅是仓库，更是保障算力效率的流水线。

驱动二：推理端长上下文与慢思考，重构SSD与DRAM规格。

长上下文缓存和思维链（System2）的引入，将推理服务器转变为“热数据交换中心”。

SSD主要用于对RAG索引和思维链日志的高频读写；DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池，以承载活跃的KVCache。

驱动三：记忆压缩算法迭代打破长记忆瓶颈，打开B端与端侧存储空间。

今年ChatgptGrok陆续发布全历史回溯功能，更高效的压缩算法（如Titans）逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在：

B端：解决了企业级应用“记不住用户习惯”的痛点，显著提升客户付费意愿。

端侧：应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级，推动需求超预期。

建议关注：

看好存储及存储设备产业链

国产算力：寒武纪、海光、华为链、沐曦、摩尔线程

从大模型迭代看存储：高吞吐与长记忆加速存储需求，关注B端落地进展或超预期【天风计算机缪欣君团队】

复盘本轮AI驱动的存储逻辑，从“周期”走向“成长”的三大结构性变化：

驱动一：训练端由“存容量”转向“保吞吐”，利好高性能SSD。

原生多模态趋势下，GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及，使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求，存储不仅仅是仓库，更是保障算力效率的流水线。

驱动二：推理端长上下文与慢思考，重构SSD与DRAM规格。

长上下文缓存和思维链（System2）的引入，将推理服务器转变为“热数据交换中心”。

SSD主要用于对RAG索引和思维链日志的高频读写；DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池，以承载活跃的KVCache。

驱动三：记忆压缩算法迭代打破长记忆瓶颈，打开B端与端侧存储空间。

今年ChatgptGrok陆续发布全历史回溯功能，更高效的压缩算法（如Titans）逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在：

B端：解决了企业级应用“记不住用户习惯”的痛点，显著提升客户付费意愿。

端侧：应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级，推动需求超预期。

建议关注：

看好存储及存储设备产业链

国产算力：寒武纪、海光、华为链、沐曦、摩尔线程

大模型：Minimax、智谱、

AIAgent：深信服、金蝶国际、金山办公、虹软科技、科大讯飞、软通动力、京东工业、汉得信息、鼎捷数智、税友股份、聚水潭、天润云、医脉通、京东健康、北森控股、百融云、能科科技。

页: [1]

MACD888量化www.macd888.com -MACD量化论坛-MACD股票论坛-MACD888股票论坛-macd论坛-macd网站-macd官网-Macd888论坛官方-macd俱乐部's Archiver

从大模型迭代看存储：高吞吐与长记忆加速存储需求，关注B端落地进展或超预期（附股）