从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期(附股)
复盘本轮AI驱动的存储逻辑,从“周期”走向“成长”的三大结构性变化:驱动一:训练端由“存容量”转向“保吞吐”,利好高性能SSD。
原生多模态趋势下,GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及,使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求,存储不仅仅是仓库,更是保障算力效率的流水线。
驱动二:推理端长上下文与慢思考,重构SSD与DRAM规格。
长上下文缓存和思维链(System2)的引入,将推理服务器转变为“热数据交换中心”。
SSD主要用于对RAG索引和思维链日志的高频读写;DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池,以承载活跃的KVCache。
驱动三:记忆压缩算法迭代打破长记忆瓶颈,打开B端与端侧存储空间。
今年ChatgptGrok陆续发布全历史回溯功能,更高效的压缩算法(如Titans)逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在:
B端:解决了企业级应用“记不住用户习惯”的痛点,显著提升客户付费意愿。
端侧:应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级,推动需求超预期。
建议关注:
看好存储及存储设备产业链
国产算力:寒武纪、海光、华为链、沐曦、摩尔线程
从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期【天风计算机缪欣君团队】
复盘本轮AI驱动的存储逻辑,从“周期”走向“成长”的三大结构性变化:
驱动一:训练端由“存容量”转向“保吞吐”,利好高性能SSD。
原生多模态趋势下,GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及,使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求,存储不仅仅是仓库,更是保障算力效率的流水线。
驱动二:推理端长上下文与慢思考,重构SSD与DRAM规格。
长上下文缓存和思维链(System2)的引入,将推理服务器转变为“热数据交换中心”。
SSD主要用于对RAG索引和思维链日志的高频读写;DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池,以承载活跃的KVCache。
驱动三:记忆压缩算法迭代打破长记忆瓶颈,打开B端与端侧存储空间。
今年ChatgptGrok陆续发布全历史回溯功能,更高效的压缩算法(如Titans)逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在:
B端:解决了企业级应用“记不住用户习惯”的痛点,显著提升客户付费意愿。
端侧:应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级,推动需求超预期。
建议关注:
看好存储及存储设备产业链
国产算力:寒武纪、海光、华为链、沐曦、摩尔线程
大模型:Minimax、智谱、
AIAgent:深信服、金蝶国际、金山办公、虹软科技、科大讯飞、软通动力、京东工业、汉得信息、鼎捷数智、税友股份、聚水潭、天润云、医脉通、京东健康、北森控股、百融云、能科科技。
页:
[1]