返回列表 发布新帖
查看: 28|回复: 0

从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期(附股)

783

主题

10

回帖

2434

积分

超级版主

积分
2434
发表于 2025-12-23 21:16:35 | 查看全部 |阅读模式
复盘本轮AI驱动的存储逻辑,从“周期”走向“成长”的三大结构性变化:

驱动一:训练端由“存容量”转向“保吞吐”,利好高性能SSD。

原生多模态趋势下,GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及,使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求,存储不仅仅是仓库,更是保障算力效率的流水线。

驱动二:推理端长上下文与慢思考,重构SSD与DRAM规格。

长上下文缓存和思维链(System2)的引入,将推理服务器转变为“热数据交换中心”。

SSD主要用于对RAG索引和思维链日志的高频读写;DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池,以承载活跃的KVCache。

驱动三:记忆压缩算法迭代打破长记忆瓶颈,打开B端与端侧存储空间。

今年ChatgptGrok陆续发布全历史回溯功能,更高效的压缩算法(如Titans)逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在:

B端:解决了企业级应用“记不住用户习惯”的痛点,显著提升客户付费意愿。

端侧:应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级,推动需求超预期。

建议关注:

看好存储及存储设备产业链

国产算力:寒武纪、海光、华为链、沐曦、摩尔线程

从大模型迭代看存储:高吞吐与长记忆加速存储需求,关注B端落地进展或超预期【天风计算机缪欣君团队】

复盘本轮AI驱动的存储逻辑,从“周期”走向“成长”的三大结构性变化:

驱动一:训练端由“存容量”转向“保吞吐”,利好高性能SSD。

原生多模态趋势下,GPU对非结构化数据的连续读取带宽要求激增。万卡级Scale-up集群的普及,使Checkpoint面临极高的突发写入压力。这直接催生了对高性能NVMeSSD及并行文件系统的刚性需求,存储不仅仅是仓库,更是保障算力效率的流水线。

驱动二:推理端长上下文与慢思考,重构SSD与DRAM规格。

长上下文缓存和思维链(System2)的引入,将推理服务器转变为“热数据交换中心”。

SSD主要用于对RAG索引和思维链日志的高频读写;DRAM则需要扩展容量充当GPU与SSD间的高速缓冲池,以承载活跃的KVCache。

驱动三:记忆压缩算法迭代打破长记忆瓶颈,打开B端与端侧存储空间。

今年ChatgptGrok陆续发布全历史回溯功能,更高效的压缩算法(如Titans)逐步打破长上下文缓存瓶颈。我们判断长记忆影响主要在:

B端:解决了企业级应用“记不住用户习惯”的痛点,显著提升客户付费意愿。

端侧:应用的落地将倒逼端侧存储硬件在容量与速度上的双重升级,推动需求超预期。

建议关注:

看好存储及存储设备产业链

国产算力:寒武纪、海光、华为链、沐曦、摩尔线程

大模型:Minimax、智谱、

AIAgent:深信服、金蝶国际、金山办公、虹软科技、科大讯飞、软通动力、京东工业、汉得信息、鼎捷数智、税友股份、聚水潭、天润云、医脉通、京东健康、北森控股、百融云、能科科技。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@discuz.vip

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 添加微信客服
  • 关注公众号
MACD888量化www.macd888.com -MACD量化论坛-MACD股票论坛-MACD888股票论坛-macd论坛-macd网站-macd官网-Macd888论坛官方-macd俱乐部 © 2001-2026 Discuz! Team. Powered by Discuz! W1.5 闽ICP备2025120954号-1
关灯 在本版发帖
扫一扫添加微信客服
返回顶部
快速回复 返回顶部 返回列表