泡股 发表于 昨天 10:01

DeepSee掀起“存力重构”:从“计算密集”迈向“以存换算”新范式

核心逻辑分析: DeepSeek 发布的 Engram 架构标志着大模型从“计算密集型”向“存算协同型”的重大转职 。通过引入“条件记忆”这一新稀疏维度,Engram 实现了模型参数与 HBM 容量的线性脱钩,将海量静态知识下沉至低成本存储介质,开启了 DRAM 与 NAND Flash 深度参与实时推理的红利期。

一、 HBM 逻辑从“刚性绑定”转向“结构稀疏”

需求强度稀释: Engram 架构证明了占据模型约 20%-25% 的参数(静态 N-gram 嵌入表)可从 HBM 中剥离。这意味着在同等参数规模下,单位参数对 HBM 的依赖强度下降 。

角色定位漂移: HBM 将从存储全量参数的“仓库”退回为专注于动态 MoE 专家与 KV Cache 的“高速缓存/车间” 。

带宽依然饥渴: 尽管容量需求增速放缓,但 MoE 层的高计算密度对 HBM4 等更高带宽标准的需求依然迫切,市场将从追求“容量堆叠”转向追求“极致带宽”。

二、 DRAM 战略地位跃升,需求叠升:从“幕后辅助”到“第二显存”

确定性预取开启量价齐升: 基于 Engram 的确定性哈希索引,系统可在 GPU 计算时异步从 Host Memory 预取数据 。DRAM 成为承载“温数据”的核心层级,单节点容量配置有望从 1-2TB 翻倍至 4TB 以上。

技术规格加速升级: 为了匹配 PCIe 5.0 带宽并实现“无感预取”,服务器对高频 DDR5、MRDIMM 及 CXL(存储池化)的需求或将迎来爆发式增长。

三、 NAND Flash 估值重塑:首次进入“热推理路径”,企业级SSD向高端演进

长尾知识下沉: 基于自然语言的 Zipfian(齐普夫)定律,Engram 将 Bottom 80% 的低频冷数据存储于 NVMe SSD。NAND 不再仅是“冷备份”,而是直接参与推理回传。

性能指标范式转移: 传统的顺序读写让位于 4K 随机读 IOPS。为了满足实时推理的 QoS 要求,具备高随机读性能、支持 ZNS 技术的高端企业级 SSD(eSSD)将出现结构性短缺3。

四、 产业影响与国产供应链机会

Engram 架构通过“以软补硬”,为中端 GPU 或受限芯片通过外挂大内存+大 SSD 部署万亿模型提供了可能。这不仅是算法的胜利,更是国产存储产业链的红利

建议关注:

企业级存储: 江波龙、德明利、佰维存储、协创数据、香农芯创等;

DRAM设计: 兆易创新、普冉股份、北京君正、东芯股份等。

页: [1]
查看完整版本: DeepSee掀起“存力重构”:从“计算密集”迈向“以存换算”新范式