存储技术三重奏:HBM4、CBA+HBF、3D NAND如何重塑AI算力未来?
发布时间:
2026-02-03
当AI大模型参数突破万亿级别,传统存储架构正面临前所未有的挑战,而一场由HBM4、CBA+HBF和3D NAND引领的技术革命正在悄然改变游戏规则。
2025年4月,JEDEC固态技术协会正式发布HBM4内存规范JESD270-4,标志着高带宽内存技术进入全新阶段。与此同时,CBA+HBF工艺创新正在打破“内存墙”制约,3D NAND堆叠层数突破300层大关。
这三项技术突破不仅将重新定义存储性能边界,更将为AI算力发展提供关键支撑。
01 .HBM4:AI时代的带宽革命
HBM4标准的发布为AI和高性能计算领域带来了质的飞跃。相比前代HBM3,HBM4采用2048位接口,传输速率高达8Gb/s,总带宽可达2TB/s,通道数量从16个增至32个。
这一性能提升对于处理大规模AI模型至关重要。英伟达Blackwell Ultra芯片配备8个HBM3E内存,容量为288GB,带宽8TB/s。而HBM4的单堆栈最大容量可达64GB,支持4/8/12/16层DRAM堆叠。
三大存储巨头已展开激烈竞争。SK海力士在2025年3月宣布出货全球首款12层HBM4样品,计划2026年下半年量产。三星则基于1c DRAM工艺开发HBM4产品,已完成第六代HBM4研发并通过量产准备认证。
美光也不甘落后,已交付11Gbps HBM4样品,实现2.8TB/s带宽。TrendForce集邦咨询预测,HBM4最快将于2026年第一季末进入量产。
02.CBA+HBF:打破“内存墙”的创新组合
随着AI模型参数量和上下文长度不断增加,HBM容量已难以满足需求。正是在这一背景下,CBA+HBF技术应运而生,成为存储IDM未来发展的核心方向。
CBA(CMOS直接键合到阵列)技术将逻辑芯片与存储阵列分离制造后再键合,显著提升单位面积存储密度,优化内部互连路径。这项技术已成为高层数NAND不可逆的技术路线。
HBF(高带宽闪存)则借鉴HBM的封装设计,但用闪存替换部分DRAM堆栈。相比HBM,HBF具备8-16倍的存储容量和非易失性存储优势。
Sandisk的第一代HBF产品令人瞩目:单堆叠(16片die)即可提供约1.6TB/s的读带宽,总容量达512GB。在读取8-bit量化的Llama 3.1 405B模型权重时,HBF的系统级性能距离“容量无限制的HBM”仅差约2.2%。
03.3D NAND:垂直堆叠的极限挑战
3D NAND技术正从200多层向400层以上快速演进。2025年,各大厂商的竞争达到白热化:
铠侠与闪迪推出第十代BiCS FLASH技术,达到332层堆叠,接口速度4.8Gb/s,位密度提升59%。
SK海力士第九代3D NAND技术达到321层堆叠,已开始量产2Tb QLC产品。
三星V9技术达到290层堆叠,V10技术计划达到420-430层,预计2025年下半年量产。
美光第九代技术达到276层堆叠,340层NAND已进入样品阶段。
技术突破不仅体现在层数增加。IMEC的最新研究采用Hole-Side Airgap技术,将Z-pitch从40nm缩小到30nm以下,为1000层3D NAND打开新空间。
科林研发、科罗拉多大学等机构开发的等离子蚀刻工艺,将3D NAND深孔蚀刻速度提升了一倍以上,为制造更高密度存储设备奠定基础。
04 .技术融合:构建高效AI存储架构
这三项技术并非孤立发展,而是相互协同构建高效的AI存储架构。业界提出的“H3混合架构”将HBM、HBF和传统SSD分层部署。
HBM负责延迟敏感型任务,如实时计算、热数据缓存;HBF专注于大容量顺序读取工作,如模型参数读取、冷数据存储。
仿真测试显示,这种架构每瓦性能较纯HBM方案最高提升2.69倍,在1000万token场景下并发查询量提升18.8倍。
SK海力士与闪迪已联合举办“HBF规格标准化联盟启动会”,依托开放计算项目框架设立专项工作组,正式启动HBF全球标准化工作。
05.产业影响与市场前景
存储技术的突破正在重塑整个产业链。根据SEMI预测,2025/2026年全球NAND设备市场规模有望达到137/150亿美元,同比增长42.5%/9.7%。
4F2 DRAM、3D NAND等存储新架构的创新带来刻蚀、沉积、键合设备新的发展机遇。
国内企业也在加紧追赶。长江存储早在2018年就推出Xtacking架构,率先将混合键合用于3D NAND量产。合肥长鑫计划2026年开始导入CBA技术,后续逐步爬坡。
摩根士丹利预测,全球HBM市场规模有望从2023年的40亿美元增长至2027年的330亿美元。而HBF作为新兴技术,预计将在2026年下半年提供样品,2027年推出面向AI推理的正式产品。
当SK海力士展示全球首款12层堆叠HBM4产品时,其功耗效率已提升超40%。铠侠与闪迪的332层3D NAND技术,让1秒内传输一部4K电影成为现实。
存储技术的边界正在被不断突破。从HBM4的带宽飞跃到CBA+HBF的架构创新,再到3D NAND的层数竞赛,每一项突破都在为AI算力提供更强支撑。
未来已来,存储技术的三重奏正奏响AI时代的最强音。
