前言:
2026年的AI算力竞赛,正在步入一个危险的“深水区”。当GPU芯片的AI性能每代跃升数十倍时,其搭档HBM高带宽内存的带宽增速,却逐渐逼近物理极限。随着HBM4堆叠层数逼近16层,散热和信号完整性正成为难以逾越的障碍。就在这个尴尬的节点,一场激进的架构革命悄然浮出水面:将HBM与GPU物理分离,再用“光”而非铜线连接它们。
作者 | 方文三
图片来源 | 网络
HBM的“内卷”:带宽与容量的双重天花板
过去十年间,HBM通过疯狂堆叠芯片、增加数据通道,成为AI服务器中不可或缺的“带宽王”。然而2026年后,这条路正慢慢走不通了。业界普遍认为,随着HBM堆叠层数继续向更高层发展,制程难度呈指数级上升,有限的物理边界决定了AI芯片周围能塞下的HBM颗粒数量是有天花板的。
与此同时,散热问题也成了“拦路虎”,服务器内部的功耗密度正在失控。当模型参数万亿级增长时,HBM提供的3.3TB/s带宽在大模型键值缓存面前已然捉襟见肘。存储增长速度大幅落后于算力增长速度,这堵“存储墙”正直接锁死大模型推理的速度,成为算力竞赛里的结构性短板。
光互连的革命:从“铜线”时代跨入“光子”时代
为了突破物理限制,半导体和封装产业链提出了一种大胆的新思路:光互连。与传统的电信号传输容易受电磁干扰、随着频率升高损耗剧增不同,光信号天然具备“低功耗、长距离、高带宽”的独特优势。
具体到HBM场景,这项技术旨在颠覆原有的2.5D封装逻辑。未来,GPU与HBM将不再紧密贴在同一个硅基板上,而是分开封装。原先紧贴着AI芯片周围的HBM会被挪开,然后透过超高速光学互连进行数据交换。过去业界深信“芯片之间必须紧挨着才能降低延迟”,但光互连的极致速度克服了物理距离带来的延迟问题,从而可以在电路板上安装比现行架构多出数倍的HBM容量,真正做到“既要容量、又要带宽”。
在这场革命中,台积电走在了最前线。它首次提出的AI芯片“三层蛋糕”理论,明确将光子与光学互连定义为“未来最重要”的第三层。其研发的COUPE技术采用了3D异质集成方式,利用SoIC(系统整合芯片)工艺将电子芯片和光子芯片垂直堆叠,大幅缩短互连距离。相比传统铜线,该技术能让系统能效直接提升4倍,延迟降低10倍。该技术已在2026年实现规模化量产,标志着共封装光学(CPO)产业链正式从验证阶段走向商业化部署。
产业链“梭哈”:群雄逐鹿光互连新赛道
面对这块颠覆性的蛋糕,不仅是台积电,全球AI芯片巨头们也纷纷将“光互连”写入了未来两至三年的路线图。
AMD已经率先“亮剑”。它正联合晶圆厂格芯以及封装大厂日月光,为其2027年发布的下一代Instinct MI500 AI加速器开发基于微环调制器的CPO方案。光子集成电路由格芯制造,日月光负责封装,AMD去年收购的硅光子初创公司Enosemi将负责加速相关技术创新。搭载2nm工艺、CDNA 6架构和HBM4E内存的MI500,性能目标是实现四年上千倍增长。
老对手英伟达同样紧追不舍。据悉,英伟达为Vera Rubin加速器推进的CPO方案,PIC(光子集成电路)由台积电制造,矽品精密负责封装。在下一代Rubin Ultra中,CPO方案将优先于NPO(近封装光学),而在更遥远的Feynman世代,AI加速器将全面转向CPO,彻底淘汰对传统铜线互连的依赖。
除了这几大芯片巨头,整个上游产业链也动了起来。博通在2026年OFC期间推出业界首款400G/lane光学DSP解决方案Taurus,早已为其下一代的以太网交换芯片预埋了光学接口的“基因”。英特尔则以“硅光+OCI(光计算互连)”为核心,打造芯片级超低功耗光I/O,卡位AI超算集群的下一代互联架构。而中国厂商也不甘示弱:曦智科技今年4月登陆港交所,成为“全球AI硅光芯片第一股”,它联合产业伙伴推出的全球首个分布式光交换光互连GPU超节点解决方案,解决了大规模算力集群中传统电互连的带宽瓶颈与扩展性受限等挑战。海思光电则推出了高密光引擎Hi-ONE,号称具有低功耗、低成本、低时延的优势,适配可插拔、板载、共封装等多种应用场景。
从“电”到“光”的万亿级财富转移
随着产业链集体转向,市场资金的嗅觉最为灵敏。有分析指出,AI系统的瓶颈正从HBM内存(2024年的卡点)向光互连转移(2026-2028年的卡点),但以AI为主题的基金普遍在这个板块“买得不够”。
这种结构性转变不仅意味着一场技术革命,更伴随着一波巨大的财富转移。过去几年吃尽红利的HBM厂商,面对的是即将见顶的物理天花板;而掌握“光互连”新钥匙的上游通信商与封装厂,则迎来了属于自己的“黄金时代”。预计到2030年,仅CPO这一细分领域的全球市场规模就有望突破100亿美元。在此浪潮下,国内的源杰科技、长光华芯、中际旭创,以及海外的Lumentum、Coherent等光器件龙头,都有望成为这场变革的受益者。
结语
当先进制程带来的红利逐渐减小,“架构创新”正接过拉动AI算力的接力棒。未来两到三年,无论是AMD与英伟达的“光芯片”落地,还是台积电COUPE生态的爆发,都将彻底改写AI硬件的功率密度和数据传输效率。2026年,将成为连接AI“电”与“光”的世纪分水岭——而那个被忽视已久的“内存墙”,终于要被推倒了。
网络援引:
三思派:《从“无限AI算力循环”看人工智能基础设施竞争的新逻辑 》
新浪财经:《内存堆叠达极限!传 HBM 不再紧贴 GPU,改走「光学互连、分离封装」新架构》
新财富杂志:《存储产业链投资机遇 | 研报精选》










