前言:
美国实施的芯片出口管制措施正对英伟达公司产生持续的负面影响。
据数据显示,今年上半年,英伟达在中国市场的损失预计将达到125亿美元,其市场份额亦从过去的95%显著下降至目前的50%。
对于英伟达而言,打造符合规定并适应中国市场需求的芯片仍需一段时间,但市场机遇不会等待。
作者| 方文三
图片来源|网 络
英伟达想再次用[特供]芯片应对禁令
自2022年美国首次对华实施AI芯片出口禁令以来,英伟达已多次调整策略,通过推出性能阉割的[特供版]芯片(如A800、H800和H20)以维持在中国市场的存在。
然而,2025年4月,美国政府对H20实施[无限期禁运],直接导致英伟达被迫注销55亿美元库存,并放弃150亿美元的潜在销售额,股价单日暴跌近7%。
鉴于H20出口许可的延迟发放,英伟达计划于7月份推出应对策略,通过调整产品配置,以B20、B40/B30替代H20,试图恢复失去的市场份额,并扭转其在中国业务的下降趋势。
由于美国出口管制政策的不断调整,英伟达近年来不得不持续调整其产品SKU,以符合相关禁令的要求。
该款搭载最新Blackwell架构的AI处理器,预计售价将在6500至8000美元区间,显著低于H20系列产品的1万至1.2万美元。
通常而言,较低的售价暗示着芯片规格可能较为有限,且其制造过程可能更为简化。
据称,此为英伟达第三次针对中国市场推出符合美国监管规定的降级版芯片产品。
若B20能够按计划推出,它将成为第三代专为中国市场设计的产品,前两代产品分别是基于Hopper架构的H20、H800和基于Ampere架构的A800。
相较于前一代产品H20,B20取消了HBM高带宽内存,导致内存带宽从4.8TB/s(HBM3e版本,HBM3版本为4.0TB/s)降低至1.5TB/s-1.7TB/s,这直接影响了其支持的并发数。
采用GDDR7内存替代HBM是基于遵守美国商务部出口管制条例的需要。
相比之下,英伟达的B40/B30可能更受国内市场关注,关键在于它保留了与H20相同的NVLink互联功能,最大带宽可达900GB/s。
通过NVLink,可以实现Scale Up扩展,例如NVL72、NVL144等,类似于华为Cloudmatrix 384的架构。
美国于4月实施的最新出口管制措施,对总计算能力以外的两个附加指标——内存带宽和互连速度——施加了限制。
在内存规格方面,B20和B40两款产品将采用GDDR内存,而非先前针对中国市场推出的H20芯片所使用的HBM内存,后者自4月新法规实施后已被禁止。
B20配置采用英伟达的ConnectX-8实现互连功能,通过以太网实现连接,最大互连带宽可达800Gbps。
每块B20芯片通过NVLink总线连接到ConnectX-8芯片,形成一个相当于PCIe卡的离散模块,支持PCIe卡格式的互连。
这种设计针对每台机器8到16张卡的小规模集群进行了优化,主要面向推理任务和较小模型的训练后处理。
由于芯片间互连带宽远低于NVLink,B20在整体并行效率上损失较大,因此基本不适合模型训练。
B30/B40配置支持NVLink互连,但速度低于标准规格。
预计NVLink带宽将与H20的900Gbps相同,而非B系列的1.8Tbps全功能,具体规格需视官方发布信息而定。
若B30定价在此水平,将具有极高的性价比,远低于H20的1万至1.2万美元。
尽管B40性能约为H20的85%,但其显著较低的价格应能保证持续的客户需求。
据知情人士透露,这款新的专供中国市场的GPU将基于英伟达的服务器级图形处理器RTX Pro 6000D构建,采用传统的GDDR7显存,而非HBM3e;
也没有使用台积电的先进封装技术CoWoS,这使得该芯片成本大幅降低。
还有消息称,英伟达正在为中国开发另一款基于Blackwell架构的芯片,可能也会采用GDDR7显存,是B200的阉割版,最早将于9月开始生产,路透社无法立即确认该变体的规格。
中国市场仍是华为和英伟达主导的竞赛
华为的挑战在中国本土AI芯片厂商中日益凸显,英伟达的黄仁勋多次强调来自华为的竞争,指出美国对芯片出口的管制导致英伟达在中国市场失去了主导地位,而本土企业如华为填补了这一空白。
SemiAnalysis发布报告称,华为基于昇腾910C芯片打造的CloudMatrix 384服务器系统在多项关键指标上的性能超过了英伟达旗舰系统GB200 NVL72。
CloudMatrix 384由384块昇腾910C芯片组成,尽管每块GPU性能仅为英伟达Blackwell芯片的三分之一,但拥有五倍的芯片数量。
完整的CloudMatrix系统现在可以提供300 PFLOP的密集BF16计算能力,几乎是GB200 NVL72的两倍,尽管需要4.1倍GB200 NVL72的功率,但电力能耗的短板相对容易弥补。
另有消息称,华为计划在2025年5月底之前向选定的中国科技公司分发昇腾910D样品批次进行测试,目标是使这款芯片的性能达到或超越英伟达H100。
目前来看,短期内,中国市场仍是华为和英伟达AI芯片较量的主战场。
尽管昇腾芯片在性能方面开始崭露头角,但生态系统仍是其短板,与英伟达成熟的CUDA生态相比,昇腾的AI生态仍在发展中,需要吸引更多全球开发者参与,以完善软件适配和应用开发等方面,提升整体生态竞争力。
相比英伟达,华为的本土优势在于能和国产AI模型厂商进行更深层的协同匹配,在gitcode开源平台上,华为近期分享的基于昇腾打造的超大规模MoE模型推理部署技术报告吸引了不少关注。
国产芯片需在以下领域加速突破:
①提升芯片架构创新能力,例如龙芯中科的LoongArch指令集和寒武纪的MLUarch架构。
②完善软件生态,通过开源社区吸引开发者。
③加强产业链协同,例如联合高校、企业共建AI算力网络。
国内面临挑战英伟达启动全新策略
英伟达推出B40的核心目的在于应对中国市场的双重挑战:
一方面,美国对华出口管制导致H100、A100等先进计算芯片供应受限;
另一方面,华为昇腾910B、寒武纪思元590等国产芯片在政策支持下迅速发展。
为巩固市场地位,英伟达同时启动了[硬件+软件]的生态绑定策略。
其CUDA-X软件栈已针对B40进行了深度优化,以支持主流深度学习框架如PyTorch、TensorFlow的无缝迁移。
此外,英伟达计划与中国合作伙伴共建AI训练平台,例如与阿里云合作推出基于B40的智算集群,提供从芯片到应用的全栈解决方案。
这种[低价硬件+高价值服务]的模式,旨在抵消国产芯片在政策支持下的生态建设优势。
结尾:
英伟达在中国市场的AI芯片战略可能将着重于[在AI GPU架构上实施快速且适度的降级以规避监管风险],并将在中长期持续审视是否推出专门针对AI推理的AI ASIC。
B40的市场表现将取决于其能否在合规性与性能之间找到平衡点,而中国AI产业的未来则取决于能否在开放合作与自主创新之间走出一条可持续发展之路。
这场技术博弈的终局,或许不在芯片本身,而在生态构建与产业协同的深层较量。
部分资料参考:腾讯科技:《禁令之下,黄仁勋再用[阉割芯片]抢夺中国市场》,傅里叶的猫:《英伟达特供中国的B20/B40 spec分析》,头部科技:《靠阉割版Blackwell芯片救市?英伟达酝酿全新中国特供版产品,抵御华为昇腾猛攻》,硬件世界:《英伟达全新中国特供GPU来了!价格砍半 6月量产》,超能网:《英伟达打造新款中国特供版计算卡:或有多款,通过新的互连方式取代NVLink》,经济观察网:《英伟达[转战]欧洲?黄仁勋称不再将中国市场纳入业绩预测》,钛媒体AGI:《为何黄仁勋改口说,英伟达AI技术比华为领先一代?》