前言:
从第一季度的财务数据看来,AMD季度营收74亿美元,同比增长36%。
这已是公司连续第四个季度营收加速。其中,数据中心和AI业务的蓬勃发展无疑是公司最强的底气来源。
数据显示,AMD数据中心部门一季度营收为37亿美元,同比增长57%,主要得益于AMD EPYC CPU和AMD Instinct GPU销量的增长。
作者| 方文三
图片来源|网 络
AMD发布3nm AI芯片Instinct MI350
在6月12日的Advancing AI大会上,AMD首席执行官苏姿丰展示了公司新推出的多款AI相关产品,包括旗舰级AI芯片、AI软件栈、AI机架级基础设施、AI网卡以及DPU。
首先,让我们关注近年来备受瞩目的GPU领域,特别是最新的AI芯片Instinct MI350系列。
MI355采用了3nm制程技术和3D先进封装技术,集成了1850亿个晶体管,配备了288GB HBM3e内存,内存带宽达到8TB/s;
在FP4、FP6精度下峰值算力可达20PFLOPS,单个GPU能够运行包含5200亿个参数的大型模型。
在AI能力方面,MI355X在运行LLama 3.1神经网络时的吞吐量比前一代MI300X高出35倍。
在具体运行大型模型时,MI355X同样表现出色。在Deepseek-R1、Llamma 4 Maverick和Llama 3.3 70B上,MI355X的性能分别是前代产品的3倍、3.3倍和3.2倍。
AMD MI350系列的内存容量是英伟达GB200的1.6倍;
在执行DeepSeek-R1或Llama3.1任务时,AMD MI355X每秒产生的tokens比英伟达B200多出20%至30%,与英伟达GB200性能相当;
MI350系列提供了更高的性价比,MI355X每投入一美元可提供的tokens比英伟达B200产品多出40%。
MI355X主打性能与竞争对手相当,但价格更为经济,非常适合那些认为英伟达产品过于昂贵的企业,用于构建自己的AI数据中心。
AMD计划于明年发布下一代AI芯片MI400系列,该系列将由AMD与OpenAI共同研发,OpenAI为MI400系列的训练和推理需求提供了关键反馈。
下一代Helios AI机架以及MI 400 GPU的细节已公开,该机架专为大规模AI模型的训练与推理而设计,预计将于2026年正式发布。
作为Helios核心组件的MI 400 GPU,是AMD公司为大规模训练和分布式推理精心打造的尖端加速器。
该加速器具备40 PF的FP4性能和20 PF的FP8性能,拥有高达432GB的HBM4内存容量,以及19.6TB/s的内存带宽和300GB/s的横向扩展带宽。
MI 400 GPU能够支持从数千亿到数万亿参数的模型,预计将成为2026年在大规模训练和推理领域性能领先的AI加速器,其性能预计将比前代产品提升十倍。
AMD数据中心增长迅猛正面竞争英伟达
根据财报数据,2024年AMD的数据中心业务收入达到126亿美元,全年增长率为94%。
相比之下,英伟达在2024年的增速与AMD相同,但其规模达到1152亿美元,约为AMD的10倍。
在去年全球数据中心GPU市场中,英伟达凭借一己之力占据了94%的市场份额,而AMD的份额仅为4%。
AMD认为,MI系列的这次更新将重振公司的增长势头,并证明其有能力与规模更大的竞争对手正面竞争。
随着全球范围内的大型科技公司对AI基础设施的数百亿美元投资,AI芯片的市场需求持续超过供应,导致芯片价格飙升,部分产品价格甚至高达数万美元一枚。
对AMD而言,AI加速器业务帮助公司摆脱了长期在PC处理器市场中被英特尔压制的局面。
然而,目前市场上的主导者是英伟达:尽管AMD通过AI芯片每年获得数十亿美元的收入,但英伟达的年收入早已突破千亿美元大关。
目前,在顶尖的10家AI厂商中,有7家在其数据中心使用Instinct,包括OpenAI、Meta、xAI、特斯拉。
根据规划,AMD将于2023年推出Instinct系列的MI300X芯片,2024年推出MI325X,这两款芯片均采用CDNA3架构。
通过推出MI300X和MI325,AMD的芯片已在微软、Meta、甲骨文等公司大规模部署,在过去9个月内,AMD新增了众多Instinct客户。
苏姿丰指出,数据中心AI加速器市场正经历迅猛增长,预计到2023年,全球数据中心AI加速器市场规模将达到450亿美元。
根据预测,到2028年,该市场将增长至5000亿美元,年均复合增长率高达60%。
AMD持续并购加速AI生态圈扩建
能在AI市场突围,除了本身在CPU和GPU积累领域的积累外,过去多年围绕AI生态的收购,也是AMD能走到现在的关键之一。
AMD已制定明确的AI战略,专注于三大核心原则,致力于为客户提供灵活、高效的解决方案。
①广泛的设计组合。
②开放的设计系统,AMD支持所有开放系统,包括主要架构和模型,坚信开放的生态系统是推动AI未来发展的重要力量。
③全栈解决方案。从CPU、GPU、DPU到自适应SoC,AMD与合作伙伴共同将所有产品整合为一个完整的系统设计,向客户提供全栈解决方案,以推动AI领域的创新。
相关统计显示,自2023年以来,AMD进行了多次收购,首先是2023年收购软件公司Mipsology和Nod.ai;
然后去年继续收购AI实验室Silo AI和数据中心基础设施提供商ZT Systems。此次收购热潮一直持续到今年。
苏姿丰透露,AMD正加大对AI生态系统平台能力的投资,仅在2024年,AMD便投资了25家AI公司,以寻求一条更宽泛的道路,加速AI创新。
这些战略性投资不仅增强了AMD的技术实力,也帮助其建立了新的合作关系,并巩固了其在硬件领域的领导地位。
AMD与Hugging Face、OpenAI以及Grok等领导者的战略合作,证明了共同开发的开放式解决方案的强大力量。
这些收购都有助于改善和增强AMD的AI能力,尤其是在数据中心市场,该市场是收入增长和盈利潜力最大的市场。
当然,AMD的AI战略及其与英伟达竞争的能力也受益于其最新一轮收购之前的收购。
这包括该公司在2022年收购可编程芯片设计公司赛灵思和网络芯片设计公司Pensando,这两笔收购都为AMD拓展新产品和新市场提供了机会。
结尾:
高性能GPU因其在设计环境中展现出的必要适应性、卓越的计算性能以及高效的数学运算能力,预计将主导市场。
AI应用的另一推动力源自端侧,AI的应用正从传统的在线智能系统向PC体验深度整合,未来甚至可能每个设备都将集成AI功能,实现无所不在的智能化。
鉴于AI应用的多样化和不断扩展的需求,不存在一种“通用适用”的单一架构或“唯一正确”的解决方案。
部分资料参考:中国电子报:《AMD发布旗舰AI芯片,称性能比肩英伟达》,第一财经:《AMD最新发布!“新芯片性能优于英伟达”》,电子发烧友网:《AMD新品叫板英伟达GB200,角逐5000亿AI加速器赛道》,半导体行业观察:《AMD发布3nm GPU,推理性能狂飙35倍》,芯调查:《AMD发布下一代AI芯片路线图,挑战英伟达》