GTC 2024:超级AI芯片NVIDIA Blackwell亮相, Vision Pro合作案例来袭

IP归属:广东

GTC 2024,又一次产业飞跃的奠基。

2024 年 3 月 19 日,NVIDIA 举办 GTC(GPU Technology Conference)大会。NVIDIA 创始人兼首席执行官黄仁勋宣布了 Nvidia 的下一代芯片架构 Blackwell 及相关产品,包括该公司最新的 AI 芯片 B200,以及基于生成式人工智能、Omniverse 带来的一系列云服务,应用于医疗保健、工业数字化和制造业等领域的应用落地案例等。

超级 AI 芯片NVIDIA Blackwell亮相

“Blackwell 将成为我们历史上最成功的产品发布。”黄仁勋在会上说道。

NVIDIA 今天正式宣布 NVIDIA Blackwell 平台已经到来,为计算的新时代提供动力,使世界各地的组织能够在万亿参数大型语言模型上构建和运行实时生成式 AI,而成本和能耗比其上一代降低 25 倍。该 GPU 平台以数学家 David Harold Blackwell 的名字命名,继承了该公司两年前推出的 Hopper 架构。

黄仁勋表示:“三十年来,我们一直在追求加速计算,目标是实现深度学习和人工智能等变革性突破。生成式人工智能是我们这个时代的决定性技术。Blackwell 是推动这场新工业革命的引擎。与世界上最具活力的公司合作,我们将实现人工智能对每个行业的承诺。”

Blackwell 的六项革命性技术共同支持高达 10 万亿参数的模型的 AI 训练和实时 LLM 推理,包括:

  • 世界上最强大的芯片 — Blackwell 架构 GPU 包含 2080 亿个晶体管,采用定制的 4NP TSMC 工艺制造,具有两个十字线极限 GPU 芯片,通过 10 TB/秒的芯片到芯片链路连接成单个统一的 GPU 。
  • 第二代 Transformer 引擎 — 在新的微张量缩放支持和集成到 NVIDIA TensorRT™-LLM 和 NeMo Megatron 框架中的 NVIDIA 先进动态范围管理算法的推动下,Blackwell 将通过新的 4 位浮点 AI 支持双倍的计算和模型大小推理能力。
  • 第五代 NVLink — 为了加速数万亿参数和混合专家 AI 模型的性能,最新迭代的 NVIDIA NVLink® 为每个 GPU 提供了突破性的 1.8TB/s 双向吞吐量,确保多达 576 个 GPU 之间的无缝高速通信。
  • RAS 引擎 — Blackwell 支持的 GPU 包含一个专用引擎,可实现可靠性、可用性和可维护性。此外,Blackwell 架构还增加了芯片级功能,利用基于人工智能的预防性维护来运行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间并提高大规模人工智能部署的弹性,使其能够连续运行数周甚至数月,并降低运营成本。
  • 安全人工智能 — 先进的机密计算功能可在不影响性能的情况下保护人工智能模型和客户数据,并支持新的本机接口加密协议,这对于医疗保健和金融服务等隐私敏感行业至关重要。
  • 解压缩引擎 — 专用解压缩引擎支持最新格式,加速数据库查询,以提供数据分析和数据科学的最高性能。未来几年,公司每年花费数百亿美元的数据处理将越来越多地由 GPU 加速。

构建大型超级芯片NVIDIA GB200 Grace Blackwell

NVIDIA GB200 Grace Blackwell 超级芯片通过 900GB/s 超低功耗 NVLink 芯片间互连将两个 NVIDIA B200 Tensor Core GPU 连接到 NVIDIA Grace CPU。

为了获得最高的 AI 性能,GB200 驱动的系统可以与 NVIDIA Quantum-X800 InfiniBand 和 Spectrum™-X800 以太网平台连接, 这些平台可提供速度高达 800Gb/s 的高级网络。

GB200 是 NVIDIA GB200 NVL72 的关键组件,NVIDIA GB200 NVL72 是一种多节点、液冷、机架规模系统,适用于计算最密集的工作负载。它结合了 36 个 Grace Blackwell 超级芯片,其中包括通过第五代 NVLink 互连的 72 个 Blackwell GPU 和 36 个 Grace CPU。

此外,GB200 NVL72 还包括 NVIDIA BlueField®-3 数据处理单元,可在超大规模 AI 云中实现云网络加速、可组合存储、零信任安全性和 GPU 计算弹性。与相同数量的 NVIDIA H100 Tensor Core GPU 相比,GB200 NVL72 对于 LLM 推理工作负载的性能提升高达 30 倍,并将成本和能耗降低高达 25 倍。该平台充当单个 GPU,具有 1.4 exaflops 的 AI 性能和 30TB 的快速内存,是最新 DGX SuperPOD 的构建块。

NVIDIA 提供 HGX B200,这是一款服务器主板,通过 NVLink 连接八个 B200 GPU,以支持基于 x86 的生成式 AI 平台。HGX B200 通过 NVIDIA Quantum-2 InfiniBand 和 Spectrum-X 以太网网络平台支持高达 400Gb/s 的网络速度。

Apple Vision Pro通过NVIDIA Omniverse传输世界

NVIDIA 正在将基于 OpenUSD 的 Omniverse 企业数字孪生引入 Apple Vision Pro。

今天在 NVIDIA GTC 上宣布,一个基于 Omniverse Cloud API 或应用程序编程接口构建的新软件框架,使开发人员可以轻松地将其通用场景描述 (OpenUSD)工业场景从内容创建应用程序发送到 NVIDIA 图形交付网络 (GDN),全球图形就绪数据中心网络,可以将先进的 3D 体验传输到 Apple Vision Pro。

大会上的演示中,Nvidia 展示了一个完全交互式的汽车模型,该模型被传输到 Apple Vision Pro VR 头显中。苹果 Vision 产品集团副总裁 Mike Rockwell 表示:“Apple Vision Pro 突破性的超高分辨率显示器与 NVIDIA 加速计算流式传输的 OpenUSD 内容的真实感渲染相结合,为推进沉浸式体验带来了绝佳的机会。”

该工作流程还引入了混合渲染,这是一种在设备上结合本地和远程渲染的突破性技术。用户可以使用来自 GDN 的 Omniverse RTX 渲染器流,通过Apple 的本机 SwiftUI 和 Reality Kit 在单个应用程序中渲染完全交互的体验。

据介绍,这种基于 Omniverse 的全新工作流程将 Apple Vision Pro 突破性的高分辨率显示器与 NVIDIA 强大的 RTX 云渲染相结合,只需设备和互联网连接即可提供空间计算体验。

基于云的方法允许实时基于物理的渲染无缝传输到 Apple Vision Pro,提供高保真视觉效果,而不会影响大量工程保真度数据集的细节。

Earth-2 气候数字孪生云平台,速度与精度的新结合

为加速应对气候变化导致的极端天气所造成的经济损失,NVIDIA 于还发布了 Earth-2 气候数字孪生云平台,使天气和气候的模拟和可视化达到前所未有的精度。

NVIDIA 创始人兼首席执行官黄仁勋表示: “如今气候灾害很常见,新闻中时常会看到历史性的干旱、灾难性的飓风和百年不遇的洪水。Earth-2 云 API 将帮助我们更好地应对极端天气,使我们可以采取行动以缓解极端天气的影响。”

作为同于今日发布的 NVIDIA CUDA-X™ 微服务的一部分,NVIDIA DGX Cloud™ 上的全新 Earth-2 云 API 能够支持所有用户创建基于 AI 的仿真,从而加快实现交互式、高分辨率模拟的速度,模拟范围从全球大气和局部云层到台风和湍流。

当前气候技术行业的规模已达 200 亿美元,Earth-2 应用编程接口通过结合该行业的公司所拥有的专有数据,可帮助用户在数秒内发布预警和最新预报。而使用传统模型在 CPU 上运行,这一过程需要耗时数分钟乃至数小时。

Earth-2 API 提供各种 AI 模型,并且新添加一种名为 CorrDiff 的全新 NVIDIA 生成式 AI 模型。该模型基于领先的扩散模型技术,能将当前数值模拟的分辨率提升 12.5 倍,相比传统方法,速度和能效分别提升了 1000 倍和 3000 倍。它不仅可以纠正粗分辨率预报中的错误,还能够生成对决策至关重要的指标。CorrDiff 是一个开创性的生成式 AI 模型,能够实现超分辨率,生成利益相关方感兴趣的新指标,并且可以从高分辨率数据集中学习小范围局部天气的物理特性。

Earth-2 云 API 的另一个关键组成部分是 NVIDIA Omniverse™,该计算平台可帮助个人和团队开发基于通用场景描述(OpenUSD)的 3D 工作流与应用。

全球气象数据预测和洞察企业 The Weather Company 计划将其气象数据和 Weatherverse 工具与 Omniverse 集成,从而使其用户能首次构建数字孪生来更好地了解和以可视化的方式感知实际天气条件的影响。The Weather Company 还计划探索如何将 NVIDIA 基于分数的生成式 AI 应用于其 Weatherverse 服务、企业级天气智能解决方案 Weather Engine 以及全新高分辨率天气模拟产品中。

Earth-2 API 使用 DGX Cloud 为气候和天气解决方案提供全栈加速,其中包括 FourCastNet、GraphCast 和 Deep Learning Weather Prediction 等模型的最佳 AI 实现、在最新 Grace Hopper 系统上对 ICON 等数值天气预报模型的 GPU 加速等。在 NVIDIA DGX GH200、HGX H100 和 OVX 超级计算机上运行的 Earth-2 在进行全球气候模拟和可视化上实现了前所未有的速度与精度。

NVIDIA Edify为视觉内容提供商解锁3D生成AI和新图像控件

NVIDIA Edify 是一种用于视觉生成 AI 的多模式架构,正在进入一个新的维度。

3D 资产生成是 Edify 为开发人员和视觉内容提供商提供的最新功能之一,他们还能够对 AI 图像生成发挥更多的创造性控制。

多媒体内容和数据提供商 Shutterstock 正在推出对 API 或应用程序编程接口的早期访问,该接口基于 Edify 架构构建,允许创作者使用文本提示或图像快速生成虚拟场景的 3D 对象。

视觉内容创建者和市场 Getty Images 将为其商业安全的生成式人工智能服务添加自定义微调功能,帮助企业客户生成符合品牌准则和风格的视觉效果。该服务还将融入新功能,使客户能够进一步控制其生成的图像。

开发人员可以通过 NVIDIA NIM(今天在NVIDIA GTC上宣布的一组用于推理的微服务)测试驱动 Getty Images 和 Shutterstock 提供的预训练 Edify 模型作为 API 。开发人员还可以通过NVIDIA Picasso (基于NVIDIA DGX Cloud构建的 AI 铸造厂)使用 Edify 架构来训练和部署自己的生成式 AI 模型。

NVIDIA 和 Adobe 正在合作,为数百万 Firefly 和 Creative Cloud 创作者带来基于 Edify 的全新 3D 生成 AI 技术。

直播平台 Be.Live 使用 NVIDIA Picasso 代工服务来提供实时生成 AI,从而能够自动创建视觉效果并为观众提供互动体验。Bria 是一个为开发负责任的视觉生成人工智能的企业量身定制的整体平台,它采用了 Picasso 来运行推理。创意工作室 Cuebric 正在通过开发由毕加索驱动的生成式人工智能应用程序来构建沉浸式虚拟环境,从而增强电影制作和内容创作。

来源:NVIDIA

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

VR陀螺专栏: https://www.tuoluo.cn/columns/author1286744/

本文网址: https://www.tuoluo.cn/article/detail-10111822.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章