Q:可以讲解一下 NVIDIA Blackwell 架构吗?
A:
Q:可以介绍一下 NVIDIA Blackwell 架构的特性吗?
A:
凭借六项变革性的技术,Blackwell 能够在拥有高达 10 万亿参数的模型上实现 AI 训练和实时 LLM 推理,这些技术包括:
全球最强大的芯片:Blackwell 架构 GPU 具有 2080 亿个晶体管,采用专门定制的双倍光刻极限尺寸 4NP TSMC 工艺制造,通过 10TB/s 的片间互联,将 GPU 裸片连接成一块统一的 GPU。
第二代 Transformer 引擎:得益于全新微张量缩放支持,以及集成于 NVIDIA TensorRT™-LLM 和 NeMo Megatron 框架中的 NVIDIA 先进动态范围管理算法,Blackwell 将在新型 4 位浮点 AI 推理能力下实现算力和模型大小翻倍。
第五代 NVLink:为了提升万亿级参数模型和混合专家 AI 模型的性能,最新一代 NVIDIA NVLink® 为每块 GPU 提供突破性的 1.8TB/s 双向吞吐量,确保多达 576 块 GPU 之间的无缝高速通信,满足了当今最复杂 LLM 的需求。
RAS 引擎:采用 Blackwell 架构的 GPU 包含一个用于保障可靠性、可用性和可维护性的专用引擎。此外,Blackwell 架构还增加了多项芯片级功能,能够利用 AI 预防性维护来运行诊断并预测可靠性相关的问题。这将最大程度地延长系统正常运行时间,提高大规模 AI 部署的弹性,使其能够连续不间断运行数周乃至数月,同时降低运营成本。
安全 AI:先进的机密计算功能可以在不影响性能的情况下保护 AI 模型和客户数据,并且支持全新本地接口加密协议,这对于医疗、金融服务等高度重视隐私问题的行业至关重要。
解压缩引擎:专用的解压缩引擎支持 LZ4、Snappy 和 Deflate 等最新压缩格式,通过加速数据库查询提供极其强大的数据分析和数据科学性能。过去,数据分析和数据库工作流依赖 CPU 进行计算。未来几年,每年需要企业花费数百亿美元的数据处理将越来越多地由 GPU 加速。
Q:NVIDIA Blackwell 可以在什么领域运用?
A:
NVIDIA Blackwell GPU 架构凭借其所搭载的六项变革性加速计算技术,将助推数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成式 AI 等领域实现突破。NVIDIA 知乎精彩问答甄选往期精彩内容
更多精彩仍在继续...
敬请关注
即刻点击“阅读原文”或扫描下方海报二维码,点播观看您可能错过的 GTC 2024 精选演讲。紧跟最新的 AI 突破,了解如何利用高性能计算等技术加速您的业务。