英伟达H200突然发布:容量翻倍,带宽狂飙

芯通社 2023-11-14 18:13


刚刚,英伟达(Nvidia)在第 23 届超级计算大会上发布了 H200  GH200 产品线这些芯片是Nvidia有史以来最强大的芯片,以现有的Hopper H100架构为基础,增加了更多内存和计算能力。这些芯片将为未来新一代人工智能超级计算机提供动力,2024 年将有超过 200 exaflops 的人工智能计算能力上线。让我们来详细了解一下。

H200 GPU 或许是这场秀的真正主角。Nvidia 没有提供所有规格的详细明细,但主要的一点似乎是每个 GPU 的内存容量和带宽大幅增加。

更新后的 H200 配备了总容量为 141GB 的 HBM3e 内存,有效运行速度约为 6.25 Gbps,六个 HBM3e 堆栈中每个 GPU 的总带宽为 4.8 TB/s。这比原来的 H100 有了巨大的改进,原来的 H100 有 80GB 的 HBM3 和 3.35 TB/s 的带宽。H100 的某些配置确实提供了更多的内存,比如 H100 NVL,它将两块板子配对使用,总共提供了 188GB 内存(每个 GPU 94GB),但与 H100 SXM 变体相比,新的 H200 SXM 内存容量增加了 76%,带宽增加了 43%。

需要注意的是,原始计算性能似乎没有太大变化。Nvidia 展示的唯一计算图形使用了 8 个 GPU HGX 200 配置,总性能为 "32 PFLOPS FP8"。最初的 H100 提供了 3958 teraflops 的 FP8 性能,因此 8 个这样的 GPU 也已经能提供大约 32 petaflops 的 FP8 性能。
H200 与 H100 相比会快多少?这将取决于工作负载。对于像 GPT-3 这样因内存容量增加而受益匪浅的 LLM,Nvidia 声称其性能比原来的 A100 高出18 倍,而 H100 只比A100快了约 11 倍。此外,还有关于即将推出的 Blackwell B100 的预告,不过现在只是一个更高的条形图,并逐渐变黑。

当然,这次英伟达不仅仅是宣布发布了更新的 H200 GPU。还有一种新的 GH200 也即将面世,它将 H200 GPU 与 Grace CPU 结合在一起的"超级芯片 "。每个 GH200将包含 624GB 内存。最初的 GH100 将 CPU 的 480GB LPDDR5x 内存与 96GB HBM3 内存结合在一起,而新版本则增加到了144GB HBM3e。

同样,关于 CPU 方面是否有其他变化的细节也不多,但 Nvidia 提供了 GH200 与 "现代双插槽 x86 "配置的一些比较,其中提到了与 "非加速系统 "相比的速度提升。

这意味着什么?我们只能假设 x86 服务器运行的代码没有经过完全优化,特别是考虑到人工智能世界发展迅速,优化方面似乎经常有新进展。 

GH200 还将用于新的 HGX H200 系统。据说,这些系统与现有的 HGX H100 系统 "无缝兼容",这意味着 HGX H200 可以在相同的设备中使用,以提高性能和内存容量,而无需重新设计基础设施。 

瑞士国家超级计算中心(Swiss National Supercomputing Center)的阿尔卑斯超级计算机(Alps
supercomputer)很可能是明年投入使用的首批Grace
Hopper超级计算机之一,不过该系统仍然使用 GH100。美国第一台投入使用的 GH200 系统
将是洛斯阿拉莫斯国家实验室的 Venado 超级计算机。今天宣布的德克萨斯高级计算中心(TACC)Vista 系统也将使用格雷斯 CPU 和格雷斯 Hopper 超级芯片,但尚不清楚是 H100 还是 H200。

据目前所知,即将安装的最大的超级计算机是 "胡安里奇 "超级计算中心( Jϋlich Supercomputing Centre)的Jupiter超级计算机。它将容纳 "近 "24,000个GH200超级芯片,合计93 exaflops的人工智能计算能力(推测这是使用FP8的数字,尽管根据我们的经验,大多数人工智能仍然使用BF16或FP16)。它还将提供 1 exaflop 的传统 FP64 计算能力。它使用的 "quad GH200 "板具有四个 GH200 超级芯片。

总而言之,Nvidia 预计在未来一年左右的时间里,这些新安装的超级计算机将提供超过 200 exaflops 的人工智能计算性能。


免责声明

本平台所刊载的所有资料及图表仅供参考使用。刊载这些文档并不构成对任何股份的收购、购买、认购、抛售或持有的邀约或意图。投资者依据本网站提供的信息、资料及图表进行金融、证券等投资项目所造成的盈亏与本网站无关。除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因,或会存在不当使用的情况,如部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系及时处理,共同维护良好的网络创作环境。




芯通社

- SemiWebs -


专注半导体-手机通信-人工智能

请长按下面二维码关注芯通社


伙伴们

错过也许就是一辈子
还不快关注我们?






芯通社 专注半导体/手机通信/人工智能/区块链等科技领域!
评论 (0)
  • 真空容器的材料选择取决于其应用场景(如科研、工业、医疗)、真空等级(低真空、高真空、超高真空)以及环境条件(温度、压力、化学腐蚀等)。以下是常见材料及其优缺点分析:1. 不锈钢(如304、316L)优点:耐腐蚀性强:316L含钼,耐酸碱和高温氧化,适合高真空和腐蚀性环境。高强度:机械性能稳定,可承受高压差和外部冲击。低放气率:经电解抛光或镀镍处理后,表面放气率极低,适合超高真空系统(如粒子加速器、半导体镀膜设备)。易加工:可焊接、铸造,适合复杂结构设计。缺点:重量大:大型容器运输和安装成本高。磁
    锦正茂科技 2025-03-29 10:52 21浏览
  • 3月27日,长虹中玖闪光超高剂量率电子射线放射治疗系统(e-Flash)临床试验项目在四川大学华西医院正式启动,标志着该项目正式进入临床试验阶段。这不仅是我国医学技术领域的一项重大突破,更是我国在高端医疗设备研发和应用方面的重要里程碑。e-Flash放射治疗系统适用于哪些病症,治疗周期为多久?会不会产生副作用?治疗费用高不高……随着超高剂量率电子射线放射治疗系统(e-Flash)正式进入临床试验阶段,社会各界对该项目的实施情况尤为关注。对此,中国工程院院士范国滨,以及四川大学华西医院、四川省肿瘤
    华尔街科技眼 2025-03-28 20:26 32浏览
  • 在智能家居领域,无线门铃正朝着高集成度、低功耗、强抗干扰的方向发展。 WTN6040F 和 WT588F02B 两款语音芯片,凭借其 内置EV1527编解码协议 和 免MCU设计 的独特优势,为无线门铃开发提供了革命性解决方案。本文将深入解析这两款芯片的技术特性、应用场景及落地价值。一、无线门铃市场痛点与芯片方案优势1.1 行业核心痛点系统复杂:传统方案需MCU+射频模块+语音芯片组合,BOM成本高功耗瓶颈:待机电流
    广州唯创电子 2025-03-31 09:06 32浏览
  • 本文介绍OpenHarmony5.0 DevEco Studio开发工具安装与配置,鸿蒙北向开发入门必备!鸿蒙北向开发主要侧重于应用层的开发,如APP开发、用户界面设计等,更多地关注用户体验、应用性能优化、上层业务逻辑的实现,需要开发者具备基本的编程知识、对操作系统原理的简单理解,以及一定的UI设计感。由触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,支持开源鸿蒙OpenHarmony3.2至5.0系统,适合鸿蒙开发入门学习。下载与安装开发工具点下面链接下载:
    Industio_触觉智能 2025-03-28 18:16 28浏览
  • 文/杜杰编辑/cc孙聪颖‍3月11日,美国总统特朗普,将自费8万美元购买的特斯拉Model S,开进了白宫。特朗普此举,绝非偶然随性,而是有着鲜明的主观意图,处处彰显出一种刻意托举的姿态 。特朗普也毫不讳言,希望他的购买能推动特斯拉的发展。作为全球电动车鼻祖,特斯拉曾凭借创新理念与先进技术,开辟电动汽车新时代,引领行业发展潮流。然而当下,这家行业先驱正深陷困境,面临着前所未有的挑战。就连“钢铁侠”马斯克自己都在采访时表示“非常困难”,的确是需要美国总统伸手拉一把了。马斯克踏入白宫的那一刻,特斯拉
    华尔街科技眼 2025-03-28 20:44 34浏览
  • 真空容器内部并非wan全没有压强,而是压强极低,接近于零。真空状态下的压强与容器内外气体的分子数量、温度以及容器本身的性质有关。一、真空与压强的基本概念真空指的是一个空间内不存在物质或物质极少的状态,通常用于描述容器或系统中气体的稀薄程度。压强则是单位面积上所受正压力的大小,常用于描述气体、液体等流体对容器壁的作用力。二、真空状态下的压强特点在真空状态下,容器内部的气体分子数量极少,因此它们对容器壁的作用力也相应减小。这导致真空容器内部的压强远低于大气压强,甚至接近于零。然而,由于技术限制和物理
    锦正茂科技 2025-03-29 10:16 19浏览
  • Shinco音响拆解 一年一次的面包板社区的拆解活动拉开帷幕了。板友们开始大显身手了,拆解各种闲置的宝贝。把各自的设计原理和拆解的感悟一一向电子爱好者展示。产品使用了什么方案,用了什么芯片,能否有更优的方案等等。不仅让拆解的人员了解和深入探索在其中。还可以让网友们学习电子方面的相关知识。今天我也向各位拆解一个产品--- Shinco音响(如下图)。 当产品连接上电脑的耳机孔和USB孔时,它会发出“开机,音频输入模式”的语音播报,。告诉用户它已经进入音响外放模式。3.5mm耳机扣接收电脑音频信号。
    zhusx123 2025-03-30 15:42 48浏览
  • 在智能语音交互设备开发中,系统响应速度直接影响用户体验。WT588F系列语音芯片凭借其灵活的架构设计,在响应效率方面表现出色。本文将深入解析该芯片从接收指令到音频输出的全过程,并揭示不同工作模式下的时间性能差异。一、核心处理流程与时序分解1.1 典型指令执行路径指令接收 → 协议解析 → 存储寻址 → 数据读取 → 数模转换 → 音频输出1.2 关键阶段时间分布(典型值)处理阶段PWM模式耗时DAC模式耗时外挂Flash模式耗时指令解析2-3ms2-3ms3-5ms存储寻址1ms1ms5-10m
    广州唯创电子 2025-03-31 09:26 49浏览
  •        随着智能驾驶向L3级及以上迈进,系统对实时性的要求已逼近极限。例如,自动紧急制动(AEB)需在50毫秒内完成感知、决策到执行的全链路响应,多传感器数据同步误差需小于10微秒。然而,传统基于Linux-RT的方案在混合任务处理中存在天然缺陷——其最大中断延迟高达200微秒,且多任务并发时易引发优先级反转问题。据《2024年智能汽车电子架构白皮书》统计,超60%的车企因实时性不足被迫推迟舱驾一体化项目落地。为旌电子给出的破局之道,是采用R5F(实
    中科领创 2025-03-29 11:55 28浏览
  • 一、真空容器的定义与工作原理真空容器是一种能够创造并保持一定真空度的密闭容器。其工作原理通常涉及抽气系统,该系统能够逐渐抽出容器内部的气体分子,从而降低容器内的气压,形成真空环境。在这个过程中,容器的体积并不会因抽气而改变,但容器内的压力会随着气体的抽出而逐渐降低。二、真空容器并非恒压系统真空容器并非一个恒压系统。恒压系统指的是在外部环境变化时,系统内部压力能够保持相对稳定。然而,在真空容器中,随着气体的不断抽出,内部压力会持续降低,直至达到所需的真空度。因此,真空容器内部的压力是变化的,而非恒
    锦正茂科技 2025-03-29 10:23 31浏览
  • 本文介绍瑞芯微RK356X系列复用接口配置的方法,基于触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。复用接口介绍由下图可知,红圈内容当前引脚可配置为SPI0或者PWM0功能。由标准系统固件以及相关系统手册可得,当前接口默认配置为SPI0功能:console:/ # ls dev/spidev0.0dev/spidev0.0再由原理图可知当前GPIO为GPIO0_C3
    Industio_触觉智能 2025-03-28 18:14 10浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦