英伟达发布最新AI芯片H200：“中期改款”，但刀法依旧精准-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

作为继H100之后的升级产品，H200芯片性能更强大，适用于各种人工智能应用场景。它可以用于训练和部署各种大型语言模型、图像识别、语音识别等人工智能模型。在推理或生成问题答案时，性能较H100提高60%至90%。

图源：英伟达

近日，芯片巨头英伟达发布了H100芯片的继任者，也是目前世界最强的AI芯片——H200。这是英伟达新一代的GPU，专为训练和部署各种人工智能模型而设计。

H200较H100有较大性能提升

该芯片直接采用141GB大内存，与H100的80GB相比直接提升76%。而作为首款搭载HBM3e内存的GPU，内存带宽也从3.35TB/s提升至4.8TB/s，提升43%。在HBM3e加持下，H200让Llama-70B推理性能几乎翻倍，运行GPT3-175B也能提高60%。

H200的性能提升最主要体现在大模型推理表现上，H200 在700亿参数的Llama2大模型上的推理速度比H100快了一倍，而且在推理能耗上H200相比H100直接降低了一半。

对于显存密集型HPC应用，H200更高的显存带宽能够确保高效地访问操作数据，与CPU相比，获得结果的时间最多可提升110倍。

不仅如此，H200与H100一样都是基于英伟达Hopper架构打造，这也意味着两款芯片可以互相兼容，对于使用H100企业而言，可以无缝更换成最新的H200。

整体来看，由于NVIDIA Hopper架构、TensorRT-LLM专用软件等软硬件技术加持，新的H200在超大模型训练和推理性能表现优异。与H100相比，H200在Llama 2（700亿参数）开源大模型的推理速度几乎翻倍，而未来的软件更新预计会带来H200的额外性能领先优势和改进。

据英伟达数据，在TF32 Tensor Core（张量核心）中，H200可达到989万亿次浮点运算；INT8张量核心下提供3,958 TFLOPS（每秒3958万亿次的浮点运算）。

不仅如此，基于H200芯片构建的HGX H200加速服务器平台，拥有 NVLink 和 NVSwitch 的高速互连支持。8个HGX H200则提供超过32 petaflops（每秒1000万亿次的浮点运算）的FP8深度学习计算和 1.1TB 聚合高带宽内存，从而为科学研究和 AI 等应用的工作负载提供更高的性能支持，包括超1750亿参数的大模型训练和推理。

忽略“算力”升级，切中AI推理

客观来说，H200相较H100在算力方面提升并不明显。从英伟达给出的数据来看，在GPT-3175B大模型的训练中，H200只比H100强了10%。正如有人所评论，H200可能只是H100的一个“中期改款”。

然而，在各大科技企业从训练模型转向推理之后，H200转而重点提升推理方面的能力，又足以说明英伟达切中了“要点”——刀法依旧精准。对此，有人评论H200在推理方面重点发力的意义：

一是提升AI性能：H200芯片在处理大型AI模型时的性能有了显著提升，这标志着英伟达继续在AI芯片领域保持领先地位。对于需要处理大量数据、进行复杂计算的AI应用来说，这无疑是一个重大利好。

二是加速AI应用落地：在H200芯片的帮助下，大语言模型Llama 2的推理速度翻倍，这意味着AI应用能够更快地投入使用，为企业和组织带来更高效的工作流程。

三是推动AI创新：H200芯片的性能提升，将鼓励更多的企业和研究机构进行AI创新。例如，它可以帮助企业更快地进行语言翻译、图像识别、自然语言处理等任务，从而提升工作效率和创造力。

四是促进AI人才培养：随着AI技术的不断发展，对相关人才的需求也在不断增加。H200芯片的发布，将进一步推动AI领域的人才培养。英伟达作为全球领先的AI芯片制造商，其产品和技术一直处于行业前列，这将为相关人才提供更好的学习和发展机会。

五是增强英伟达的市场竞争力：H200芯片的发布，进一步巩固了英伟达在AI芯片市场的领先地位。随着AI技术的不断发展和应用，AI芯片市场的竞争也将越来越激烈。英伟达通过不断推出性能卓越的AI芯片，将能够在市场竞争中保持领先地位。

因此，英伟达发布世界最强AI芯片H200，性能飙升90%，Llama 2推理速度翻倍，这一事件对于推动AI技术的发展、加速AI应用落地、促进AI人才培养以及增强英伟达的市场竞争力都具有重要意义。

H200价格会更高

英伟达表示H200预计将于2024年第二季度出货，但售价还暂未公布。据美国金融机构Raymond James透露，H100芯片成本仅3320美元，但英伟达对其客户的批量价格仍然高达2.5万至4万美元。这导致H100利润率或高达1000%，成为了有史以来最赚钱的一种芯片。而H200市场表现也将不遑多让，毕竟在当前算力荒的行业背景下，一些科技企业必然会疯狂扫货，而性能加量后的H200的价格只会比H100高。

英伟达官网显示，NVIDIA H200将为40多台AI超级计算机提供支持。包括CoreWeave、亚马逊AWS、谷歌云、微软Azure、甲骨文云等公司将成为首批部署基于H200实例的云服务商。同时，华硕、戴尔科技、惠普、联想、Supermicro、纬创资通等系统集成商也会使用H200更新其现有系统。

责编：Jimmy.zhang

阅读全文，请先

处理器/DSP 人工智能数据中心/服务器

您可能感兴趣

【ICCAD2024】AI时代，先进数字芯片设计下的国产EDA新路径

面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战，国产EDA仍需不断探索和创新。

美国最高法院驳回英伟达上诉请求，被控诉涉嫌误导投资者

股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动，而非游戏销售，导致投资者对公司的盈利来源和风险敞口产生错误认知。

为什么说机器人的“ChatGPT时刻”将至？从ROSCon看当代机器人开发…

今年初的GTC上，黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...

华为Mate 70系列实现芯片100%国产化

近日，华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示，华为Mate 70系列每一颗芯片都有国产的能力。此外，日前在深圳宝安中学的一场讲座中，华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。

华为Mate 70 RS拆解：麒麟9020芯片现身

华为Mate 70系列中的Mate 70搭载了麒麟9010芯片，而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日，百万粉丝的网红博主@杨长顺维修家对华为Mate 70 RS进行了拆解……

Intel新一代B系游戏显卡发布，还带AI帧生成...

Intel刚刚发布了新一代桌面显卡Arc B580和B570，关键是还支持AI帧生成和低延迟...

“一碰交互，共触未来”ITMA峰会盛大开启近场交互新生态

目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。

中科院微电子所在忆阻神经-模糊硬件及应用探索方面取得新进展

中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……

直角照明轻触开关为复杂电子应用提供定制性和多功能性

C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。

投身国产浪潮向上而行，英韧科技再获“中国芯”认可

项目动态|长飞先进武汉基地首批设备搬入

今日，长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办，长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言，厂房建设一般主要分为四个阶段：设备选型、设

18亿元！2大储能项目新动态

近期，多个储能电站项目上新。■ 乐山电力：募资2亿建200MWh储能电站12月17日晚，乐山电力（600644.SH）公告，以简易程序向特定对象发行A股股票申请已获上交所受理，募集资金总额为2亿元。发

拜登拟对成熟制程芯片启动301调查

来源：观察者网12月18日消息，自12月2日美国发布新一轮对华芯片出口禁令以来，不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称，根据知情人士以及该报查阅

LGDisplay引入AI处理OLED质量异常效率提升90%，每年节约超2000亿韩元

来源：IT之家12 月 18 日消息，LG Display 韩国当地时间今日宣布，已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中，该系统可提升 LG Display 的 OLE

柔宇显示资产降价拍卖

阿里资产显示，随着深圳柔宇显示技术有限公司（下称：“柔宇显示”）旗下资产一拍以流拍告终，二拍将于12月24日开拍，起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产，其中不

注意些问题，嵌入式软件代码可大幅度减少bug

扫描关注一起学嵌入式，一起学习，一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃，死机或其他计划外的运行时行为追溯到根本原因。在最坏的情

自动驾驶业务增长6倍，Uber被市场明显错杀，即将迎来50%上涨空间！

“ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务，Uber ( NYSE: UBER ) 的股价在短短几周内从 202

扎克伯格39岁华裔爱妻罕见炫舞，丰韵身姿尽显“女王”气场，宠溺深情令人动容

在科技浪潮翻涌的硅谷，马克·扎克伯格不仅是“脸书”帝国的掌舵人，更是以其谦逊低调的形象，在公众心中树立了独特的领袖风范。然而，在镁光灯难以触及的私人领域，扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事

REDMI全球首发！联发科天玑8400官宣：挑战高通骁龙8系

今天上午，联发科宣布新一代天玑芯片即将震撼登场，新品会在12月23日15点正式发布。据悉，这场发布会联发科将推出全新的天玑8400处理器，这颗芯片基于台积电4nm制程打造，采用Arm Cortex A

还有38%的上涨空间！亚马逊AI战略大爆发

“ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ：AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益

文章评论

最新
热门

换一换

EE直播

更多>

英伟达发布最新AI芯片H200：“中期改款”，但刀法依旧精准

H200较H100有较大性能提升

忽略“算力”升级，切中AI推理

H200价格会更高

杂志声明