Ironwood的发布不仅展示了谷歌在AI芯片领域的持续创新,也标志着AI基础设施的重大变革。它将推动AI从传统的响应式模型向主动生成洞察和解读的模型转变,为开发者和企业提供更强大的工具来应对复杂的AI推理任务。

4月9日,谷歌在拉斯维加斯举办的Google Cloud Next 2025大会上正式发布了第七代TPU芯片——Ironwood。这款芯片专为AI推理任务设计,标志着人工智能从“响应式”模型向“主动式”模型的转变,即从提供实时信息的模型向能够主动生成洞察和解读的模型发展,目标是为智能体(Agent)提供主动检索、数据生成及协作推理能力,而非仅被动响应查询。

谷歌Ironwood

Ironwood是谷歌迄今为止性能最强、能效最高且最节能的TPU芯片,其峰值算力达到4614 TeraFLOPS(TFLOPs),是前代Trillium芯片的五倍,内存容量为192GB,带宽高达7.2 Tbps,每瓦峰值算力为29.3 TeraFLOPS,是前代的两倍。此外,Ironwood首次支持FP8计算格式,并在张量核和矩阵数学单元中实现这一功能,这使得其在处理大规模推理任务时更加高效。

Ironwood 最高配集群可拥有9216个液冷芯片,峰值算力可达42.5 ExaFLOPS(即每秒425000000000000000000次运算,相当于全球最强超算El Capitan的24倍),支持大规模并行处理和高效内存访问,适用于复杂的推理任务如大型语言模型和混合专家模型。

在能效与通信优化上,该芯片每瓦性能较Trillium翻倍,芯片间互连(ICI)带宽提升至1.2 Tbps(双向),支持低延迟同步通信,适合大规模并行推理任务。第三代SparseCore加速器扩展应用场景,覆盖推荐系统、金融建模和科学计算。

关于性能对比,Ironwood的推理性能较第一代TPU提升了3600倍,同时效率提升了29倍。虽然英伟达的B200芯片在某些指标上略胜一筹(如内存带宽达到8 Tbps,略高于Ironwood的7.2 Tbps),但Ironwood的整体性能仍非常接近甚至在某些方面超越了B200。

与Google首款外部云TPU TPU v2相比,FP8峰值浮点运算总体性能有所提升

谷歌Ironwood英伟达B200的对比分析

从竞争格局来看,谷歌通过TPU与Google Cloud、Pathways软件栈深度集成,吸引OpenAI创始团队等客户,强化生成式AI市场地位。而英伟达B200凭借CUDA生态和Blackwell平台兼容性,仍是训练任务的首选,但Ironwood在推理专用赛道的能效和集群规模上构成挑战

整体来看,Ironwood在推理专用赛道的算力、内存和集群扩展性上展现优势,但B200凭借工艺与生态仍是全能型选手。两者竞争将推动AI芯片向场景化、高能效方向演进,加速AGI基础设施成熟。

Ironwood的发布不仅展示了谷歌在AI芯片领域的持续创新,也标志着AI基础设施的重大变革。它将推动AI从传统的响应式模型向主动生成洞察和解读的模型转变,为开发者和企业提供更强大的工具来应对复杂的AI推理任务。

责编:Jimmy.zhang
您可能感兴趣
未来,英伟达需要在满足美国出口管制与中国市场需求中玩好“平衡术”,在地缘政治和经济利益的夹缝中调整产品策略,新系列的“特供版”AI芯片——“B20” 的成败或决定其未来在华市场份额。
据悉,本轮资金将主要用于推动下一代先进人工智能芯片的技术研发,加速智能产品量产进程,并加大市场推广力度。
OpenAI的400亿美元融资不仅是其发展史上的里程碑,更标志着人工智能行业进入“超级资本化”阶段。
在新竹宝山晶圆厂(Fab 20)和高雄晶圆厂(Fab 22)共同贡献下,预计到2025年底,台积电2nm工艺的总月产能将突破5万片晶圆,潜在客户包括苹果、AMD、Intel、博通等。
AMD日前在嵌入式世界大会(Embedded World 2025)上宣布推出第五代AMD EPYC™(霄龙)嵌入式处理器9005系列,再度扩展其x86嵌入式处理器产品组合。
DeepSeek前两个月爆火,市场似乎就对英伟达失去了信心。从最近的GTC来看,这样的信心丢失该如何去解读?未来AI芯片市场还有多大潜力?
Silicon Labs(芯科科技)和Arduino宣布建立合作伙伴关系,旨在通过Arduino Nano Matter开发板(基于芯科科技的MGM240系列多协议无线模块)的两阶段合作来简化Matter协议的设计和应用
随着数据中心耗电量急剧增加,行业更迫切地需要能够高效转换电力的功率半导体。
慕尼黑上海电子展将于4月15-17日在上海新国际博览中心举行
Keysight AI(KAI)系列端到端解决方案,旨在帮助客户通过使用真实世界的AI工作负载仿真,从而验证AI集群组件来扩展数据中心的AI处理能力。
全球电子纸领导厂商元太科技(E Ink)今(7)日宣布,其全新突破性全彩电子纸技术— E Ink Marquee™,将于 Touch Taiwan 2025 展会上首度亮相。E Ink Marquee
在中小企业的经营账本上,"应收账款"四个字常染着焦灼的墨色。当胜诉判决仍难兑现时,企业主们面对账面的数字,犹如凝视坚冰。深圳某电子公司的追债之路,为困境中的企业点亮了一盏灯——原来,法律条款里藏着一把
来源:量子位 作者:金磊 梦晨 家人们,你知道近段时间大火的各种大模型一体机,里面到底是什么卡吗? 相信很多小伙伴的第一反应,或许就是N卡。 但在我们接触、体验了真
当下,6G 研究重点围绕传统频谱与新型频谱展开。在 7GHz 以下频谱领域持续深耕的同时,以下频段正成为业界瞩目的焦点:FR3频段:7 - 24GHz 频率范围Sub-THz频段:90 - 300GH
LG Display 选定 5 家初创公司参与其开放式创新计划“2025 Dream Play with ENSL”,并已开始正式运营。该计划专注于培育显示器、材料/组件和人工智能(AI)领域有前途的
三星电子将于下个月开始量产其下一代可折叠智能手机“Galaxy Fold·Z Flip 7”系列。尤其引人注目的是Z Flip是否会搭载由半导体(DS)部门开发的应用处理器(AP)“Exynos 25
据中国海关总署4月9日公告,自今日12时01分起,对原产于美国的所有进口商品,在现行适用关税税率基础上加征84%关税。4月10日,美国总统特朗普宣布对多个国家暂停实施新关税90天,并在此期间大幅降低对
4月10日消息,据外媒援引知情人士称,特朗普叫停了将英伟达对华销售限制扩大至“特供版”AI芯片H20的计划!据报道,美国英伟达首席执行官黄仁勋上周五在特朗普位于佛罗里达州的私人住所海湖庄园出席豪华晚宴
在 2025 年第一季度的全员大会上,特斯拉首席执行官埃隆・马斯克表示,该公司将在今年生产首批 Optimus 人形机器人。这一计划的推进,从特斯拉的招聘页面上也可见一斑,其对人形机器人团队的大力扩充
  在光电行业,无尘车间的装修洁净度是至关重要的因素,它直接关系到产品的质量和生产效率。确定光电无尘车间的洁净度不仅需要考虑产品生产的洁净度需求、生产工艺,还要遵循行业标准及规范。