热点丨英伟达要做算法公司,GTC发布下代GPU及硅光子技术

AI芯天下 2025-03-24 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
3月19日,英伟达公司首席执行官黄仁勋于GTC2025会议上发表了主题演讲。

鉴于年初DeepSeek公司推出的高性价比产品路线对市场产生了影响,市场对英伟达在高计算力需求领域增长潜力的预期有所调整,导致英伟达的股价出现波动并呈下降趋势。

尽管从长远来看,高性价比的产品路线有望促进整体计算能力需求的提升,但短期内,英伟达不得不面临产品更新换代的过渡期。


作者 | 方文三
图片来源 |  网 络 


明确未来芯片架构发展路线


通过本次GTC大会,黄仁勋提前揭示了一张未来几年的芯片架构发展路线图,计划每年对全栈AI系统进行升级,并推出新的产品线。


预计在2025年下半年推出Blackwell Ultra,2026年下半年推出Rubin,2027年下半年推出Rubin Ultra,以及预计在2028年推出采用下一代HBM技术的Feynman平台。


具体到Blackwell系列工作站和服务器GPU,英伟达在去年3月发布了AI芯片与超级计算平台Blackwell架构,并推出了GB200芯片。


黄仁勋此次宣布,Blackwell已经全面投入生产,而今年Blackwell新一代芯片的正式名称为Blackwell Ultra。


据悉,Blackwell Ultra是基于台积电N4P工艺的Blackwell GPU、Grace CPU以及更大容量的HBM封装而成。


此外,英伟达还公布了继Hopper、Blackwell之后的下一代GPU架构Rubin——以在暗物质研究领域取得突破性进展的天文学家Vera Rubin命名,以及Rubin Ultra的计划配置。


据称,Rubin平台将拥有全新的CPU和网络架构,性能将是Hopper的两倍,内存容量更大,将为AI应用提供更强大的支持。Rubin Ultra系统由Rubin Ultra GPU和Vera CPU组成。


Rubin Ultra由4块掩模尺寸的GPU组成,拥有1TB HBM4e内存,FP4峰值推理能力可达100PFLOPS。


值得一提的是,黄仁勋还宣布了Rubin之后的下一代AI芯片架构[Feynman]。


该名称源自对量子计算领域有着重要贡献的科学家Richard Phillips Feynman。


黄仁勋解释提前公布未来三年路线图的原因,强调现在构建的是AI工厂,这需要多年的规划。



英伟达要做算法公司


关于AI行业的未来,黄仁勋传递出更多[宏大叙事]。


AI行业并非单一领域,而是从技术到设施再到应用的全方位领域。


因此,作为AI行业领头羊的英伟达,其故事远不止于[芯片]。


在此次演讲中,黄仁勋从多个角度展示了英伟达在整个AI产业链的布局。


黄仁勋重新界定了英伟达的定位:[我们并非单纯从事芯片制造的企业,而是一家专注于算法创新的公司。]


在会议中,他多次向媒体阐述了AI工厂的概念,坚信AI工厂将成为数字经济的新动力。


他指出,数据中心将经历一次质的飞跃,演变为AI工厂,它们的作用将不再局限于托管应用程序,而是直接转化为经济收益。


尽管如此,黄仁勋依旧强调了GTC大会的重要性,认为它标志着英伟达从计算机技术公司向AI基础设施公司的重大转型。


他展示了数据中心如何从数据处理和应用托管的角色进化为AI工厂的过程,并期望大家共同见证一个全新行业的诞生。



为百万级GPU AI工厂开启新的可能性


在发布会上,黄仁勋明确表示:[英伟达已将硅光技术直接集成至交换机之中,这不仅突破了超大规模及企业网络的传统局限,而且为百万级GPU的AI工厂开启了新的可能性。]


随着 Scaling Law 的推动,业界普遍认同了提升计算能力规模的重要性。


从系统视角分析,计算能力规模的扩展可从两个层面进行:首先是增强单个芯片的计算能力;


其次是增加系统内芯片的数量,即提升集群规模。这一过程可以通过两种方式实现:横向扩展(Scale-Out)和纵向扩展(Scale-Up)。


在第一种情况下,单芯片计算能力的提升主要受到两个因素的制约:计算能力密度和内存带宽。


要想显著提高这些指标,必须在高端工艺制程上进行深入研究。


对于无晶圆厂的AI芯片公司而言,提升计算能力实质上是与制程技术的竞争,而不仅仅是架构设计的巧妙。


能否获得甚至引领顶级制造能力的竞争,已成为关键。


第二种情况是集群规模的提升,横向扩展(Scale-Out)意味着突破规模限制进行扩展,而纵向扩展(Scale-Up)则意味着成比例地增加性能。


横向扩展可以理解为分布式计算,通过增加独立服务器来分散工作负载,从而提升计算容量。在AI集群中,这可以类比为InfiniBand或RoCE网络所实现的功能;


纵向扩展则侧重于升级单台服务器或基于机箱的系统,通过向现有系统增加芯片来提升计算能力。


在AI集群中,这可以类比为NVLink所实现的功能;


由此可见,提升集群规模计算能力的核心,在于竞争通信技术的发展。



硅光子技术与CPO技术将共同助推发展


英伟达公司近期推出了创新的NVIDIA Photonics硅光子技术。


随着AI计算技术的迅猛发展,数据中心网络基础设施正面临日益增长的需求压力。


采用共封装光学(CPO)技术替代传统可插拔光学收发器,实现了光纤与交换机的直接连接,预计将使数据中心的电力消耗降低40兆瓦。


该技术不仅提升了AI计算集群的网络传输效率,而且为构建下一代大规模AI数据中心奠定了坚实的基础。


行业分析机构Lightcounting预测,在未来三年内,即便是推理集群也可能需要配备多达1,000个GPU以支持更大规模的模型。


CPO可能是唯一能够在4至8个机架系统中提供数万个高速互连器件的解决方案。



目前,英伟达公司计划推出三种不同类型的交换机,并将推出共同封装的光学产品。


Quantum 3450-LD交换机拥有四个Quantum-X CPO插槽,能够实现无阻塞的全连接,提供800 Gb/秒的速率,具备144个端口,这些端口的总有效带宽达到115 Tb/秒。


该款Quantum-X交换机预计将于2025年下半年面市。


另外两款采用CPO的Spectrum-X交换机的研发进度稍缓,预计将在2026年下半年才能完成。


英伟达推出的首款配备CPO的以太网交换机为Spectrum SN6810,它将搭载一个Spectrum-X CPO设备,并为128个端口提供800 Gb/秒的速率,总带宽达到102.4 Tb/秒。


Quantum-X光子学InfiniBand平台利用200Gbps SerDes技术,具备144x800Gbps端口,配备液体冷却的硅光子学模块。


与前代产品相比,该平台显著提升了AI计算速度,实现了五倍于以往的可扩展性。



英伟达Spectrum-X光子学交换机提供多种配置选项,包括128个800 Gb/s端口或512个200 Gb/s端口,总带宽高达100 Tb/s;


以及512个800 Gb/s端口或2048个200 Gb/s端口,总吞吐量高达400 Tb/s。


每个封装模块由一个量子X800 ASIC和六个光学组件构成,总共包含18个硅光子引擎。


量子X800 ASIC提供28.8 Tb/s的吞吐量,并采用台积电的4N工艺,集成了1070亿个晶体管。


在每个CPO模块中,直接连接的光学组件包含三个硅光子引擎(每个模块总计18个)和三个紧凑的可插拔连接器,实现4.8 Tb/s的吞吐能力。


每个硅光子引擎均采用200 Gb/s微环调制器,将功耗降低至原来的三分之一。


InfiniBand CPO预计将于2025年下半年首次推出,而以太网CPO预计将于2026年下半年推出。


值得注意的是,CPO将是可选的,英伟达将继续提供具备可插拔模块的交换机系统。


CPO代表了AI行业长期发展进程中的重要一步。


在短期内,CPO可能会在特定场景下进行试点,例如超大规模集群,而可插拔模块仍将是主流。


然而,从长远来看,随着对高带宽传输需求的不断增长,CPO技术将获得更广泛的应用。


未来,可能会出现结合[CPO+可插拔]架构的混合模式,以根据不同的应用需求提供灵活的选择。



结尾:


在GTC现场,黄仁勋与一台小型机器人共同展示了互动,传递出一个关键信息:随着Agentic AI时代的到来,计算需求可能会显著增加。


当Agentic AI从实验室走向规模化应用,单个设备的计算需求将被成千上万倍复制,这种分布式部署将推动整体算力需求呈几何级数增长。


将推动整个信息技术产业的革命性升级,从硬件到软件、从算法到架构,都需要围绕[高效、实时、智能]的目标进行全面革新。


部分资料参考:腾讯科技:《黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO》,半导体行业观察:《下一代GPU发布,硅光隆重登场,英伟达还能火多久?》,镜相工作室:《英伟达的「算力信仰」保卫战》,甲子光年:《黄仁勋GTC媒体会:英伟达不是一家芯片公司,而是一家算法公司》,36氪Pro:《华尔街不买账英伟达GTC发布,黄仁勋讲不出新故事?》,极客公园:《被误解的英伟达,和不被理解的黄仁勋》,中国电子报:《一场英伟达GTC,黄仁勋释放出三大信号》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。




END


推荐阅读:


商务合作请加微信勾搭:
18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • 在当今竞争激烈的工业环境中,效率和响应速度已成为企业制胜的关键。为了满足这一需求,我们隆重推出宏集Panorama COOX,这是Panorama Suite中首款集成的制造执行系统(MES)产品。这一创新产品将Panorama平台升级为全面的工业4.0解决方案,融合了工业SCADA和MES技术的双重优势,帮助企业实现生产效率和运营能力的全面提升。深度融合SCADA与MES,开启工业新纪元宏集Panorama COOX的诞生,源于我们对创新和卓越运营的不懈追求。通过战略性收购法国知名MES领域专
    宏集科技 2025-03-27 13:22 61浏览
  • ​2025年3月27日​,贞光科技授权代理品牌紫光同芯正式发布新一代汽车安全芯片T97-415E。作为T97-315E的迭代升级产品,该芯片以大容量存储、全球化合规认证、双SPI接口协同为核心突破,直击智能网联汽车"多场景安全并行"与"出口合规"两大行业痛点,助力车企抢占智能驾驶与全球化市场双赛道。行业趋势锚定:三大升级回应智能化浪潮1. 大容量存储:破解车联网多任务瓶颈随着​车机功能泛在化​(数字钥匙、OTA、T-BOX等安全服务集成),传统安全芯片面临存储资源挤占难题。T97-415E创新性
    贞光科技 2025-03-27 13:50 59浏览
  •       知识产权保护对工程师的双向影响      正向的激励,保护了工程师的创新成果与权益,给企业带来了知识产权方面的收益,企业的创新和发明大都是工程师的劳动成果,他们的职务发明应当受到奖励和保护,是企业发展的重要源泉。专利同时也成了工程师职称评定的指标之一,专利体现了工程师的创新能力,在求职、竞聘技术岗位或参与重大项目时,专利证书能显著增强个人竞争力。专利将工程师的创意转化为受法律保护的“无形资产”,避免技术成果被他人抄袭或无偿使
    广州铁金刚 2025-03-25 11:48 160浏览
  • 长期以来,智能家居对于大众家庭而言就像空中楼阁一般,华而不实,更有甚者,还将智能家居认定为资本家的营销游戏。商家们举着“智慧家居、智慧办公”的口号,将原本价格亲民、能用几十年的家电器具包装成为了高档商品,而消费者们最终得到的却是家居设备之间缺乏互操作性、不同品牌生态之间互不兼容的碎片化体验。这种早期的生态割裂现象致使消费者们对智能家居兴趣缺失,也造就了“智能家居无用论”的刻板印象。然而,自Matter协议发布之后,“命运的齿轮”开始转动,智能家居中的生态割裂现象与品牌生态之间的隔阂正被基于IP架
    华普微HOPERF 2025-03-27 09:46 40浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 110浏览
  • 六西格玛首先是作为一个量度质量水平的指标,它代表了近乎完美的质量的水平。如果你每天都吃一个苹果,有一间水果店的老板跟你说,他们所卖的苹果,质量达到六西格玛水平,换言之,他们每卖一百万个苹果,只会有3.4个是坏的。你算了一下,发现你如果要从这个店里买到一个坏苹果,需要805年。你会还会选择其他店吗?首先发明六西格玛这个词的人——比尔·史密斯(Bill Smith)他是摩托罗拉(Motorloa)的工程师,在追求这个近乎完美的质量水平的时候,发明了一套方法模型,开始时是MAIC,后来慢慢演变成DMA
    优思学院 2025-03-27 11:47 48浏览
  • 案例概况在丹麦哥本哈根,西门子工程师们成功完成了一项高安全设施的数据集成项目。他们利用宏集Cogent DataHub软件,将高安全设施内的设备和仪器与远程监控位置连接起来,让技术人员能够在不违反安全规定、不引入未经授权人员的情况下,远程操作所需设备。突破OPC 服务器的远程连接难题该项目最初看似是一个常规的 OPC 应用:目标是将高安全性设施中的冷水机(chiller)设备及其 OPC DA 服务器,与远程监控站的两套 SCADA 系统(作为 OPC DA 客户端)连接起来。然而,在实际实施过
    宏集科技 2025-03-27 13:20 48浏览
  • 家电,在人们的日常生活中扮演着不可或缺的角色,也是提升人们幸福感的重要组成部分,那你了解家电的发展史吗?#70年代结婚流行“四大件”:手表、自行车、缝纫机,收音机,合成“三转一响”。#80年代随着改革开放的深化,中国经济开始飞速发展,黑白电视机、冰箱、洗衣机这“新三件”,成为了人们对生活的新诉求。#90年代彩电、冰箱、全自动洗衣机开始大量进入普通家庭,快速全面普及,90年代末,家电产品实现了从奢侈品到必需品的转变。#00年代至今00年代,随着人们追求高品质生活的愿望,常用的电视机、洗衣机等已经远
    启英AI平台 2025-03-25 14:12 54浏览
  • 在电子设计中,电磁兼容性(EMC)是确保设备既能抵御外部电磁干扰(EMI),又不会对自身或周围环境产生过量电磁辐射的关键。电容器、电感和磁珠作为三大核心元件,通过不同的机制协同作用,有效抑制电磁干扰。以下是其原理和应用场景的详细解析:1. 电容器:高频噪声的“吸尘器”作用原理:电容器通过“通高频、阻低频”的特性,为高频噪声提供低阻抗路径到地,形成滤波效果。例如,在电源和地之间并联电容,可吸收电源中的高频纹波和瞬态干扰。关键应用场景:电源去耦:在IC电源引脚附近放置0.1μF陶瓷电容,滤除数字电路
    时源芯微 2025-03-27 11:19 49浏览
  • 文/陈昊编辑/cc孙聪颖‍2025 年,作为中国实施制造强国战略第一个十年计划的关键里程碑,被赋予了极为重大的意义。两会政府工作报告清晰且坚定地指出,要全力加速新质生产力的发展进程,推动传统产业全方位向高端化、智能化与绿色化转型。基于此,有代表敏锐提议,中国制造应从前沿技术的应用切入,逐步拓展至产业生态的构建,最终延伸到提升用户体验的维度,打出独树一帜、具有鲜明特色的发展牌。正是在这样至关重要的时代背景之下,于 AWE 2025(中国家电及消费电子博览会)这一备受瞩目的舞台上,高端厨房的中国方案
    华尔街科技眼 2025-03-25 16:10 66浏览
  • 在智能语音产品的开发过程中,麦克风阵列的选型直接决定了用户体验的优劣。广州唯创电子提供的单麦克风与双麦克风解决方案,为不同场景下的语音交互需求提供了灵活选择。本文将深入解析两种方案的性能差异、适用场景及工程实现要点,为开发者提供系统化的设计决策依据。一、基础参数对比分析维度单麦克风方案双麦克风方案BOM成本¥1.2-2.5元¥4.8-6.5元信噪比(1m)58-62dB65-68dB拾音角度全向360°波束成形±30°功耗8mW@3.3V15mW@3.3V典型响应延迟120ms80ms二、技术原
    广州唯创电子 2025-03-27 09:23 56浏览
  • 汽车导航系统市场及应用环境参照调研机构GII的研究报告中的市场预测,全球汽车导航系统市场预计将于 2030年达到472亿美元的市场规模,而2024年至2030年的年复合成长率则为可观的6.7%。汽车导航系统无疑已成为智能汽车不可或缺的重要功能之一。随着人们在日常生活中对汽车导航功能的日渐依赖,一旦出现定位不准确或地图错误等问题,就可能导致车主开错路线,平白浪费更多行车时间,不仅造成行车不便,甚或可能引发交通事故的发生。有鉴于此,如果想要提供消费者完善的使用者体验,在车辆开发阶段便针对汽车导航功能
    百佳泰测试实验室 2025-03-27 14:51 68浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 136浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦