分析丨继续打破摩尔定律,Blackwell芯片发展到了哪一步了?

原创 AI芯天下 2024-06-14 20:41

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
全球科技行业正处于一个以人工智能和自动化技术为核心的新一轮创新周期之中。

科技创新周期大约每二十年呈现一次显著变革,回顾历史,前两次创新浪潮分别标志着个人电脑时代的兴起以及互联网时代的繁荣壮大,其中亦囊括了移动设备与云计算技术的革命性发展。


作者 | 方文三
图片来源 |  网 络 


英伟达的路线图将每年更新


在最近的演讲中,黄仁勋详细阐述了英伟达芯片产品的年度升级周期计划,该计划将坚持遵循数据中心规模、年度更新频率、技术约束以及统一架构的发展路径。

具体而言,英伟达将依托当前最先进的半导体制程技术,通过采用统一的架构来覆盖整个数据中心GPU产品线,并致力于实现每年一次的产品更新迭代。


黄仁勋强调指出,英伟达凭借CUDA+GPU的组合策略,成功构建了安装量持续增长、开发者及应用日益丰富、研发规模不断扩大、性能持续提升的良性生态循环。


目前,CUDA生态已遍布全球各地,得到了广泛应用。


例如,谷歌已宣布将cuDF纳入其云计算平台,以加速世界范围内受欢迎的数据科学库Pandas的运行。


此外,在深度学习cuDNN、物理模拟Modulus、通信Aerial RAN、基因序列分析Parabricks以及量子计算模拟cuQUANTUM、数据处理cuDF等多个领域,均有专业的CUDA软件提供支持。


黄仁勋表示,英伟达的路线图将保持年度更新的节奏,其核心思想在于[构建数据中心规模的产品体系,以年度为周期逐步推进并实现技术突破,向客户提供高质量的产品和服务]。


他进一步承诺,英伟达不会满足于现状,将继续致力于提升产品性能、降低训练和推理成本,以及拓展AI功能,以满足不断增长的市场需求和技术挑战。



量产Blackwell及Rubin架构的路线图亮相


今年三月,英伟达在其盛大的年度GTC大会上,正式发布了具备2080亿晶体管的Blackwell芯片。


这款芯片是英伟达首次采用MCM(多芯片封装)技术设计的GPU,实现了在同一芯片上集成双GPU的突破。


英伟达创始人兼CEO黄仁勋在会上指出,在短短八年的时间里,英伟达的AI算力实现了惊人的飞跃。


从2016年Pascal芯片的19 TFLOPS,到2024年Blackwell芯片的20000 TFLOPS,算力提升了高达1000倍,这一增速几乎超越了摩尔定律在最佳时期的发展速度。


搭载Blackwell芯片的最新DGX超算系统在各项性能指标上均实现了显著提升。


相较于上一代Hopper系统,Blackwell系统不仅在NVLink域集成了72个GPU,实现了性能9倍的提升,同时在NVLink带宽方面也实现了18倍的增长,AI算力更是提升了45倍,供能效率也提高了10倍。


目前,市场对GB200充满期待,业界普遍预测,到2025年,GB200的出货量有望突破百万颗,占据英伟达高端GPU出货量的近40%至50%。



此外,黄仁勋还公布了英伟达未来三代芯片的发展路线图,包括计划于2025年推出的Blackwell Ultra,2026年亮相的Rubin,以及2027年预计推出的Rubin Ultra。


值得一提的是,这也是下一代AI平台Rubin的首次公开亮相。


目前,英伟达已经开始量产其高性能GPU架构Blackwell,相关产品将陆续上市,包括适用于HPC/AI领域的B200/GB200系列,以及面向游戏市场的RTX 50系列。


同时,黄仁勋还透露了Rubin架构的未来发展蓝图,该架构将配备全新的GPU、基于Arm架构的Vera CPU,以及采用NVLink 6、CX9 SuperNIC和X1600融合InfiniBand/以太网交换机的高级网络技术。


展望未来,英伟达将继续按照既定的发展计划推进芯片研发与生产。


预计2024年Blackwell芯片将全面投入生产,2025年推出Blackwell Ultra产品,2026年发布Rubin系列,最终在2027年推出集大成之作——Rubin Ultra,并配备基于Arm的Vera CPU和先进的NVLink 6 Switch技术。



数据中心将进入数百万GPU时代


NVIDIA创始人兼CEO黄仁勋正式宣布,公司将每年定期推出全新的Spectrum-X系列产品。


作为全球首款专为AI领域打造的以太网网络平台,NVIDIA Spectrum-X相较传统以太网网络平台,在网络性能上实现了显著提升,高达1.6倍,有效加速了AI工作负载的处理、分析以及执行速度。


在Spectrum-X系列中,Spectrum-X800专为数万个GPU量身打造,而X800 Ultra则针对数十万个GPU进行了优化,至于X1600,其扩展能力可支持至数百万个GPU,展现出强大的灵活性与可扩展性。


目前,在竞争激烈的高性能以太网市场中,NVIDIA Spectrum-X亦面临着来自行业巨头如Intel和Mellanox的强劲挑战。


值得一提的是,CoreWeave、GMO Internet Group、Lambda、Scaleway以及STPX Global Yotta等众多领先的AI云服务提供商已率先采用NVIDIA Spectrum-X,为其AI基础设施带来了前所未有的极致网络性能体验。



用Isaac生态系统迎接机器人时代


黄仁勋明确指出,英伟达正致力于通过推进机器人技术堆栈以加速物理AI的生成。


这一进程涵盖了多个关键组件,包括适用于模拟应用的Omniverse平台、具备人形基础模型特征的Project GR00T,以及提供强大计算能力的Jetson Thor机器人计算机。


英伟达发布的NVIDIA Isaac平台,旨在为开发人员提供一套功能强大的工具集合,用以构建各类AI机器人,这些机器人类型广泛,包括但不限于自主移动机器人(AMR)、工业机械手臂以及人形机器人。


这一平台的强大能力得益于AI模型的支持,以及Jetson Orin和Thor等超级计算机的运算能力。


NVIDIA Isaac Lab作为Isaac Sim中的参考应用程序,特别针对AI机器人基础模型的训练进行了优化,包括强化学习、模仿学习和迁移学习等多种方法。


这一功能为机器人应用提供了强大的基础模型训练支持,覆盖了多个应用场景,从而显著提升了机器人的性能和智能化水平。


目前,Isaac生态系统正经历着迅猛的发展。全球多家领先的机器人行业企业,如比亚迪、西门子、泰瑞达和Intrinsic等,已将NVIDIA Isaac加速库、基于物理学的仿真技术以及AI模型集成至其软件框架和机器人模型中。


这些举措极大地提高了工厂、仓库和配送中心的工作效率,使得机器人成为执行重复性、高精度任务的智能助手,为各行各业带来了革命性的变革。



新一轮工业革命开始,AI工厂正在诞生


在今年的五月份财报会议上,黄仁勋明确指出,下一场工业革命已然拉开帷幕。


此次革命不仅限于云服务提供商,生成式AI技术已广泛渗透到消费互联网公司、各类企业、主权AI、汽车制造以及医疗保健等诸多领域,成功塑造了多个价值数十亿美元的垂直市场。


英伟达,作为技术领域的领军企业,正站在新一轮增长浪潮的起点之上。


为积极响应并推动此次技术革命,英伟达携手众多制造厂商,共同推出了一系列基于NVIDIA Blackwell架构的先进系统。


这些系统不仅配备了Grace CPU,还融入了NVIDIA领先的网络和基础设施技术。


为加快不同规模与配置的系统开发进程,英伟达旗下的MGX模块化参考设计平台已全面支持这一系列新系统。


英伟达向世界展示了一个全新的未来图景,即加速计算正成为引领新一轮产业革命的核心力量。


人类首次通过仅3万亿美元的IT产业,创造出能够直接服务于100万亿美元产业的全方位技术解决方案。


此外,随着传统软件工厂向现代化AI工厂的转型,我们见证了从CPU到GPU、从信息检索到内容生成、从简单指令处理到大模型应用、从单一工具使用到多元技能融合的全面升级。


这一变革不仅推动了技术栈的深刻重塑,更预示着未来产业发展的无限可能与广阔前景。



建立350+加速库,算力将增长1000倍


为了充分发挥GPU加速计算的潜力,开发专业的加速库显得尤为重要。


英伟达团队已成功推出超过350个面向特定领域的加速库。


这些卓越的加速库囊括了业界闻名的深度学习加速库cuDNN、物理模拟库、5G无线电加速库Aerial、芯片制造加速平台Coolitho、基因测序加速库Pair of Bricks以及组合优化加速库Co OPT等。


它们被广泛应用于医疗健康、金融、计算机、汽车等多个行业领域,并深入覆盖至科学研究的前沿阵地,如量子计算机仿真系统Coup Quantum等。


值得一提的是,谷歌云端已率先部署了英伟达的数据处理加速库QDF,使得广受欢迎的数据科学库Pandas的性能得以数百倍的提升。


在展望未来时,黄仁勋公开披露了英伟达的长期战略规划蓝图。


公司已为未来八年做好了充分准备,预计届时算力将实现惊人的千倍增长。


为实现这一具有里程碑意义的宏伟目标,黄仁勋先生透露了英伟达即将启动的重大举措——即实施令牌(Token)计划。


展望未来,无论编写何种类型的代码,都需要将其转化为AI系统能够理解的令牌序列。


英伟达期望通过这一创新性的方式,构建出一个真正统一的AI编程模型,为未来的科技发展奠定坚实基础。



结尾:


业内人士普遍认为,科技巨头们致力于追求的核心目标,便是率先实现通用人工智能的突破。


尽管目前尚无法准确预测AGI的实现还需多久,但显而易见的是,在新一轮的创新周期中,AI将成为决定科技竞争格局的关键因素。


部分资料参考:机器之心:《全球最强GPU芯片已量产、下一代Rubin曝光》,AIForge:《突破摩尔定律!黄仁勋认为⌈人形机器人⌋时代已经开启!》,网易科技:《[皮衣刀客]黄仁勋超2万字演讲:要打破摩尔定律,官宣下一代GPU架构》,新智元:《粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题》,AI奇异点:《"一年一换"时代来临!英伟达AI芯片更新节奏将破"摩尔定律"》,元宇宙投融邦:《黄仁勋:打破摩尔定律,英伟达新产品即将发布,AI时代已来》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:

18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 65浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 98浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 167浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 41浏览
  • 在电子技术快速发展的今天,KLV15002光耦固态继电器以高性能和强可靠性完美解决行业需求。该光继电器旨在提供无与伦比的电气隔离和无缝切换,是现代系统的终极选择。无论是在电信、工业自动化还是测试环境中,KLV15002光耦合器固态继电器都完美融合了效率和耐用性,可满足当今苛刻的应用需求。为什么选择KLV15002光耦合器固态继电器?不妥协的电压隔离从本质上讲,KLV15002优先考虑安全性。输入到输出隔离达到3750Vrms(后缀为V的型号为5000Vrms),确保即使在高压情况下,敏感的低功耗
    克里雅半导体科技 2024-11-29 16:15 126浏览
  • 国产光耦合器正以其创新性和多样性引领行业发展。凭借强大的研发能力,国内制造商推出了适应汽车、电信等领域独特需求的专业化光耦合器,为各行业的技术进步提供了重要支持。本文将重点探讨国产光耦合器的技术创新与产品多样性,以及它们在推动产业升级中的重要作用。国产光耦合器创新的作用满足现代需求的创新模式新设计正在满足不断变化的市场需求。例如,高速光耦合器满足了电信和数据处理系统中快速信号传输的需求。同时,栅极驱动光耦合器支持电动汽车(EV)和工业电机驱动器等大功率应用中的精确高效控制。先进材料和设计将碳化硅
    克里雅半导体科技 2024-11-29 16:18 168浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 102浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 51浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 83浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 70浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 66浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 70浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 37浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 106浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦