智算网络的核心指标要求

智能计算芯世界 2025-01-31 09:49

本文来自“智算网络技术与产业白皮书(2024)”,近年来,全球对智能算力的需求急剧增长,推动智算服务进入新一轮爆发期。据统计,2022 年全球智能算力规模已达 142 EFLOPS,并预计 2030 年将达到 16 ZFLOPS,年均增速超 80%,这种增速奠定了智能算力将成为全球算力规模增长主要驱动力的地位。
下载链接:
2025年AIGC数据存储技术研究报告
芯片行业:浅析中美芯片博弈的危与机
智算网络技术与产业白皮书(2024)
浙江图灵算力研究院:RISC-V芯片产业发展报告(2024)
一云多芯算力调度研究报告
2025年AI产业发展十大趋势报告
2024人工智能产业十大关键词
AI行业洞察:推动应用创新的九大AI趋势

2025年计算机策略报告:披荆斩棘,硕果累累

重磅报告:2024-2026年中国信创硬件产业发展建议报告
《AI服务器技术白皮书合集》
1、2024先进液冷AI一体机报告 2、2024AI网络光交换机技术报告 3、2024边缘计算AI推理技术场景与挑战 4、2024年AI数据中心网络建网参考报告
重磅合集
1、《70+篇半导体行业“研究框架”合集》
2、《55+份智能网卡和DPU合集》
3、《14份半导体“AI的iPhone时刻”系列合集》
4、《21份走进“芯”时代系列深度报告合集》
5、《800+份重磅ChatGPT专业报告
6、《92份GPU技术及白皮书汇总》
7、《11+份AI的裂变时刻系列报告》

8、《3+份技术系列基础知识详解(星球版)》

亚太芯谷科技研究院:2024年AI大算力芯片技术发展与产业趋势

【华为】AI Ready的数据基础设施参考架构白皮书

智源研究院:2025年十大AI技术趋势

36氪研究院:年轻人2024“有问题就问”AI助手报告

SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)
《42篇半导体行业深度报告&图谱(合集)》
亿欧智库:2025年六大未来产业发展趋势与人工智能八大落地场景洞察
微软AI行业洞察:推动应用创新的九大AI趋势

AI图景解码50关键词:快思考与慢思考

1、AI 模型参数规模将超百万亿,超长序列成为主流标配。2024 AI 行业的发展趋势来看,大模型 Scaling Law 依然保持旺盛生命力,万亿甚至百万亿参数规模的大模型成为必然趋势。Sora为例,视频生成场景需要使用长达百万长度的序列,例如 60 秒的视频需要1M的序列长度、10 分钟视频则需要 10M 序列长度,这标志着序列长度将成为衡量模型能力的重要指标。

2、以太推动智算网络开放互联,百万卡集群成为共识。在产业界共同努力下,智算网络呈现出两方面的演进趋势:一是以太将成为智算网络开放互联的基础,二是百万卡集群规模成为行业共识。

3、融合将成为智算网络演进的主路径。从宏观技术发展趋势来看,“融合”将成为智算网络演进的关键驱动。传统的总线技术(如PCIeNVlink)和网络技术(如EthernetInfiniband)之间的界限将变得更为模糊,总线网络化和网络总线化的趋势将同步进行。

其次,电互联和光互联的技术融合将推动智算网络在架构和成本方面的革新。若按当前算力芯片的发展速度来看,IO 密度与功耗将成为难以突破的瓶颈。

4、新型大容量网络芯片将成为智算网络发展的基石。随着智算业务对高速互联需求的持续攀升,新型大容量网络芯片正处于高速发展阶段,呈现如下趋势:

容量持续增长,单比特功耗不断降低。AI 驱动下,未来网络芯片预计将迅速突破100T容量,单比特功耗将进一步降低。同时,400G/800G DPU 网卡需求也将迎来井喷。

面向 AI 场景优化将成为网络芯片发展的基本要求。业务场景融合正成为新型网络芯片的发展方向。

(一)网络带宽要求

网络带宽是 AI 大规模训练中的一个关键要素。为保证训练效率,网络高带宽对存储设备、计算节点和内存之间的快速数据传输至关重要。尤其是在分布式训练场景下,多个计算节点之间需频繁交换大量中间结果与梯度信息,若带宽不足则将产生数据传输瓶颈,进而影响训练速度。

目前,主流 AI 训练平台通常采用高带宽的网络连接,如10Gbps40Gbps 甚至更高的带宽,以满足大规模数据传输需求。

(二)网络时延要求

低时延是支撑 AI 大模型分布式训练的关键要素。分布式训练要求在多个计算节点之间频繁交换数据,若网络时延过高,则将导致数据传输速度减慢,进而影响整体训练效率。特别是在同步训练模式下,所有计算节点必须等待最慢节点的数据传输完成,才能进行下一轮计算。因此,网络时延的增加将直接导致训练时间的延长。

低时延对于 AI 推理同样重要。推理过程通常要求快速响应用户请求,并在短时间内返回结果。

(三)网络抖动要求

通算与智算在流量特征方面存在显著区别。通算中心的特征是流数量多(通常超过 10W),但以小流为主,通信模式通常为点对点。

相比之下,智算中心的特征为流数量少(通常低于 10K),但以周期性突发的大流为主,通常采用集合通信的模式,且流间存在同步效应。

(四)网络丢包要求

网络丢包在 AI 大规模训练中是一项极其重要的问题。分布式训练要在不同计算节点间频繁交换数据,若发生丢包则将导致数据传输失败,进而影响模型训练的准确性。

尤其在同步训练模式下,任一节点的数据丢失都可能导致整个训练过程的中断,严重拖累训练进度。

综上所述,智算网络的发展与应用亟需高带宽、低时延/抖动、轻丢包的网络支持,并通过不断创新与发展智算集群内与智算集群建的网络互联技术,为 AI 技术的研究与应用提供强有力的支撑。
下载链接:
半导体行业系列专题:晶圆代工,特色工艺蓬勃发展,自主可控成果显著
AI的裂变时刻”系列报告合集(2)
AI的裂变时刻”系列报告合集(1)
人工智能行业AI硬件全景洞察报告:下一波AI创新机遇在物理空间(2024)
中国移动:智能体通信网络(ACN)白皮书
豆包出圈:解析字节的AI终端布局
AI基础设施篇:AI新视觉,从算力之争到能源之争
中国计算机和软件:模型即服务(MaaS)
智算产业趋势展望:数据智能时代到来(2024)
《2024年生成式AI大会(实践篇)》
《2024年生成式AI大会(RAG生成检索篇)》
伽马数据:人工智能行业研究报告(2024.10)
2024新技术前瞻专题系列合集
SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)
《42篇半导体行业深度报告&图谱(合集)》
亿欧智库:2025年六大未来产业发展趋势与人工智能八大落地场景洞察
微软AI行业洞察:推动应用创新的九大AI趋势
AI图景解码50关键词:快思考与慢思考
数据中心智算化升级改造白皮书(2024)

2025新技术前瞻专题系列合集

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  •         在当今高度集成化和智能化的电子行业中,静电放电(ESD)和闩锁效应(Latch-Up,以下简称LU)是两大核心挑战。它们不仅可能导致芯片性能下降,甚至会造成永久性损坏,严重影响产品的可靠性和用户体验。因此,开展全面而有效的ESD测试和LU测试,对于电子行业而言至关重要。       ES612A型静电放电测试仪是一款专为评估晶圆级和封装级器件而设计的测试仪。该测试仪旨在满
    ESDEMC静电放电电磁兼容 2025-02-24 15:06 44浏览
  • 在职场中,高效的管理方法不仅能提升个人工作效率,还能推动团队目标的实现。然而,面对众多管理工具和方法,如何选择最适合自己的方式,往往让人感到困惑。今天我们来问问Deepseek R1作出深度思考,看看它给我们什么看法。问问Deepseek:管理方法中,哪一种最值得职场人士学习?虽然管理方法有很多,但不是每一个都适合所有职场人士,而且也有些管理方法需要一定的学习曲线,相比之下,Deepseek最后推荐了OKR作为职场人士最应学习的管理方法。1. 为什么选择 OKR?清晰聚焦目标:OKR(Objec
    优思学院 2025-02-21 18:33 284浏览
  • 一、引言:MCU的跨界赋能与普冉技术定位      在万物互联的时代浪潮下,嵌入式微控制器(MCU)正从传统工业控制领域向消费电子市场快速渗透。智能手表、电动玩具、厨房电器等设备的“智能化”升级,离不开高性能、低功耗、高集成度的MCU支持。普冉半导体凭借其基于ARM Cortex-M0+内核的MCU产品线,通过工艺创新与场景化设计,在消费电子领域开辟了一条独特的国产替代路径。 普冉Cortex-M0+ MCU的核心竞争力在于:以32位处理器的性能实现8位处理器的成本
    中科领创 2025-02-22 17:12 70浏览
  • 引言:智能家居设备的“双刃剑”——功能升级与续航/设计挑战 随着智能家居设备功能日益复杂化,用户对续航时间、设备体积和成本的要求也愈发严苛。以智能门锁为例,集成指纹识别、蓝牙连接、远程报警等功能已成为市场标配,但电池续航却难以突破1年大关;温控器需要24小时待机并实时监测环境数据,如何在低功耗与高性能间平衡成为行业难题。普冉MCU凭借低功耗硬件架构与高集成设计,直击这一矛盾,为智能家居设备提供“鱼与熊掌兼得”的解决方案。本文将以智能门锁与温控器为锚点,拆解普冉MCU如何破解续航焦虑与设计瓶颈。第
    中科领创 2025-02-22 17:21 45浏览
  • ​​在这个万物互联的时代,无线通信技术已经成为嵌入式系统中不可或缺的一部分。其中,Wi-Fi模块作为连接设备与网络的重要桥梁,其性能与兼容性显得尤为关键。Intel的AX210NGW Wi-Fi 6E模块作为一款高性能的无线网络适配器,不仅支持最新的Wi-Fi 6E标准和蓝牙5.3,还具备出色的传输速度和兼容性,为嵌入式系统的无线连接提供了强有力的支持。AX210NGW Wi-Fi 6E模块 为了更好地满足客户对高性能嵌入式主控的应用需求,本文将详细介绍在飞凌嵌入式OK3576-C开发
    飞凌嵌入式 2025-02-22 14:44 108浏览
  • 在电磁兼容(EMC)领域,解决干扰问题的核心在于围绕EMC三要素——干扰源、耦合路径、敏感设备——进行系统性分析与设计。以下从三要素出发,结合具体案例与策略,探讨如何实现电磁兼容性优化。时源芯微   专业EMC解决方案提供商  为EMC创造可能一、EMC三要素的理论框架根据电磁兼容理论,任何EMC问题的产生必须同时满足三个条件:干扰源的存在、耦合路径的传导或辐射、敏感设备受到干扰29。因此,解决EMC问题的核心策略是:抑制干扰源:降低干扰源的强度或频率;阻断耦合路径
    时源芯微 2025-02-24 14:34 76浏览
  • 第六回 闪电门奇袭显威 混合阵诡变惊四方诗曰:显存如渊锁蛟龙,分块重算破九重。参数浩荡终有尽,巧夺天工方为雄。却说斯坦福闪电门主Tri Dao,率弟子苦修《FlashAttention》心法。这日闻得谷歌Transformer大军压境,冷笑道:"彼辈空有千亿参数,岂知算力调度之妙?" 遂布下"分块爆破阵",将注意力矩阵斩作碎玉残片。但见:显存读写如电闪,长文吞吐似龙吟。百万token过眼处,不滞片叶惊鬼神。谷歌先锋BERT连退三十里,折损三成算力。闪电门自此威震江湖,得号"显存刺客"。第七回 法
    Leagowang 2025-02-22 22:13 61浏览
  • 第一回 谷歌布阵出奇谋 Transformer横空定乾坤诗曰:滚滚代码东逝水,浪花淘尽英雄。循环卷积转头空,参数依旧在,几度夕阳红。白发学者芯片上,惯看秋月春风。一壶咖啡喜相逢,AI多少事,都付笑谈中。话说天下大势,分久必合,合久必分。自辛格顿老仙以反向传播算法一统江湖,深度学习门派分立。有循环门(RNN)仗着时序秘法盘踞文本疆域,卷积派(CNN)凭空间绝技割据图像河山。两派相争数十年,虽各有胜负,却难破"长程遗忘""梯度消散"之困局。忽一日,谷歌祭出绝世秘籍《Attention Is All
    Leagowang 2025-02-22 21:44 75浏览
  • 最近DeepSeek非常热门,市场热度甚至超过2023年的GPT,因为它由中国研发,不受互联网“墙”的限制就能使用。国内多数普通人应该都听说过GPT,但有不少人可能还没用过。上周参与一个在线话题活动,参加的多是科技类公司的产品经理,主题是“机器人+AI”用于老龄化产品的可行性。我在活动上提了些我的观点,我认为当前的AI技术虽然看起来聪明,但要应用于适老化机器人,会有挺大风险。后来被主持人调侃为“思想有待进步”。其实我也知道,AI和机器人在非常热门的宣传阶段,你要“胆敢”说技术还不成熟、有风险,就
    牛言喵语 2025-02-23 22:32 112浏览
  • 材料的电学性能主要包括导电性、介电性、压电性和热电性等,这些性能决定了材料在电场或温度变化时的行为和响应。材料的电学性能是描述其在电场作用下的各种物理现象的重要参数。以下是一些主要的电学性能:一、导电性导电性是衡量材料传导电流能力的物理量。金属是最常见的导电材料,其内部自由电子可以在电场作用下自由移动,从而形成电流。除了金属,某些离子液体和电解质也具有良好的导电性。导电性在电线、电路板和电极材料的选择中至关重要。二、介电性介电性描述的是材料在电场中的极化能力和储存电荷的能力。介电材料在电场中会发
    锦正茂科技 2025-02-24 11:35 59浏览
  • 1.keil SWD 烧录无法识别拿到开发板遇到得问题就是Keil无法烧录固件(跳线帽已经接到PB10 PB11), SWD 无法识别;这个无法烧录得原因是出厂demo里面的PB10 PB11被用做其他功能了。2.使用串口进行烧录将J9上得PB5与RX使用跳线帽连接,将PB4与TX使用跳线帽连接 打开烧录软件,如图选择待烧录固件复位开发板就可以自动进行烧录。3.烧录USB CDC 进行测试固件烧录成功后 DAP 烧录可以正常识别了;但是现在还无法直接使用keil进行烧录,因为没选择烧录算法,烧录
    neebourne 2025-02-23 21:02 80浏览
  • 收到富芮坤开发板已经有很久了,今天与大家分享基于REPL MicroPython实现本地音乐播放。什么是REPL?其实REPL是Read-Eval-Print Loop 的缩写,中文可以理解为“读取-求值-输出循环”。它是一种交互式编程环境,允许用户输入代码并立即看到执行结果。REPL 是许多编程语言(如 Python、JavaScript 等)的常见特性。在 MicroPython 中,REPL 是一个非常重要的工具,它允许开发者通过串口与 MicroPython 设备(如 ESP32、ESP
    逗徐坤 2025-02-23 22:23 72浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦