PCIe如何紧随计算和网络步伐?

智能计算芯世界 2024-04-30 07:47

当系统架构师坐下来设计他们的下一个平台时,他们首先会查看 CPU、加速器、内存、闪存、网络接口卡以及 PCI-Express 控制器和交换机供应商提供的一系列路线图。在混合计算和内存类型的系统设计以及共享加速器和内存等组件的集群中,交换机变得越来越重要。


下载链接:
兆芯CPU+GPU技术路线解读
AI芯片、服务器、边缘域和Chiplet共舞(2023)
多领域(GPU CPU)散热材料工艺发展历史及路径演绎
AI围绕算力产业、国产化替代、复苏主线布局
CPU和GPU:异构计算的演进及发展
鸿蒙生态应用开发白皮书
2023年中国人工智能行业概览
70份GPU技术及白皮书汇总
新型GPU云桌面发展白皮书(2023)
GPU原理及在云桌面中的应用
兆芯CPU+GPU技术路线解读
大模型时代:智能设计的机遇和挑战(2023)
《AIGC行业深度报告系列合集》
《70+篇半导体行业“研究框架”合集》
400+份重磅ChatGPT专业报告(全网最全)
《人工智能AI大模型技术合集》
《56份GPU技术及白皮书汇总》
《FPGA五问五答系列合集》
《机器人行业报告合集(2023)》

OrionX GPU AI算力资源池化技术白皮书

华为盘古大模型3.0发布,重塑千行百业


问题在于:路线图并没有真正协调一致。大多数 CPU 和 GPU 制造商都试图每两年进行一次重大的计算引擎升级,并在重大发布之间的一年中进行架构和流程调整,以便他们每年都有新的东西可以销售。以太网和 InfiniBand 市场中的网络交换机和接口卡芯片制造商也往往以两年为周期,并且在英特尔至强 CPU 占据主导地位时,他们过去常常将自己的产品发布与英特尔至强 CPU 的发布节奏紧密联系在一起。但这种节奏已经被英特尔不断重新绘制的路线图、AMD 作为 CPU 供应商的重新崛起以及其他一些 Arm CPU 制造商(包括至少三个超大规模制造商和云构建商)所打破。


然后是 PCI-Express 总线,它在过去二十年里已经无处不在。虽然近年来 PCI-Express 规范以更可预测的方式发布,但 PCI-Express 控制器一直忠实于 PCI-Express 路线图,但 PCI-Express 交换机在 MicroChip 和 Broadcom 的产品发布方面远远落后。


我们认为所有这些路线图都需要更好地协调一致。具体来说,我们认为控制 PCI-Express 规范并通过与 IT 行业广泛而深入的合作来实现这一目标的 PCI-SIG 组织需要加快步伐,采用两年的节奏,而不是平均的节奏在过去的二十年里,它已经展示了三项。虽然我们正在考虑这个问题,但我们认为短节奏地跳跃到 PCI-Express 7.0 会更好地为行业服务,需要尽快推出 PCI-Express 7.0,以使 I/O 带宽和通道数更好地与高吞吐量计算引擎,我们预计将越来越多地使用 PCI-Express 总线来处理基于 CXL 的分层和共享主内存。


我们调整了 PCI-SIG 的带宽图表,该图表并未显示 PCI-Express 6.0 规范是在 2022 年发布的,而是在 2021 年发布的,这是不正确的。


别误会我们的意思。我们很感激 PCI-SIG 组织,这是数据中心和现在边缘的各类公司之间的合作,自很晚的 PCI-Express 4.0 规范发布以来,已经能够使 PCI-Express 总线处于可预测的路线图上。2017 年交付。一些严峻的信号和材料挑战使数据中心在 PCI-Express 3.0 上停滞了七年,我们认为当时主导 CPU 的英特尔在提升 I/O 方面有点拖沓,因为它被“Sandy Bridge”Xeon E5s 使用的芯片组中的 SATA 端口烧毁,该芯片组于 2012 年 3 月发布,比预期晚。从那时起,关于将 PCI-Express 4.0 和 PCI-Express 5.0 控制器集成到处理器中的困难的传言就很多了。


一般来说,PCI-Express 规范发布后,大约一年左右的时间我们就会看到控制器嵌入到计算引擎和网络接口芯片中。因此,当 PCI-Express 4.0 在 2017 年问世时,我们看到第一批使用它的系统在 2018 年问世,具体来说,是IBM 基于 Power9 的 Power Systems 机器,随后在 2019 年 8 月推出的 AMD“Rome”Epyc 7002 中使用了它。英特尔直到2021 年 4 月的“Ice Lake”一代才将 PCI-Express 4.0 控制器纳入其 Xeon SP 处理器中。


即使在 2019 年短暂两年后就达到了 PCI-Express 5.0 规范,但直到2021 年 IBM 在其高端 Power E1080 机器中推出了 Power10 处理器,它才在产品中可用。AMD 直到2022 年 11 月推出“Genoa”Epyc 9004才将 PCI-Express 5.0 集成到服务器芯片中,英特尔直到 2023 年 1 月推出“Sapphire Rapids”Xeon SP 才将 PCI-Express 5.0 集成到服务器芯片中。


因此,正如 CPU 上的控制器所表达的那样,PCI-Express 4.0 和 5.0产品之间实际上是三年的节奏,即使规范只迈出了两年的一步。


我们认为规格和产品需要以更短的两年周期进行,以便计算引擎和互连可以全部排列在一起。其中还包括 PCI-Express 交换机 ASIC,传统上这些 ASIC 远远落后于广泛使用的 3.0、4.0 和 5.0 代 PCI-Express 规格。


在任何一代中,PCI-Express 端口和 PCI-Express 交换机之间的滞后都是一个问题。这种延迟迫使系统架构师在可组合性(理想情况下在 Pod 级别使用 PCI-Express 交换机)或带宽(通过直接服务器插槽提供)之间进行选择。系统和集群的设计需要兼具可组合性和带宽——我们也会在组合中添加高基数。


目前,只有两家 PCI-Express 交换机制造商:Broadcom(通过多年前收购 PLX Technologies)和 MicroChip。早在 2021 年 2 月,我们就对 PCI-Express 5.0 级别的 MicroChip Switchtec ASIC 进行了分析,其通道从 28 扩展到 100 个,端口从 16 扩展到 52 个,但据我们所知,它们尚未批量发货。Broadcom早在 2022 年 2 月就推出了 PCI-Express 5.0 芯片组合,其中包括 ExpressFabric PEX 89100 交换机,该交换机拥有 24 至 144 个通道和 24 至 72 个端口。截至发稿时,我们正在确认这些产品是否正在发货,但尚未收到博通的回复。


我们的观点是,PCI-Express交换机必须同时可用,计算服务器、内存服务器和存储服务器都将使用支持任何给定级别 PCI-Express 的芯片来创建。事实上,在第一天。您必须能够在服务器中嵌入交换机,并且不会丢失带宽或端口或牺牲基数来获得带宽。因此,我们需要大量供应商,以防其中一个供应商出现失误。这就是我们最近试图鼓励 Rambus 进入 PCI-Express 交换机 ASIC 市场的原因之一。


正如 PCI-SIG 推出 PCI-Express 7.0 规范的 0.3 版本一样,所有这些都是首要考虑因素。

让我们看一下一年前 PCI-Express 6.0 规范完成、PCI-Express 7.0 即将出现时我们对 PCI-Express 路线图所做的预测:



PCI-Express 7.0 规范预计要到 2025 年才会获得批准,这意味着我们要到 2026 年末或 2027 年初才能看到它出现在系统中。我们认为这个等待时间太长了。我们需要 PCI-Express 7.0 来提供带宽加速器,以处理运行模拟或训练 AI 模型所需的大量数据。我们需要它与完全复杂的 CXL 4.0 共享内存和池化内存规范相匹配。


我们知道,加速 PCI-Express 7.0 控制器和交换机的上市是很困难的,所有类型的产品也都必须加速。计算引擎和外围设备制造商都会犹豫是否要从 PCI-Express 6.0 产品周期中挤出尽可能多的投资。


尽管如此,随着 PCI-Express 6.0 投入产品并经过严格的测试(由于它使用了新的 PAM-4 信号和 FLIT 低延迟编码,因此需要进行严格的测试),我们认为该行业应该开始加速并尽可能与 CPU 和 GPU 路线图相匹配,并按照两年的节奏进行。


让各个组成部分保持平衡,然后同时共同前进。

来源:半导体行业观察

原文链接:

https://www.nextplatform.com/2023/07/07/pci-express-must-match-the-cadence-of-compute-engines-and-networks/


下载链接:
《硬件技术一致性设计及测试汇总(1)》
1、PCI Express一致性测试方法 
2、5G IC高速接口设计与测试挑战 
3、MIPI D-PHY一致性测试方法 
4、MIPI C-PHY一致性测试方法 
5、HDMI 1.4_2.0物理层一致性测试方法
《硬件技术一致性设计及测试汇总(2)》
7、DDR一致性测试方法 
8、DDR技术演进与测量挑战 
9、SATA一致性测试原理与方法 
10、USB2.0/USB3.1一致性测试方法 
11、高速数字接口测量的去嵌入和均衡软件使用方法
《PCI Express PCI 测试及挑战》
1、PCI Express 3.0 and 4.0测试挑战 
2、PCI Express一致性测试方法
《USB一致性测试及方法汇总》
1、USB 2.0一致性测试方法 
2、USB2.0/USB3.1一致性测试方法 
3、USB 3.1 Gen2 10G -Gen1 5G Receiver测试
《全面了解芯技术:如何测试一颗芯片》
《IC-MEMS分析测试技术》
《IC设计制造流程培训》
《3D-IC设计的挑战和需求》
《集成电路测试及测试系统介绍》
《集成电路及芯片知识汇总(2)》
9、芯片和芯片设计——集成电路设计科普 
10、集成电路EDA设计概述 
11、超大规模集成电路设计 
12、常用半导体器件讲解 
13、半导体制程简介 
14、SOC芯片设计 
15、ASIC芯片设计生产流程 
16、CAN总线详细讲解
《集成电路及芯片知识汇总(1)》
1、集成电路技术简介 
2、芯片设计实现介绍 
3、集成电路芯片设计 
4、芯片规划与设计 
5、数字IC芯片设计 
6、集成电路设计的现状与未来 
7、集成电路基础知识 
8、集成电路版图设计

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 15浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 320浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 470浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 309浏览
  •  一、‌核心降温原理‌1、‌液氮媒介作用‌液氮恒温器以液氮(沸点约77K/-196℃)为降温媒介,通过液氮蒸发吸收热量的特性实现快速降温。液氮在内部腔体蒸发时形成气-液界面,利用毛细管路将冷媒导入蒸发器,强化热交换效率。2、‌稳态气泡控温‌采用‌稳态气泡原理‌:调节锥形气塞与冷指间隙,控制气-液界面成核沸腾条件,使漏热稳定在设定值。通过控温仪调整加热功率,补偿漏热并维持温度平衡,实现80K-600K范围的快速变温。二、‌温度控制机制‌1、‌动态平衡调节‌控温仪内置模糊控制系统,通过温度
    锦正茂科技 2025-04-30 11:31 60浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 132浏览
  • 在全球制造业加速向数字化、智能化转型的浪潮中,健达智能作为固态照明市场的引领者和智能电子以及声学产品的创新先锋,健达智能敏锐捕捉到行业发展的新机遇与新挑战,传统制造模式已难以满足客户对品质追溯、定制化生产和全球化布局的需求。在此背景下, 健达智能科技股份有限公司(以下简称:健达智能)与盘古信息达成合作,正式启动IMS数字化智能制造工厂项目,标志着健达智能数字化转型升级迈入新阶段。此次项目旨在通过部署盘古信息IMS系统,助力健达实现生产全流程的智能化管控,打造照明行业数字化标杆。行业趋势与企业挑战
    盘古信息IMS 2025-04-30 10:13 66浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 345浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 574浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 14浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 19浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 305浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 140浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 164浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦