为什么AI芯片需要PCIe7.0IP互连?

智能计算芯世界 2024-12-20 08:06

随着AI工作量及需求不断增加,尤其是参数数量每四到六个月翻一番(比摩尔定律快4倍),数据中心技术需要不断演进。当前的AI模型拥有万亿级参数,正将现有基础设施推向极限。因此,需要更大的容量、更多的资源和更快的互连。


下载地址:
2024年中国智算云生态影响力矩阵报告
《2024年AI技术前瞻专题合集》
1、科技前瞻专题:AI ASIC算力芯片的下一篇章(2024) 2、科技前瞻专题:AI硬件,端侧AI大幕拉开,引领新一轮终端创新周期 3、科技前瞻专题:国际巨头的端侧AI布局(2024)
《2024量子科技专题系列报告合集》
1、量子科技专题系列二:里程碑式突破_谷歌发布Willow芯片 2、量子科技专题系列一:逐梦量子,星辰大海
《2024数据智峰会:大模型篇》
《AI数据中心(AIDC)建设白皮书合集》
1、超云AIDC基础设施建设白皮书(2024)
2、华为AIDC白皮书(2024)
《2024中国算力大会技术合集》
中国算力大会:中国算力发展报告(2024年) 中国算力大会:中国存力发展报告(2024年)
特斯拉、OpenAI、英伟达和华为人形机器人生态简析
2024年半导体+算力+通信+数据中心产业链全景
自动驾驶软硬一体演进趋势研究报告

英伟达人工智能行业发展战略研究报告

SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)

800+份重磅ChatGPT专业报告

根据Synergy Research Group的数据,为满足生成式 AI 的需求,未来六年,全球超大规模数据中心的容量将增加一倍以上。为跟上这一日益增长的需求,数据中心生态系统依赖PCIe、CXL、HBM等标准来为整个系统提供传输数据所需的性能、容量、带宽和低延迟的框架。


要想成功设计数据中心芯片,快速高效的互连和接口至关重要。设计人员需要实现更快的性能和零延迟、传输大量数据的能力,以及访问高级接口 IP。


为了满足这些要求,数据中心互连需要支持 PCIe 7.0。尽管该标准尚未获得正式批准,但鉴于如今芯片的生产周期长达一年以上,现在将支持PCIe 7.0的IP纳入芯片路线图中至关重要。下图强调了 PCIe 7.0 对于互连提供商的重要性,以及它如何能够为AI/ML架构中的每个互连提供动力。


PCIe 7.0 提供连接多个加速器所需的带宽和加载存储功能,使它们能够有效地处理大型、复杂的 AI 模型。


性能的下一次飞跃


PCIe 7.0 有望提供超大规模数据中心互连扩展所需的带宽。通过提供高达 512 GB/s 带宽的快速安全数据传输,PCIe 7.0基本上确保了数据中心带宽的未来适用性,以缓解数据瓶颈问题。


在接口 IP 的支持下,处理器、加速器、交换机等上的高速接口可以在CPU和加速器之间以及整个计算架构(包括重定时器、存储器、交换机、网络接口卡等)中移动数据。与 PCIe 6.0 相比,PCIe 7.0 增加了支持的通道数量,并将带宽翻倍。凭借更高的信号速率,PCIe 7.0 还降低了延迟,这对于 AI 算法中的实时处理和响应能力以及高性能计算中的高速数据处理至关重要。当然,PCIe 7.0 还保持了与前几代 PCIe 的向后兼容性,确保与现有硬件的互操作性,同时为未来的升级提供可扩展性。表1重点介绍了PCIe各代之间的变化。


表 1. PCIe 版本数据速率比较


保持关键的互操作性


互操作性(以及 PCIe 等成熟标准)的优点在于,它使不同生态系统中的一系列供应商能够协作,确保各自的组件/系统能够可靠地运行。在设计高速芯片时,确保长期无缝运行至关重要。当所有部件都可互操作时,就不必担心过多的停机时间或其他性能问题。


在设计系统之前,甚至在选择任何 IP 之前,设计人员都应该经过全面的评估。对于 PCIe而言,有许多规格、通道、介质、外形尺寸和范围等因素都需要考虑。例如,这些设计通常需要很多高速通道。多个 PCIe 通道同时切换会消耗大量电力,因此电源完整性是一个问题。如果同时切换过程中出现IR压降等问题,将抑制性能的充分发挥。信号完整性分析也很重要,因为系统中 AI 加速器和 CPU 之间传输的信号必须完整无缺。这反过来要求工程师具备电源和信号完整性的专业知识,以理解如何实现最佳性能。


PCIe 的高速数字信号需要进行严格的信号完整性分析,才能在首次流片时获得通过。


为什么现在需要 PCIe 7.0?


未来的 AI 集群必须能够同时部署加速器、交换机、网卡等,以实现数据密集型操作并缓解数据瓶颈。在标准批准之前尽早获得支持 PCIe 7.0 的 IP 对于公司来说至关重要,这样他们才能尽早开始下一代 HPC 和 AI 芯片设计,并确信当这些芯片部署时,将能够提供全球最快芯片所需的带宽和性能。


原文链接:

https://www.5gtechnologyworld.com/why-ai-chips-need-pcie-7-0-ip-interconnects/

来源:SDNLAB


下载地址:

SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)
《异构计算芯片(ASIC/FPGA等)技术合集(1)》
《异构计算芯片(ASIC/FPGA等)技术合集(2)》
《CXL技术合集(2022)(1)》
《CXL技术合集(2022)(2)》 
《2024 OCP全球峰会合集(Chiplets篇)》
《2024 OCP全球峰会合集(Server篇)》
《2024 OCP全球峰会合集(Security篇)》
《2024 OCP全球峰会合集(Composable Memory Systems篇)》
《2024 OCP全球峰会合集(HPC/NIC/OAI篇)》
《2024 OCP全球峰会合集(MHS篇)》
2024车载SoC芯片产业分析报告
中国智能汽车车载计算芯片产业报告
中国车规级芯片产业白皮书
计算机行业深度:从技术路径,纵观国产大模型逆袭之路
《AI算力“卖水人”系列报告合集》
1、AI算力卖水人系列(1):2024年互联网AI开支持续提升 2、AI算力卖水人系列(2):芯片散热从风冷到液冷,AI驱动产业革新
《沙利文:2024人工智能芯片报告合集》1、2024年中国大模型评测报告 2、2024年中国生成式AI行业最佳应用实践 3、2024年中国智能学习机行业白皮书 4、2024年中国AI代码生成市场报告 5、全球半导体制造类EDA行业白皮书 6、2024年全球AI生态全景概览 7、2024年中国行业大模型市场报告 8、2023年科创板问询回复专题——半导体行业
算力网络技术研究(2024)
全球软件开发大会:大模型在华为云数字化运维的全面探索和实践

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。



智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • “新时代,共享未来”2024年11月5日-10日,第七届中国国际进口博览会在上海圆满落幕。其中,3万平方米的汽车展区展览面积,也让观众笑谈进博会再次进入“车展”时间。全球15大整车品牌,40多家企业参展,其中不乏耳熟能详,七届进博会“全勤生”的国际知名OEM,也会有首次参加的“新面孔”,它们共同构成了今年汽车展区的“全家福”。近年来,中国汽车进口均超百万辆。因此,对跨国车企来说,中国市场的重要性不言而喻。同时,在电动化和智能化赛道中弯道超车的中国汽车市场,也是全球汽车行业竞争最为激烈的市场,在这
    艾迈斯欧司朗 2024-12-30 17:05 59浏览
  • 产品概述MG600Q2YMS3 是一款基于硅基碳化物(SiC)技术的高功率N沟道MOSFET模块,适用于高功率开关和电机控制应用,如轨道牵引系统。其设计旨在满足高效能和快速切换需求,为工业和能源领域提供可靠解决方案。主要特性1. 高电压和电流能力   耐压 (VDSS):1200 V   漏极电流 (ID):600 A2. 高效率与低损耗   碳化硅材料降低导通损耗和开关损耗,实现更高的转换效率。3. 快速切换性能 支持高频操作,适用于
    东芝铠侠代理 2024-12-31 10:33 77浏览
  •         在之前的文章中,我们介绍了IEEE 802.3cz[1]协议,MultiGABSE-AU物理层中XMII、PCS子层以及两个可选功能的相关内容,本篇将介绍MultiGABSE-AU物理层PMA子层及PMD子层的相关机制。PMA子层        PMA子层位于PCS子层和PMD子层之间,规范中定义了PMA子层的三个功能:PMA Transmit、PMA Receive及PHY Control。&nbs
    经纬恒润 2024-12-30 18:16 105浏览
  • 感光百科:4000万片出货量背后的“技术经”目前,仅单点dToF,艾迈斯欧司朗的累积出货量就已超过了4000万片。大量采用的背后必然代表无数用户对这一技术的认可和信赖。究竟是什么魔力,让dToF传感器拥有如此强大的吸引力?又是怎样的know-how积累让艾迈斯欧司朗的dToF产品如此受到青睐?让我们再次回到底层原理来探究dToF 4000万片出货量背后的“技术经”。01、底层原理决定应用上限dToF传感器,顾名思义,直接飞行时间测量,基于光速不变,测量光子从发射端到接收端的光程差,从而直接计算二
    艾迈斯欧司朗 2024-12-30 18:21 94浏览
  • 近日,紫光展锐正式推出高性能4G 智能穿戴平台W377E。该产品面向不同的应用场景,拥有丰富特性和超低功耗,进一步壮大紫光展锐的智能穿戴产品组合。紫光展锐面向中高端和海量的智能穿戴市场,持续提供技术先进、高效安全、高质可靠的解决方案。 紫光展锐W377E采用四核A53架构,支持13M摄像头,video 1080P 30fps,集成了Wi-Fi、蓝牙和GPS功能。W377E搭载Android 8.1系统,提供更加丰富多样的APP体验,支持在线好友聊天、支付宝等功能,且支持64位系统的AP
    紫光展锐 2024-12-31 16:26 122浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,于2024年6月26-28日携汽车智能照明和智能座舱解决方案及相关产品和技术,亮相位于昆山市花桥国际博览中心的第十九届汽车灯具产业发展技术论坛暨上海国际汽车灯具展览会(以下简称:ALE),展示艾迈斯欧司朗优质的光发射器、光学元件、微型模组、传感器等产品在汽车领域的创新应用,展位号B馆T202。乘着车灯产业盛会的东风,全国汽车标准化技术委员会灯具及灯光分技术委员会秘书长卜伟理, 蔚来汽车内外车灯团队专家及电气工程副
    艾迈斯欧司朗 2024-12-30 16:55 69浏览
  • 先临三维普及化手持3D扫描仪Einstar搭载艾迈斯欧司朗SFH 4726AS红外LED,打造真彩扫描、人眼安全、超高性价比的照明解决方案;得益于双堆叠发射器技术和透明硅树脂封装,OSLON® Black系列的SFH 4726AS实现小尺寸、高功率、高效率和优化的热管理,有效减小散热设计的压力;采用3.75×3.75mm的透明硅树脂封装,内置1mm2堆叠红外芯片,单颗光功率可达2W以上,为手持扫描仪这样小巧空间的应用提供更多光源设计空间。全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股
    艾迈斯欧司朗 2024-12-30 16:50 61浏览
  • 高精度,抗干扰,设计灵活……一句话总结:打铁还需自身硬!2040年,人形机器人的数量或将超过人类,达到100亿个。 10月29日,沙特投资倡议论坛,在谈及AI和人形机器人赛道时,马斯克再一次大胆预测,描绘出上述令人震撼的未来景象,且预估每台机器人的价格将稳定在2万-2.5万美元之间。当下,技术飞速发展,众多机器人公司如雨后春笋般涌现。余建华,艾迈斯欧司朗资深应用工程师,深感对这个市场的期待,他表示每一个机器人关节的背后,都离不开位置传感器的精准掌控。这片市场的潜力,让人憧憬不已。在工业及消费中
    艾迈斯欧司朗 2024-12-30 17:25 55浏览
  • 本文介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看DDR获取内存信息下面数字以MB为单位。root@ido:/# free -mtotalused free shared buff/cache availableMem:
    Industio_触觉智能 2024-12-31 10:01 72浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球CAN-Bus总线电缆产值达到2287百万美元,2024-2030年期间年复合增长率CAGR为3.6%。一、行业概述CAN-Bus总线电缆是一种专门用于CAN总线(Controller Area Network,控制器局域网络)通信系统中的电缆。CAN总线是一种广泛应用于汽车、工业自动化、机器人等领域的串行通信协议,主要用于微控制器和设备之间的数据交换。CAN-Bus电缆负责在多个设备间传输数据,保证信息的稳定传输和
    GIRtina 2024-12-31 11:00 103浏览
  • 时源芯微EMC(电磁兼容)领域,充斥着众多专业术语,令人眼花缭乱。1 电磁兼容(EMC)定义:指电气装置或系统在共同的电磁环境条件下,既能保持正常功能,又不会对周围环境产生不良影响。2  电磁环境Electromagnetic Environment定义:指存在于某一特定场所的所有电磁现象的总和。3半电波暗室Semi-anechoic Chamber定义:一种屏蔽室,除地面安装反射接地平板外,其余内表面均覆盖有吸波材料。4 远场Far Field定义:在天线辐射的场域中,功率密度与距离
    时源芯微 2024-12-31 10:52 112浏览
  • 在当今数字化时代,嵌入式系统无处不在,从我们手中的智能手机、智能手表,到汽车中的电子控制系统、工业自动化设备,嵌入式开发技术的发展历程宛如一部波澜壮阔的科技史诗,深刻地改变了我们的生活和社会的运作方式。萌芽阶段(20 世纪 60 - 70 年代)嵌入式开发的起源可以追溯到 20 世纪 60 年代。当时,计算机技术刚刚兴起,体积庞大且价格昂贵。为了满足特定设备的控制需求,工程师们开始尝试将计算机技术应用于一些专用系统中。这一时期,嵌入式系统的概念逐渐萌芽。1965 年,美国数字设备公司(DEC)推
    Jeffreyzhang123 2024-12-31 10:08 129浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦