智算中心需要怎样的网络架构技术?

原创 TechSugar 2024-10-15 08:01


人工智能技术以及大语言模型(LLM)应用的普及,对于算力的需求激增,也推动了各国对于数据中心的建设。其中,作为数据中心的一种,智算中心由于其具有的强大数据处理能力和智能计算能力,正成为最受关注的数字基础设施。


什么是智算中心?


那什么是智算中心呢?根据工信部印发的《算力基础设施高质量发展行动计划》,智算中心是指通过使用大规模异构算力资源,包括通用算力(CPU)和智能算力(GPU、FPGA、ASIC等),主要为人工智能应用(如人工智能深度学习模型开发、模型训练和模型推理等场景)提供所需算力、数据和算法的设施。


康普企业网络大中华区技术总监吴健则认为,从国际角度来讲,智算中心(即所谓的AI DC)还没有一个专门的定义。在中国市场则被定义为一个新的品类,它是数据中心的一类,即在数据中心中为了完成大模型的训练和推理,部署了GPU的服务器,这样的数据中心就称之为智算中心。而且,数据中心中GPU服务器的占比将越来越高,在2027-2028年前后,GPU服务器数量将超过CPU服务器的数量。


据悉,目前已经建成或正在建的智算中心普遍拥有约100PFLOPS左右的智能计算能力,可为各类应用场景提供强大的支持。据IDC的不完全统计,到2024年5月下旬,我国共建设了283座智算中心,其中超过一半处于开工/在建状态,已投产/运营的达到89座,占比31.45%。


智算中心三要素及网络互连技术


算力、网络和数据是完成智算的三个要素。其中,数据是智算需要处理的对象;算力是指处理计算的芯片(如CPU和GPU等)的能力。CPU和GPU它们处理数据的方式是不同的,CPU一次只能处理一个复杂的任务,而GPU则采用并行计算,一次可以处理多个简单的任务。如上所述,在智算中心中,GPU的数量大幅增长,而其采用的并行计算方式,也大幅提高了算力。算力提高了,也就需要配套的传输网络与之相匹配。


吴健表示:“GPU算力每年翻两倍,10年就要翻1000倍。那也就预示着,网络也应该10年翻1000倍才能与之相匹配。所以,目前的网路已经滞后于算力。智算中心随着GPU的应用,它需要一个高可靠、高带宽、低延时的无损网络。”


所以,随着智算的快速推进,400G以上网络的占比将占主导地位,包括400G、800G和1.6T。


目前,智算中心采用的网络互连技术主要为InfiniBand(IB)和以太网。吴健表示:“AI需要IB和以太网两种网路设备来支撑。目前,这两种技术的速率发展较为同步,都会快速进入到800G、1.6T。但IB在整个智算中的效率、稳定性要比以太网好一些。”


从物理层而言,IB和以太网是一样的,但IB和以太网使用的交换机则是不同的。很多人认为,以太网可能无法跟上IB的演进速度,因为IB是一个无损网络,而以太网则不是一个专用网络,很难做到无损。吴健表示:“目前,从协议层和硬件层面进行一些技术的优化,以太网也可以做到无损了。”


所以,未来,吴健认为,至少在中国市场,以太网取代IB是势在必行的。


智算中心组网


智算中心的组网主要分为前端网络和后端网络。前端网络是指智算中心和外部的互连,即将智算中心计算的结果通过前端网络传输出去;而后端网络则是指GPU之间的互连。


与传统网络相比,智算中心的前端网络没有多大变化,但后端网络变得特别的庞大,涉及AI集群内的互连以及AI集群间的互连。智算中心中的网络需要高带宽、低损耗、低延时以及高密度的连接,可以未来还将需要更小尺寸的连接器进行连接,并解决回波损耗等问题。



这些网络都是由线缆连接而成,未来,随着网络速率的提高,光线的数量将会提高。在整个AI集群中,除了光纤布线,还有线槽,以及铜缆连接等。


吴健表示:“康普在AI布线市场已经布局多年,已取得了非常大的成功,包括一些万卡集群以及一些高性能的布线系统,康普都能提供对应的解决方案。”


康普的布线解决方案不仅满足客户当下的需求,也能帮助他们实现长期规划。吴健表示:“目前国内数据中心的设计相对来说还比较缺乏前瞻性,只进行一两年的规划,而不考虑长远使用,这其实很浪费材料,不环保。”


康普企业网络大中华区总经理兼副总裁陈岚表示:“现在很多数据中心的项目将布线做成了次抛型,这是很不环保的。网络基础架构采用结构化布线,虽然初次成本可能稍微高一点,但后续升级、扩展以及维护的成本很低,且使用的生命周期很长,从长远来看反而节省了成本。”


写在最后


随着人工智能以及大语言模型等技术的飞速发展,对于算力的需求大幅增长,而网络作为支撑这些技术的传输“骨干”,也需要齐头并进。而在整个网络基础设备的构建中,布线虽然是不太起眼的一部分,但它可以说是智算中心的“血管”,起着举足轻重的作用。而随着对更环保化、更据经济效益的布线方式需求的增长,结构化布线或许会是未来智算中心布线的主流方式。对于布线供应商来说,着眼现在,布局未来,才能在这一波AI浪潮中立于潮头。


END

TechSugar 做你身边值得信赖的科技新媒体
评论
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 66浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 70浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 106浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 70浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 83浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 41浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 102浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 51浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 98浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 37浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 65浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦