智算中心需要怎样的网络架构技术?

原创 TechSugar 2024-10-15 08:01


人工智能技术以及大语言模型(LLM)应用的普及,对于算力的需求激增,也推动了各国对于数据中心的建设。其中,作为数据中心的一种,智算中心由于其具有的强大数据处理能力和智能计算能力,正成为最受关注的数字基础设施。


什么是智算中心?


那什么是智算中心呢?根据工信部印发的《算力基础设施高质量发展行动计划》,智算中心是指通过使用大规模异构算力资源,包括通用算力(CPU)和智能算力(GPU、FPGA、ASIC等),主要为人工智能应用(如人工智能深度学习模型开发、模型训练和模型推理等场景)提供所需算力、数据和算法的设施。


康普企业网络大中华区技术总监吴健则认为,从国际角度来讲,智算中心(即所谓的AI DC)还没有一个专门的定义。在中国市场则被定义为一个新的品类,它是数据中心的一类,即在数据中心中为了完成大模型的训练和推理,部署了GPU的服务器,这样的数据中心就称之为智算中心。而且,数据中心中GPU服务器的占比将越来越高,在2027-2028年前后,GPU服务器数量将超过CPU服务器的数量。


据悉,目前已经建成或正在建的智算中心普遍拥有约100PFLOPS左右的智能计算能力,可为各类应用场景提供强大的支持。据IDC的不完全统计,到2024年5月下旬,我国共建设了283座智算中心,其中超过一半处于开工/在建状态,已投产/运营的达到89座,占比31.45%。


智算中心三要素及网络互连技术


算力、网络和数据是完成智算的三个要素。其中,数据是智算需要处理的对象;算力是指处理计算的芯片(如CPU和GPU等)的能力。CPU和GPU它们处理数据的方式是不同的,CPU一次只能处理一个复杂的任务,而GPU则采用并行计算,一次可以处理多个简单的任务。如上所述,在智算中心中,GPU的数量大幅增长,而其采用的并行计算方式,也大幅提高了算力。算力提高了,也就需要配套的传输网络与之相匹配。


吴健表示:“GPU算力每年翻两倍,10年就要翻1000倍。那也就预示着,网络也应该10年翻1000倍才能与之相匹配。所以,目前的网路已经滞后于算力。智算中心随着GPU的应用,它需要一个高可靠、高带宽、低延时的无损网络。”


所以,随着智算的快速推进,400G以上网络的占比将占主导地位,包括400G、800G和1.6T。


目前,智算中心采用的网络互连技术主要为InfiniBand(IB)和以太网。吴健表示:“AI需要IB和以太网两种网路设备来支撑。目前,这两种技术的速率发展较为同步,都会快速进入到800G、1.6T。但IB在整个智算中的效率、稳定性要比以太网好一些。”


从物理层而言,IB和以太网是一样的,但IB和以太网使用的交换机则是不同的。很多人认为,以太网可能无法跟上IB的演进速度,因为IB是一个无损网络,而以太网则不是一个专用网络,很难做到无损。吴健表示:“目前,从协议层和硬件层面进行一些技术的优化,以太网也可以做到无损了。”


所以,未来,吴健认为,至少在中国市场,以太网取代IB是势在必行的。


智算中心组网


智算中心的组网主要分为前端网络和后端网络。前端网络是指智算中心和外部的互连,即将智算中心计算的结果通过前端网络传输出去;而后端网络则是指GPU之间的互连。


与传统网络相比,智算中心的前端网络没有多大变化,但后端网络变得特别的庞大,涉及AI集群内的互连以及AI集群间的互连。智算中心中的网络需要高带宽、低损耗、低延时以及高密度的连接,可以未来还将需要更小尺寸的连接器进行连接,并解决回波损耗等问题。



这些网络都是由线缆连接而成,未来,随着网络速率的提高,光线的数量将会提高。在整个AI集群中,除了光纤布线,还有线槽,以及铜缆连接等。


吴健表示:“康普在AI布线市场已经布局多年,已取得了非常大的成功,包括一些万卡集群以及一些高性能的布线系统,康普都能提供对应的解决方案。”


康普的布线解决方案不仅满足客户当下的需求,也能帮助他们实现长期规划。吴健表示:“目前国内数据中心的设计相对来说还比较缺乏前瞻性,只进行一两年的规划,而不考虑长远使用,这其实很浪费材料,不环保。”


康普企业网络大中华区总经理兼副总裁陈岚表示:“现在很多数据中心的项目将布线做成了次抛型,这是很不环保的。网络基础架构采用结构化布线,虽然初次成本可能稍微高一点,但后续升级、扩展以及维护的成本很低,且使用的生命周期很长,从长远来看反而节省了成本。”


写在最后


随着人工智能以及大语言模型等技术的飞速发展,对于算力的需求大幅增长,而网络作为支撑这些技术的传输“骨干”,也需要齐头并进。而在整个网络基础设备的构建中,布线虽然是不太起眼的一部分,但它可以说是智算中心的“血管”,起着举足轻重的作用。而随着对更环保化、更据经济效益的布线方式需求的增长,结构化布线或许会是未来智算中心布线的主流方式。对于布线供应商来说,着眼现在,布局未来,才能在这一波AI浪潮中立于潮头。


END

TechSugar 做你身边值得信赖的科技新媒体
评论
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 158浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 124浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 92浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 202浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 164浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 222浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 61浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 69浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 116浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 141浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 119浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 98浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 106浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 58浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 93浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦