智能汽车安全新媒体
以太网交换机为用于网络信息交换的网络设备,是实现各种类型网络终端互联互通的关键设备。以太网交换机对外提供高速网络连接端口,直接与主机或网络节点相连,可为接入设备的任意多个网络节点提供电信号通路和业务处理模型。
01
交换机:数字经济核心底座
交换机是一种用于电(光)信号转发的网络设备,通过为接入交换机的任意两个网络节点提供独享的电信号通路,从而转发数据包。当交换机接收到一个数据包时,它会读取数据包的目标MAC地址,然后将数据包转发到目标设备的端口上。目前业内主流交换机为以太网交换机。
交换机的主要应用场景包括:数据中心网络、工业互联网等各类网络环境,是我国数字经济网络的重要基建。随着我国“十四五”规划纲要从现代化、数字化、绿色化方面对加快新型网络基建提出了方针指引,我们认为未来以交换机等网络设施为代表的数字基础设施将持续受益于我国数字经济发展。
交换芯片是交换机核心部件,技术壁垒高筑,市场空间有望突破400亿。
以太网交换芯片为用于交换处理大量数据及报文转发的专用芯片,是针对网络应用优化的专用集成电路(ASIC)。以太网交换芯片内部的逻辑通路由数百个特性集合组成,在协同工作的同时保持极高的数据处理能力,因此其架构实现具有复杂性。
交换芯片作为交换机的核心部件,直接决定整机交换容量和端口速率等。交换芯片技术壁垒高,主要难点包括高性能交换芯片架构设计、高密度端口设计等,当前交换芯片最高转发速率达51.2T。
成本方面,芯片采购成本包括主芯片(涵盖以太网交换芯片、PHY芯片、MAC芯片、CPU芯片等)和辅助芯片(其他数字芯片、电源管理芯片、信号链芯片、功率芯片等),主芯片承担核心功能,其采购单价远高于辅助芯片,为交换机硬件中的主要价值构成。
(1)单价角度:单颗以太网交换芯片售价较高。根据盛科通信招股书,公司目前最高端产品为TsingMa.MX(2.4Tbps,400G)系列的芯片产品CTC8186,其在试制阶段的平均销售单价为2252.33元/颗,定价水平较高。博通Tomahawk系列的BCM56960(2014年,3.2Tbps,400G)目前单价为4100美元左右(根据经销网站Avnet、mouserelectronic的数据)。最高端的Tomahawk5系列交换芯片暂无公开售价。
(2)价值量占比角度:芯片为上游最主要原材料。根据锐捷网络招股书披露,2020年锐捷网络芯片采购成本占原材料采购成本的45%;根据三旺通信招股书披露,公司20H1所有芯片采购成本占原材料采购总额的比例为36%。结合盛科通信招股书披露的部分交换芯片的售价及交换机整机成本,我们粗略估算交换机内部主芯片在原材料中占比25%~30%左右,其中交换芯片占比10%~15%。
估算交换芯片价值量在交换机中的占比为10%~15%,是交换机内部价值量占比最高的元器件。2020年全球交换芯片市场规模约368亿元,预计2025年将达到434亿元,CAGR约为11%,其中预计商用交换芯片占比从50%小幅提升至55%;中国交换芯片市场2020年约为125亿元,预计2025年将达到225亿元,CAGR约13%。
交换机内部硬件包含PCB板、主芯片、辅助芯片、存储器件、散热器、电源模块、接口/端口子系统等,其中主芯片包括交换芯片、PHY芯片、CPU,辅助芯片则包括其他数字芯片、电源芯片、信号链芯片等。
交换机的信号转发主要通过主芯片完成:外部模拟信号通过线缆接入交换机端口,在内部CPU的指令调度下,由PHY(物理层)芯片将模拟信号转化为数字信号并将传输给交换芯片,之后由交换芯片进行数字信号的安检、调度及转发,最后再次由PHY芯片将信号转化为模拟信号,通过端口输出。其余辅助芯片及器件则主要支持零部件之间的连接、信号转发所需的电力能量、散热等。
以太网交换芯片承担交换机核心转发功能,决定核心性能指标。交换芯片专门用于数据包的预处理以及转发,其通过专用的PCIE线与CPU相连,接收中央处理器的调用指令,完成数据转发。交换机的主要功能是提供子网内的高性能交换、低延时交换,因此直接决定了整机的交换容量、端口速率等重要性能指标。
以太网交换芯片在逻辑层次上遵从OSI模型(开放式通信系统互联参考模型),OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。
以太网交换芯片主要工作在物理层、数据链路层、网络层和传输层,提供面向数据链路层的高性能桥接技术(二层转发)、面向网络层的高性能路由技术(三层路由)、面向传输层及以下的安全策略技术(ACL)以及流量调度、管理等数据处理能力。作为以太网交换机的核心元器件,以太网交换芯片在很大程度上决定了以太网交换机的功能、性能和综合应用处理能力。
以太网交换机和以太网交换芯片广泛应用于整个信息化产业。随着5G、云计算、物联网及人工智能等技术的发展,网络的边界和能力将得到前所未有的拓展与提升,其蓬勃发展将推动信息化产业进入全互联时代。当前网络体系面向不同应用领域可划分为企业网络、运营商网络、数据中心网络和工业网络四个关键应用场景。由于网络体系的每个关键应用场景均采用类似接入、汇聚和核心的组网架构,因此均需要系列化的以太网交换芯片产品。
以太网交换芯片和芯片模组
以太网交换芯片和芯片模组致力于在企业网络、运营商网络、数据中心网络和工业网络的部署和应用,经过多年行业的深耕和积累,现已形成丰富的以太网交换芯片产品序列,覆盖从接入层到核心层的以太网交换产品,充分融合企业网络、运营商网络、数据中心网络和工业网络各应用领域的增强特性,具备全面的二层转发、三层路由、可视化、安全互联等丰富的特性。
交换芯片的工作原理大致为:
预处理:需要传输的报文或数据包由端口进入以太网交换芯片后,数据包首先会进行头子段匹配,为之后的流分类做准备;
安检:通过安全引擎来对硬件进行安全检测;
流分类处理:安全检测完毕后,其中符合安全的数据包将进行二层交换或三层路由,经流分类处理器来对匹配数据包做出相关动作(例如限速、丢弃、修改VLAN等),寻找对应地址;
排队调度:对于可转发的数据包,根据802.1P或DSCP将会进入不同队列的buffer中,调度器会依据优先级(如基于二层的IEEE802.1p优先级或基于IP层的IP优先级和DSCP优先级)或既定算法(如WRR)来进行队列调度,在端口将该数据包发出之前执行流分类的修改动作;
最终转发:最终经由相应端口发出,实现交换机的数据转发功能。
以太网交换机
以太网交换机产品基于高性能以太网交换芯片进行构建,旨在探索下一代企业网络、运营商网络、数据中心网络和工业网络等多种应用场景需求,同时为以太网交换芯片产品推广提供应用案例。
以太网交换机产品主要面向具备技术和市场能力的网络方案集成商或品牌设备厂商,产品在设计上融入新兴的白盒交换机、SDN(软件定义网络)等创新理念,在商业模式上着力关注面向客户及应用的贴牌定制,并充分整合软件系统,目前已在分流领域、安全领域、云计算领域和SDN领域实现了现网应用。
行业经营模式
半导体及集成电路行业在经营模式上主要分为IDM(IntegratedDeviceManufacturing,垂直整合制造)模式和垂直分工模式。其中,IDM模式下,企业独自完成芯片设计、晶圆制造、封装测试所有环节,对企业的技术储备和资金实力具有较高的要求;垂直分工模式中包括Fabless企业、Foundry企业和封测代工厂。垂直分工模式下,产业链各环节由不同企业专业化分工进行,由Fabless企业(芯片设计企业)专业从事产品的研发设计,将晶圆制造、封装和测试环节外包给Foundry企业(晶圆代工厂)及封测代工厂,以实现各方技术与资金资源的精准投入。
20世纪80年代前,全球半导体行业以IDM模式为主,但行业壁垒较高、产品周期较长等因素在一定程度上制约了行业的发展。80年代后期,随着中国台湾Foundry企业的诞生,半导体产业链各环节呈现分化的态势,Fabless模式和Foundry模式逐步得到行业认可,市场占比逐年提高。
以太网交换芯片工艺流程图
以太网交换芯片模组工艺流程图
以太网交换机工艺流程图
以太网设备的行业应用
交换机是基于以太网实现数据传输和交换的数通设备,按照不同维度拥有多种分类。中国交换机行业概况、定义与分类、架构、发展历程、市场规模、竞争格局、产业链概述。
交换机:按照应用领域分类交换机属于光通信设备中数通设备的一种,指基于以太网进行数据传输和交换的多端口网络设备,每个端口都可以连接到主机或网络节点,主要功能就是根据接收到数据帧中的硬件地址,把数据转发到目的主机或网络节点。
交换机相当于一台特殊的计算机,由硬件和软件组成,连接计算机、服务器、摄像设备、打印设备、IP电话等终端设备,并通过与其他交换机、无线接入点、路由器等网络设备互联,构建网络进而实现所有设备的互联互通。
按照不同维度分类:按照在网络中所处的位置和分工,交换机可分为核心交换机、汇聚交换机和接入交换机,此分类法最基本和常用;按网络覆盖程度,交换机可分为广域网和局域网交换机;按照不同端口结构,交换机可分为固定端口和模块化交换机;按照不同传输带宽和速率,交换机可分为百兆、千兆、万兆、十万兆交换机等;
按照不同规模应用,交换机可分为企业级、校园级、部门级、工作组和桌机型交换机;按照是否支持网关功能,交换机可分为网管型和非网管型交换机。
交换机是各类网络架构中的重要组成部分,可满足多类应用场景需求,园区场景中组网主要有两类方式,企业场景中简化设备的同时满足更多需求。
在园区场景中,园区网络可采用以太网组网或无源光纤组网,以太网组网即采用核心交换机到汇聚交换机最后到接入交换机;无源光纤组网同样采用核心交换机,但在汇聚层由OLT设备进行替换,在接入层由ODN设备(主要是分光器)面向用户侧ONU设备进行替换;在以太网组网中核心交换机可直连网络,也可连接防火墙再连接网络;
在企业场景中,一般部署核心交换机和接入交换机,核心交换机作为接入交换机的汇聚点,提供至网络的上行链路;接入交换机为企业的各类终端设备提供网络连接。当前企业办公对网络的需求正在多样化,对无线连接、负载、灵活度等均有较高要求。
在数据中心场景中,由于数据中心市场中东西向流量(即各个数据中心间的流量)已占据市场主流,这促使着数据中心架构进行调整优化。叶脊构架是当前首选,其能使数据中心规模扁平化,带宽利用率更高,可扩展性更强,降低延时,部署和维护成本更低,安全性和可用性更高。
叶脊构架将三层构架优化为二层架构,包括脊交换机和叶交换机,其中脊交换机相当于原三层架构中的核心交换机,是一种高端口密度的交换机,叶交换机相当于原三层架构中的接入交换机,能提供网络连接给服务器同时上联给脊交换机。
在工业场景中,工业交换机主要是为针对性满足灵活多变的工业应用需求而提供的组网设备,与其他商用交换机设备相比,工业交换机核心功能未变,但需要能承受更严苛的工作环境(耐高温、防水、防爆、抗震、抗干扰等),要有更长的使用寿命,更高性价比,能满足通信实时性和稳定性,网络安全性,灵活组网,部署和维护便捷等要求。工业交换机的应用领域包括:智慧电网、智慧工厂、智慧城市、轨道交通、石油化工、新能源等。
以太网交换机设备构成:主要以芯片类(交换芯片、CPU、PHY)、PCB、光器件、插接件、阻容器件、壳体等组成,其中交换芯片为最核心部件。以太网交换芯片:以太网交换芯片为用于交换处理大量数据及报文转发的专用芯片,是针对网络应用优化的专用集成电路。以太网交换芯片内部的逻辑通路由数百个特性集合组成,在协同工作的同时保持极高的数据处理能力,因此其架构实现具有复杂性;部分以太网交换芯片将CPU、PHY集成在以太网交换芯片内部。
近年来云计算、大数据等新一代技术实现快速发展,各类相应新兴应用逐渐增多,包括虚拟现实、远程控制、自动驾驶、超高清视频等,这些新兴应用给现有网络和算力带来越来越大的压力。为有效应对流量大幅度增长的问题,大型数据中心的建设持续推进,其中“东数西算”的启动又为超大型数据中心建设有效提速。超大型数据中心需要网络具备高稳定性、高性能、高可控性以及低运维成本,传统组网方式以不能有效满足以上需求,尤其是传统交换机从软件到硬件均为封闭式开发,这类传统交换机又被称为黑盒交换机(或品牌交换机)。
黑盒交换机导致不同厂商设备间互通性偏低,网络运维难度较大,管控不能实现统一,一旦发生故障也不能实现快速定位,同时黑盒交换机也不利于未来设备升级和功能扩展。由于数据中心用交换机在整体交换机市场中占有重要地位,能够实现更快迭代升级和统一管控的白盒交换机将成为未来交换机市场长期可持续发展的关键。
白盒交换机采用开发的设备架构,对网络底层硬件与上层网络功能和协议进行解耦,在最大程度上提升了设备灵活度。白盒交换机一般包括硬件和软件两部分,硬件包括交换芯片、CPU、网卡、存储、外围硬件设备等,软件包括网络操作系统及配套应用。
白盒交换机的关键优势:购置成本较品牌交换机低50%、部署简便、更先进的网络管理、更高程度的自动化、个性化程度高等。市场上的交换芯片包含自研和商用两大类,多种因素导致未来交换芯片市场规模的主要增量将来自商用芯片。
采用自研交换芯片的因素:早期市场并未形成大规模商用,以思科为代表的龙头企业通过自研以太网交换芯片的方式配合自研交换机的技术演进;在市场主要由龙头企业进行竞争的背景下,各交换机厂商往往不采用主要竞争对手的芯片方案、依赖竞争对手的方案构建交换机,从而丧失自身核心竞争力。
采用商用交换芯片的因素:随着以太网交换芯片市场的扩大,自研厂商已无法满足下游日益增长的需求,当前市场上自研交换芯片和商用交换芯片的市场份额占比已经表现为各占一半的状态,预计商用交换芯片的市场和规模将以更快的增长速度超过自研交换芯片的市场规模。
未来交换芯片市场规模的主要增量将来自商用芯片,原因包括:交换芯片一直存在的技术和资金壁垒,尤其是一般交换芯片应用生命周期长达8-10年,使得部分自研企业难以在自身体量下同时支撑芯片的高额研发投入、高速迭代,且难以实现经济效益;当前交换芯片市场增长主要动力来自数据中心,而数据中心启用商用交换芯片的时间较早,已形成一定先发优势;贸易战的持续摩擦将给自研企业带来更多产业链风险。
交换芯片的难点:交换芯片从芯片设计至流片至大规模量产等环节均需要交换芯片厂商和原材料等供应商的长期投入和高度协作。
交换机的难点:在硬件上,需要基于交换芯片进行硬件原理图设计、布局、调试和测试;在软件上,需要基于交换芯片的SDK以及研发二层、三层协议栈、堆叠协议;最后基于研发成果进行大规模测试保障产品稳定性。
02
以太网数据交换技术发展历史
以太网技术演进
以太网交换芯片的起源最早可以追溯到上世纪70年代以太网的诞生。ALOHA协议为实现夏威夷群岛之间“一点到多点”的目的而设计的通信协议,其本质是“无线电信道冲突域协商机制”。1973年5月22日,世界上第一个个人计算机局域网络ALTOALOHA网络运转,标志着以太网正式诞生。
1975年7月,具划时代意义的EthernetI协议发布,包括了将时钟脉冲作为与MainMemory进行数据交换的信号,现如今很多相关技术名词均出自该协议,如Ethernet、Interfacecable(接口表)等等。1980年9月,以太网通用标准ETHE80正式出台,同年第一代以太网技术DIX1.0被研发问世,之后修改为DIX2.0,即IEEE802.3标准基础规约。
1995年发布的“802.3u100Mbps以太网标准”也称FastEthernet,标志着业界进入100M快速以太网时代。21世纪以太网的应用范围进一步拓展,2010年IEEE发布40G和100G的802.3ba标准,分别用于大规模数据中心/超级计算机和数据中心互联/骨干网络;2017年IEEE发布200G和400G802.3bs标准;2022年12月发布800G标准P802.3df和1.6T标准P802.3dj从而进一步提高带宽,用于云数据中心场景,P802.3dj为目前IEEE发布的最高传输速率以太网标准。目前以太网技术经过了前后50多年探索和发展,网络传输速率不断提升,通信范围页从局域网拓展到城域网和广域网。
交换机演进历史
随着以太网相关技术的发展,交换机产品类型也同样发展经历四代的演变。从1989年第一台交换机问世以来,其在端口速率和交换容量上有了快速发展和极大提升。交换机的前身是一种不能隔绝冲突扩散的物理层设备——集线器,其将多个接口和传输线集成于一体,但当时以太网标准尚未问世,因此其网络性能因为自身属性所限而难以提高。
1989年,美国Kalpana公司发明了世界上第一台以太网交换机EtherSwitchEPS-700,该型号对外提供7个固定端口。交换机作为一种能隔绝冲突的二层网络设备,极大提高了网络性能。如今的交换机早已突破旧框架,不仅能完成二层转发,也能根据IP地址进行三层转发,甚至还出现了工作在四层及更高层的叠加型多业务交换机。
交换机的市场参与者不断增加。1994年,思科基于上一年并购的Crescendo的交换机技术,推出了思科第一款交换机Catalyst1200,这款交换机支持8个10M以太网接口,另有两个模块插槽用于上行链路,从此正式开启了全球龙头厂商交换机的争鸣时代。
1997年12月,华为推出第一款国产以太网交换机QuidwayS2403;2002年10月,中兴通讯推出国内第一台符合802.3ae标准的10G以太网高端路由交换机;2006年3月,锐捷网络全球首发面向10万兆平台设计的RG-S8600、RG-S9600系列。此阶段业界依旧采用大体积硬件耦合的形式来构成交换机进行信息交换,尚无厂商推出标准清晰且可量产的交换芯片。
2010年博通发布业界首款可量产交换芯片后,交换机迅速腾飞。2013年1月,思科通过自研UADP芯片推出Catalyst3850系列交换机,该机型支持CiscoONE可编程网络模型。美国后起之秀Arista于2014年推出业界首款具有100G上行链路的叶交换机。国内厂商同样发展迅速,华为、锐捷网络等厂商不断推出高性能交换机产品。
2019年锐捷网络率先在业内推出100G数据中心核心交换机和25G/100G数据中心解决方案,打开数据中心市场。2022年4月,新华三发布了业界首款400G园区核心交换机;2023年6月,华为推出800GE数据中心核心交换机CloudEngine16800-X系列,主要针对大数据、云计算等应用场景;同月,新华三全球首发新一代数据中心交换机新品S9827系列,带宽达到51.2T,进一步助力算力释放。
交换芯片演进历史
芯片量产时代:交换机问世的20余年后,博通推出首个可量产的交换芯片。21世纪初叶,半导体材料在电子通信行业的应用快速发展,使得厂商能够把大量数据转发功能集于一块专用集成电路上,芯片的形式开始逐渐取代大量耦合硬件。与此同时,IEEE802.3ba的通过为交换芯片铺平了道路。
2010年,Broadcom推出业界第一个可量产的以太网交换芯片系列BCM88600,交换容量达到640G,并且开始以2年为周期不断推出更高性能产品。之后美国巨头厂商美满、思科、英伟达等也相继推出以太网交换芯片产品,并优先抢占绝大部分市场份额,成为行业绝对的领跑者;而中国厂商如华为、中兴通讯、盛科通信虽起步较晚,但也通过攻克技术难点陆续成功研发国产以太网交换芯片。至此交换芯片进入高速发展期,成为交换机性能迭代的第一动力及核心壁垒。
群雄逐鹿时代:2022年8月,博通发布了目前业内最高端的交换芯片Tomahawk5,为市面上首个量产51.2Tbps交换带宽的芯片,单个端口最高速率达到800G,主要针对超大规模企业和云构建者商用交换机和路由器芯片市场。此前英伟达于2022春季发布会推出Spectrum-4交换机,其搭载的AI芯片同样为“51.2T+800G”的配置,但该芯片并不通过量产对外出售。
之后美国巨头厂商相继推出同级别性能指标的以太网交换芯片:Marvell于2023年3月推出Teralynx10;思科推出SiliconOneG200/G202系列网络芯片;以上交换芯片均为目前业内最高性能水准。国产厂商盛科通信计划2024年推出Arctic系列,交换容量达到25.6T,有望对标行业一线龙头。
51.2T以太网技术演进
以太网交换芯片的起源最早可以追溯到上世纪70年代以太网的诞生。ALOHA协议为实现夏威夷群岛之间“一点到多点”的目的而设计的通信协议,其本质是“无线电信道冲突域协商机制”。1973年5月22日,世界上第一个个人计算机局域网络ALTOALOHA网络运转,标志着以太网正式诞生。
1975年7月,具划时代意义的EthernetI协议发布,包括了将时钟脉冲作为与MainMemory进行数据交换的信号,现如今很多相关技术名词均出自该协议,如Ethernet、Interfacecable(接口表)等等。
1980年9月,以太网通用标准ETHE80正式出台,同年第一代以太网技术DIX1.0被研发问世,之后修改为DIX2.0,即IEEE802.3标准基础规约。1995年发布的“802.3u100Mbps以太网标准”也称FastEthernet,标志着业界进入100M快速以太网时代。
21世纪以太网的应用范围进一步拓展,2010年IEEE发布40G和100G的802.3ba标准,分别用于大规模数据中心/超级计算机和数据中心互联/骨干网络;2017年IEEE发布200G和400G802.3bs标准;2022年12月发布800G标准P802.3df和1.6T标准P802.3dj从而进一步提高带宽,用于云数据中心场景,P802.3dj为目前IEEE发布的最高传输速率以太网标准。
目前以太网技术经过了前后50多年探索和发展,网络传输速率不断提升,通信范围页从局域网拓展到城域网和广域网。
交换机演进历史
随着以太网相关技术的发展,交换机产品类型也同样发展经历四代的演变。从1989年第一台交换机问世以来,其在端口速率和交换容量上有了快速发展和极大提升。
交换机的前身是一种不能隔绝冲突扩散的物理层设备——集线器,其将多个接口和传输线集成于一体,但当时以太网标准尚未问世,因此其网络性能因为自身属性所限而难以提高。
1989年,美国Kalpana公司发明了世界上第一台以太网交换机EtherSwitchEPS-700,该型号对外提供7个固定端口。交换机作为一种能隔绝冲突的二层网络设备,极大提高了网络性能。
如今的交换机早已突破旧框架,不仅能完成二层转发,也能根据IP地址进行三层转发,甚至还出现了工作在四层及更高层的叠加型多业务交换机。
交换机的市场参与者不断增加。1994年,思科基于上一年并购的Crescendo的交换机技术,推出了思科第一款交换机Catalyst1200,这款交换机支持8个10M以太网接口,另有两个模块插槽用于上行链路,从此正式开启了全球龙头厂商交换机的争鸣时代。
1997年12月,华为推出第一款国产以太网交换机QuidwayS2403;2002年10月,中兴通讯推出国内第一台符合802.3ae标准的10G以太网高端路由交换机;2006年3月,锐捷网络全球首发面向10万兆平台设计的RG-S8600、RG-S9600系列。
此阶段业界依旧采用大体积硬件耦合的形式来构成交换机进行信息交换,尚无厂商推出标准清晰且可量产的交换芯片。
2010年博通发布业界首款可量产交换芯片后,交换机迅速腾飞。2013年1月,思科通过自研UADP芯片推出Catalyst3850系列交换机,该机型支持CiscoONE可编程网络模型。美国后起之秀Arista于2014年推出业界首款具有100G上行链路的叶交换机。国内厂商同样发展迅速,华为、锐捷网络等厂商不断推出高性能交换机产品。
2019年锐捷网络率先在业内推出100G数据中心核心交换机和25G/100G数据中心解决方案,打开数据中心市场。2022年4月,新华三发布了业界首款400G园区核心交换机;2023年6月,华为推出800GE数据中心核心交换机CloudEngine16800-X系列,主要针对大数据、云计算等应用场景;同月,新华三全球首发新一代数据中心交换机新品S9827系列,带宽达到51.2T,进一步助力算力释放。
03
交换芯片演进历史
芯片量产时代:交换机问世的20余年后,博通推出首个可量产的交换芯片。21世纪初叶,半导体材料在电子通信行业的应用快速发展,使得厂商能够把大量数据转发功能集于一块专用集成电路上,芯片的形式开始逐渐取代大量耦合硬件。
与此同时,IEEE802.3ba的通过为交换芯片铺平了道路。2010年,Broadcom推出业界第一个可量产的以太网交换芯片系列BCM88600,交换容量达到640G,并且开始以2年为周期不断推出更高性能产品。之后美国巨头厂商美满、思科、英伟达等也相继推出以太网交换芯片产品,并优先抢占绝大部分市场份额,成为行业绝对的领跑者;而中国厂商如华为、中兴通讯、盛科通信虽起步较晚,但也通过攻克技术难点陆续成功研发国产以太网交换芯片。
至此交换芯片进入高速发展期,成为交换机性能迭代的第一动力及核心壁垒。群雄逐鹿时代:2022年8月,博通发布了目前业内最高端的交换芯片Tomahawk5,为市面上首个量产51.2Tbps交换带宽的芯片,单个端口最高速率达到800G,主要针对超大规模企业和云构建者商用交换机和路由器芯片市场。此前英伟达于2022春季发布会推出Spectrum-4交换机,其搭载的AI芯片同样为“51.2T+800G”的配置,但该芯片并不通过量产对外出售。
之后美国巨头厂商相继推出同级别性能指标的以太网交换芯片:Marvell于2023年3月推出Teralynx10;思科推出SiliconOneG200/G202系列网络芯片;以上交换芯片均为目前业内最高性能水准。国产厂商盛科通信计划2024年推出Arctic系列,交换容量达到25.6T,有望对标行业一线龙头。
以太网交换芯片行业概况
(1)以太网交换设备行业概况
以太网交换设备为用于网络信息交换的网络设备,是实现各种类型网络终端互联互通的关键设备。以太网交换设备对外提供高速网络连接端口,直接与主机或网络节点相连,可为接入设备的任意多个网络节点提供电信号通路和业务处理模型。
以太网交换设备在逻辑层次上遵从OSI模型(开放式通信系统互联参考模型),主要工作在物理层、数据链路层、网络层和传输层。以太网交换设备拥有一条高带宽的背部总线和内部交换矩阵,在同一时刻可进行多个端口对之间的数据传输和数据报文处理。
以太网逐渐赢得业界普遍认同,成为最有前途的网络技术,正成为网络领域的基础和垄断承载技术。随着以太网的发展,以太网交换设备也在持续演进。从1989年第一台以太网交换设备面世至今,经过30多年的快速发展,以太网交换设备在转发性能上有了极大提升,端口速率从10M发展到了800G,单台设备的交换容量也由数十Mbps提升到了数十Tbps。早期的以太网设备如集线器为物理层设备,无法隔绝冲突扩散,限制了网络性能的提高。
以太网交换设备作为一种能隔绝冲突的网络设备,极大地提高了以太网的性能。随着技术的发展,如今的以太网交换设备早已突破当年桥接设备的框架,不仅能完成二层转发,也能根据IP地址进行三层路由转发,甚至出现工作在四层及更高层的以太网交换设备。
(2)以太网交换芯片行业概况
1)以太网交换芯片定义及架构
以太网交换设备由以太网交换芯片、CPU、PHY、PCB、接口/端口子系统等组成,其中以太网交换芯片和CPU为最核心部件。以太网交换芯片为用于交换处理大量数据及报文转发的专用芯片,是针对网络应用优化的专用集成电路。以太网交换芯片内部的逻辑通路由数百个特性集合组成,在协同工作的同时保持极高的数据处理能力,因此其架构实现具有复杂性;CPU是用来管理登录、协议交互的控制的通用芯片;PHY用于处理电接口的物理层数据。部分以太网交换芯片将CPU、PHY集成在以太网交换芯片内部。
2)以太网交换芯片工作原理
需要传输的报文/数据包由端口进入以太网交换芯片之后,首先进行数据包头字段匹配,为流分类做准备;而后经过安全引擎进行硬件安全检测;符合安全的数据包进行二层交换或者三层路由,经过流分类处理器对匹配的数据包做相关动作(比如丢弃、限速、修改VLAN等);对于可以转发的数据包根据802.1P或DSCP放到不同队列的buffer中,调度器根据优先级或者WRR等算法进行队列调度,在端口发出该数据包之前执行流分类修改动作,最终从相应端口发出。
3)以太网交换芯片分类以太网交换芯片按照带宽及应用可分为以下类别:
以太网的芯片主要包括以太网MAC芯片、PHY芯片以及交换机芯片等。
以太网MAC芯片是实现以太网数据链路层通信的关键组件,其主要功能包括数据包的封装与解析、寻址和路由、流量控制等。以太网PHY芯片是实现以太网物理层通信的关键组件,其主要功能包括信号的调制与解调、数据的编码与解码、数据的传输与接收等。交换机芯片则是实现多个节点之间通信的关键组件,其主要功能包括数据的交换与转发、地址学习和过滤等。
以太网还需要其他芯片的支持,如网络变压器、电源管理芯片等。这些芯片为以太网提供了稳定可靠的物理层和传输层支持,确保了数据传输的可靠性和稳定性。
以太网MAC芯片
以太网MAC芯片是实现以太网数据链路层通信的关键组件,其主要功能包括数据包的封装与解析、寻址和路由、流量控制等。
以太网MAC芯片的具体作用是将上层协议层的数据包封装成以太网帧,并按照以太网的规则进行发送。同时,它也能够将接收到的以太网帧解封装成上层协议所需的数据包。此外,以太网MAC芯片还负责处理ARP(地址解析协议)报文,实现IP地址到MAC地址的映射。
以太网MAC芯片的实现需要遵循IEEE802.3标准,并且需要与以太网PHY芯片进行良好的配合,以确保数据传输的可靠性和稳定性。在车载以太网的应用中,以太网MAC芯片需要支持高带宽、低延迟、可靠传输等特性,以确保汽车通信系统的安全性和可靠性。
目前,市场上主要的以太网MAC芯片厂商包括MaximIntegrated、MicrochipTechnology、NXPSemiconductors等。这些厂商的以太网MAC芯片产品已经广泛应用于车载以太网通信系统中,为汽车的安全性和可靠性提供了保障。
以太网MAC芯片的主要功能包括以下几点:
数据包的封装与解析:以太网MAC芯片能够将上层协议层的数据包封装成以太网帧,并按照以太网的规则进行发送。同时,它也能够将接收到的以太网帧解封装成上层协议所需的数据包。
寻址和路由:以太网MAC芯片能够处理以太网的寻址和路由功能,实现数据包的正确发送和接收。
流量控制:以太网MAC芯片能够通过流量控制机制,确保数据传输的稳定性和可靠性,避免数据包的丢失或重复。
ARP报文处理:以太网MAC芯片能够处理ARP报文,实现IP地址到MAC地址的映射,保证数据包的正确传输。
链路管理:以太网MAC芯片能够管理以太网链路的状态,包括链路的建立、维护和断开等操作。
异常处理:以太网MAC芯片能够处理以太网传输过程中的异常情况,如数据包的错误检测和重传等。
以太网PHY芯片
以太网PHY芯片是指实现以太网物理层通信的关键组件,其作用是将数据链路层的数据包转换成能够在物理媒介上传输的信号。以太网PHY芯片是连接数据链路层和物理层的桥梁,负责实现以下功能:
信号的调制与解调:将数据链路层的信号调制为适合在物理媒介上传输的信号,并在接收端进行相应的解调操作。
数据的编码与解码:对数据进行相应的编码与解码操作,以确保数据能够在物理媒介上正确传输。
数据的传输与接收:通过物理媒介进行数据的传输与接收,支持全双工通信模式。
数据的冲突检测与处理:能够检测到数据传输过程中的冲突并进行相应的处理,以确保数据的可靠传输。
网络的连接与拓扑:支持多种网络拓扑结构,如星型、总线型、环型等,并能实现多个节点之间的连接与通信。
以太网PHY芯片的市场主要由国外厂商主导,但国内厂商也在逐步追赶。随着汽车智能化和电动化的发展,以太网在汽车通信领域的应用将越来越广泛,对以太网PHY芯片的需求也将持续增长。
以太网PHY芯片的功能主要体现在以下几个方面:
物理层传输:以太网PHY芯片通过物理介质(如双绞线、光纤等)进行数据的发送和接收。它负责将数据从数据链路层(MAC)转化为可以在物理层传输的信号。
信号处理:以太网PHY芯片在发送端对数据进行相应的调制、编码等处理,以确保信号能以正确的格式在物理层进行传输。在接收端,它进行相应的解调、解码等操作,将接收到的信号还原为原始数据。
物理层管理:以太网PHY芯片管理物理层的参数和状态,如速率、双工模式、半双工模式等。它还负责检测和处理物理层的错误,如信号质量、数据冲突等。
自动协商:以太网PHY芯片支持自动协商机制,用于确定最佳的通信参数,如速率、双工模式等。这有助于确保通信的稳定性和效率。
电源管理:一些以太网PHY芯片还支持电源管理功能,允许设备在低功耗模式下工作,以提高能效。
集成度高:以太网PHY芯片通常集成了许多其他必要的组件,如变压器、滤波器等,以提供完整的物理层解决方案。
车载以太网的交换机芯片
车载以太网的交换机芯片是实现车载以太网通信的关键组件之一。车载以太网交换机芯片的主要功能包括:
数据交换:车载以太网交换机芯片能够实现多个节点之间的数据交换,支持全双工通信模式,能够同时进行数据接收和发送。
地址学习和过滤:车载以太网交换机芯片具有地址学习和过滤功能,能够根据MAC地址进行数据包的转发和过滤,实现快速的数据交换和传输。
流量控制:车载以太网交换机芯片能够实现流量控制功能,避免数据包的丢失或重复,保证数据传输的稳定性和可靠性。
安全管理:车载以太网交换机芯片能够实现安全管理功能,对数据包进行加密和解密,保证数据传输的安全性和保密性。
诊断和管理:车载以太网交换机芯片能够实现诊断和管理功能,方便对交换机进行配置和管理,同时能够提供故障诊断和修复功能。
目前,市面上已经有多家厂商推出了车载以太网交换机芯片产品,如Marvell、NXP、Microchip等。这些厂商的交换机芯片产品已经广泛应用于车载以太网通信系统中,为汽车的安全性和可靠性提供了保障。
车载以太网的交换机芯片是实现车载以太网通信的关键组件之一,其性能和质量直接影响到汽车的安全性、舒适性和可靠性等方面。未来随着汽车智能化和电动化的发展,以太网在汽车通信领域的应用将越来越广泛,对相关芯片的需求也将持续增长。
4)中国以太网交换芯片使用场景整体分析
以太网交换芯片下游应用场景分为企业网用以太网交换设备、运营商用以太网交换设备、数据中心用以太网交换设备以及工业用以太网交换设备四类,以上应用场景的具体细分应用领域如下:
①企业网用以太网交换设备:可分为金融类、政企类、校园类;
②运营商用以太网交换设备:可分为城域网用、运营商承建用以及运营商内部管理网用;
③数据中心用以太网交换设备:可分为公有云用、私有云用、自建数据中心用;
④工业用以太网交换设备:可分为电力用、轨道交通用、市政交通用、能源用、工厂自动化用。
市场竞争格局
全球以太网交换芯片自用厂商以思科、华为等为主,其自研芯片主要用于自研交换机,而非用于供应予其竞争对手。此外,自用厂商亦同时外购其他厂商的商用以太网交换芯片。
思科为以太网交换机行业的领军者。在思科的发展初期并没有成规模的商用以太网交换芯片供应商,因此思科通过自研以太网交换芯片的方式配合自研交换机的技术演进。
在以太网交换芯片市场寡头竞争的情况下,其他网络设备商亦往往不会采用其主要竞争对手的芯片方案、依赖竞争对手的方案构建交换机,从而丧失自身核心竞争力,而倾向于选择商用以太网交换芯片厂商的芯片方案。因而自用以太网交换机厂商自研芯片的情形当前未对发行人经营构成不利影响,未来构成不利影响的可能性亦较小。
在商用方面,随着全球以太网交换芯片市场的扩大,自用厂商已无法满足下游日益增长的需求,因此全球范围内涌现出博通、美满、瑞昱、英伟达、英特尔、盛科通信等以太网交换芯片商用厂商,部分自用厂商亦通过外购商用芯片丰富自身交换机产品线。
从增长率来看,全球商用以太网交换芯片市场2020-2025年年均复合增长率为5.3%,显著高于全球自用以太网交换芯片市场同期年均复合增长率1.2%,未来以太网交换芯片市场规模的主要增量将来自商用厂商,其主要原因如下:
①以太网交换芯片天然形成的技术、资金壁垒,使得部分自用厂商难以在自身体量下同时支撑芯片的高额研发投入、高速迭代,且难以实现经济效益,从而影响自用市场的增长;
②全球以太网交换芯片未来增量主要来自于数据中心市场,而数据中心市场商用厂商起步较早,获得先发优势;
③受国际贸易摩擦引起的产业链震荡影响,自用厂商相对于商用芯片厂商对于产业链协同和产能紧缺的风险抵抗能力更低,从而影响自用芯片的增长。
海外龙头布局较早,国内加速追赶
海外龙头如博通、Marvell、思科等凭借其体量积累的技术和资金优势,较早开启交换芯片的布局,国产企业如盛科通信相较于行业全球龙头博通、Marvell等,产品线覆盖领域、最高端产品指标方面仍有差距,暂时落后于行业龙头。
博通:全球商用交换芯片龙头
公司深耕交换芯片13年,拥有Tomahawk、Trident、Jericho三大系列交换芯片,分别应用于高、中、低端场景需求,主要发展高端产品线,主要应用于数据中心网络和运营商网络,在高端领域占据较高市场份额。Tomahawk系列具有带宽较高,适用于超大规模数据中心,产品以2年为周期不断迭代升级;Trident系列具有多功能特点,带宽相较Tomahawk稍低,多用于企业和云;Jericho系列带宽较低,主要面向服务提供商。2022年8月博通发布了Tomahawk5系列网络芯片,这是市面上首个可量产的51.2Tbps带宽的交换芯片,主要针对超大规模企业和云构建者商用交换机和路由器芯片市场。Tomahawk5带宽达到51.2T,可支撑64个800G的端口或128个400G端口,数据交换性能是Tomahawk4的两倍。Tomahawk5采用5nm制程,可以支持传统的可插拔光模块,也可以选择CPO(光电共封装技术)来减少光模块和交换芯片间的距离,提高传输效率。
Marvell:交换芯片领先
公司主打Teralynx、Prestera两条旗舰产品线,Prestera面向企业与边缘数据中心市场,Teralynx则面向云端数据中心。2021年10月公司收购Innovium,其主营业务为面向数据中心的以太网生产交换机ASIC,该收购助力Marvell补充其数据中心产品组合,为其云客户提供服务,进一步加强公司在网络交换芯片领域的优势。
Marvell同样于2023年3月推出了一款号称“业界延迟最低”的可编程交换机芯片Teralynx10。这是一款专为800G时代设计的51.2Tbps交换机芯片,专门解决运营商超高带宽的问题,可应用于数据中心网络中的叶脊交换机,满足高性能计算的需求。Teralynx10单芯片尺寸为93X93mm,输入/输出数量为8855,并使用业界最新LowDk/Df材料设计PCB板材。
英伟达:加快交换机研发,适配AI需求
英伟达在交换机领域同时布局Ethernet和InfiniBand两大技术方案。公司针对IB方案推出NvidiaQuantum交换机产品,可提供海量吞吐以及出色的网络计算能力,面向高性能计算、AI等场景,其中高端QM9700系列交换容量达到51.2T,单端口容量达到400G;针对以太网方案,Nvidia于2022年春季发布会推出了Spectrum-X以太网交换平台,其中核心组成Spectrum-4交换机可为大规模云计算、企业人工智能、模拟仿真提供性能更优化的端到端以太网网络平台,实现大规模、高性能、模拟仿真功能,完美契合数据中心需求。Spectrum-4交换机搭载的交换芯片容量51.2Tbps,端口速率800G,专门为AI设计研发,该芯片基于4nm制程工艺,内部含有超过100亿个晶体管以及简化的收发器设计,功率约为500W。
思科:全球交换机龙头,自研芯片领先
Cisco是交换机行业的全球霸主,市占率超过40%为全球第一,较早开启交换芯片的自研之路。思科1999年收购半导体公司StratumOneCommunications,之后通过多次收购半导体相关公司,积累了丰富的人才和技术资源。2019年12月,思科首次推出了SiliconOne芯片架构,当时称其规划是为“未来网络奠定通用基础”,该芯片应用场景包括模块化系统、中央系统等。
Cisco于2023年6月推出了用于AI超级计算机的SiliconOneG200/G202系列网络芯片:G200交换容量51.2Tbps,端口达到800G;G202特性与G200完全一致,但交换性能只有G200的一半。G200采用5nm制程工艺,可控性强,且具有可编程特性,大大增加了使用场景的灵活性。
盛科通信:国内商用交换芯片龙头
产品线覆盖:公司目前主要以太网交换芯片产品覆盖100Gbps~2.4Tbps交换容量及100M~400G的端口速率,在企业网络、运营商网络、数据中心网络和工业网络得到了规模应用。目前公司相较于行业全球龙头博通、Marvell等,产品线覆盖领域、最高端产品指标方面仍有一定差距,尚未实现HPC及超大规模数据中心的场景覆盖,暂时落后。
最高交换容量芯片对比:在数据中心领域,盛科通信已推出TsingMa.MX(交换容量2.4Tbps)、GoldenGate(交换容量1.2Tbps)等系列,且均已导入国内主流网络设备商并实现规模量产。目前公司的面向超大数据中心的高性能交换产品Arctic系列尚在试生产阶段,最高交换容量达到25.6Tbps,我们预计将在2024-2025年推出。
裕太微(688515.SH):主营PHY芯片,交换芯片小批量出货,优质在于集成自主PHY芯片的IP
根据近期的投资者调研纪要显示,裕太微自主研发的千兆5口交换芯片已实现小批量出货,由于验证周期拉长,6月初才完成部分客户的验证,并且还有许多客户在测试导入中,该产品应用于家庭端,受整个消费市场影响较大,上半年相关收入低于预期。六口交换产品和八口交换产品也将于今年年底推出量产样片。同时车载TSN交换芯片也在加紧研发。裕太微宣称希望3~5年内交换芯片和PHY芯片营收能接近1:1的比例。
04
网络设备商向上游扩展的情况
中国以太网交换机行业主要厂商包括新华三、华为、锐捷网络、思科、迈普技术、烽火通信、中兴通讯等。其中,自用厂商在自研以太网交换芯片用于自研交换机的同时,亦同时外购商用以太网交换芯片;新华三、中兴通讯、烽火通信自研路由核心芯片,以应对路由核心芯片厂商陆续关闭或被收购、无稳定芯片供应的情况,但仍主要通过外购商用以太网交换芯片满足需求。
路由核心芯片主要运用于路由器,但亦可少量运用于特定应用场景的交换机中;此外,烽火通信近期推出数款定位低端接入的以太网交换芯片;根据公开渠道信息,锐捷网络、迈普技术等厂商不存在自研以太网交换芯片的情况。
基于以太网交换芯片较高的进入壁垒、与交换机的技术难点差异以及产业链资源差异使网络设备商难以进入行业、网络设备商当前自研的路由核心芯片无法实现到以太网交换芯片的简单切换、网络设备商的自研芯片难以实现经济效益等原因,网络设备商向上游扩展的情况对以太网交换芯片行业影响较小,具体如下:
①以太网交换芯片具备较高技术和资金壁垒,且技术难点与以太网交换机存在较大区别,网络设备商难以进入以太网交换芯片行业
A、以太网交换芯片存在较高的技术和资金壁垒
以太网交换芯片设计具备较高的技术壁垒。随着芯片集成度不断提高,海量逻辑造成研发工程难度提高,研发周期延长。以太网交换芯片市场应用周期达8-10年,需要长期的技术与人才积累,要求业内企业具备较强的持续创新能力。以太网交换芯片是计算、存储、智能连接的枢纽,需要与众多其他厂商的以太网交换芯片、网卡、光模块等器件互联互通,这对以太网交换芯片的稳健性和可靠性提出了严苛的要求。此外,在先进制程的研发方面,研发环节往往需要大量且长期的人力资本投入,并承担若干次高昂的工艺流片费用。而上述高额的各类研发支出将在企业经营过程中持续性发生。
B、以太网交换芯片和以太网交换机的技术难点存在较大区别
以太网交换芯片的技术难点主要集中于高性能交换芯片架构设计、高密度端口设计、针对不同应用场景的流水线设计,并研发配套的SDK软件接口。为了支撑以太网交换芯片的大规模应用,需要在产品的性能、特性、成本和功耗之间进行平衡,并同时要求厂商具备大规模数字专用芯片的验证、测试、规模量产能力。
而以太网交换机的技术难点主要集中于硬件和软件领域,在硬件设计上,需要基于交换芯片进行硬件原理图设计、布局、调试和测试,在软件方面,需要基于交换芯片的SDK以及研发二层、三层协议栈、堆叠协议。最后基于交换机软硬件研发成果,进行大规模测试,保障产品稳定性。
C、以太网交换芯片和以太网交换机的上游产业链资源完全不同
以太网交换芯片厂商主要面对晶圆厂、封测厂等供应商,从芯片设计至流片至大规模量产等环节均需要以太网交换芯片厂商和供应商的长期投入和高度协作;网络设备商主要面对以太网交换芯片厂商、CPU厂商、其他原材料供应商及ODM/OEM厂商,通过协调各类原材料供应商及ODM/OEM厂商实现整机制造。
因此以太网交换芯片和以太网交换机的上游产业链资源完全不同,网络设备商进入以太网交换芯片行业,重新构建产业链需要较高时间成本且存在较大难度。而在产能较为紧张的大环境下,网络设备商在供应商处获得产能席位以及后续保障充足产能均存在未知数。
因而,作为大规模数字专用芯片,以太网交换芯片天然具备研发难度高、验证周期长、资金投入大等壁垒。此外,以太网交换芯片和以太网交换机的技术难点截然不同,厂商的产业链资源亦存在较大区别,使网络设备商难以通过自主研发进入以太网交换芯片行业。
②网络设备商当前主要研发的路由核心芯片而非以太网交换芯片,两类产品存在较大差异,难以实现从路由核心芯片向以太网交换芯片的简单切换
新华三、中兴通讯、烽火通信等厂商初始自研路由核心芯片的主要原因系高端路由领域具备较为广阔的市场,但由于路由核心芯片的投入产出比不足,路由核心芯片厂商陆续关闭或被收购,导致网络设备商仅能通过自研满足其高端路由器需求。以上厂商的初始考虑并非进入以太网交换芯片行业。
基于路由核心芯片构建的以太网交换机的功能相对较为单一,无法满足以太网交换机多应用领域的复杂需求。此外路由核心芯片与以太网交换芯片的应用场景、技术难点均存在较大差异,难以实现从路由核心芯片向具备复杂业务特性、可应用于多应用领域以太网交换芯片的简单切换。
A、以太网交换芯片与路由核心芯片的应用场景区别
以太网交换芯片运用于交换机中。交换机工作在OSI模型二层及三层,需要覆盖大量复杂的二层和三层功能,一般通过高可配置的专用以太网交换芯片方式实现。以太网交换芯片一般内置大量存储单元的单芯片方案,从而满足高带宽、高能效比、高性价比等要求。路由核心芯片运用于路由器中。路由器应用于网络之间的连接,因而要求高表象、高灵活性,通过可编程的路由核心芯片以多芯片协作方式解决。
B、以太网交换芯片与路由核心芯片的技术难点区别
以太网交换芯片通过将大量功能专用逻辑化、最优化以达到高带宽、多功能、低成本,其难点在于需要海量的功能特性相辅相成、协同工作,需要坚实的行业基础以及长期的试错形成技术积累。路由核心芯片以集成可编程CPU核方式实现灵活性,需克服大量CPU内核协同的难点,而非通过最优的逻辑化实现。路由核心芯片的技术难点较为集中,因此对于行业基础和技术经验的要求相对较低。
③网络设备商的自研芯片难以实现经济效益
A、以太网交换芯片研发投入较大,网络设备商实现的收益难以覆盖成本
以太网交换芯片的研发周期较长,需要长期的技术与人才积累以及高额的研发投入,体量相对较小的网络设备商通常无法支撑较高的投入成本,而倾向于不向上游延伸产业链。即使网络设备商自研以太网交换芯片形成规模量产,其自身交换机整机销售形成的利润体量亦较难对芯片前期的高昂投入形成有效覆盖。
B、网络设备商的自研芯片难以对竞争对手实现销售
中国以太网交换机市场呈现寡头竞争格局,根据IDC数据,2020年,中国交换机市场前五大品牌厂商分别为华为、新华三、锐捷网络、思科和迈普技术,其市场份额分别为40.0%、36.2%、12.2%、5.4%和1.5%,前五大厂商集中度达到95.3%。
在寡头竞争的情况下,即使部分网络设备商自研以太网交换芯片形成规模量产,其他网络设备商亦往往不会采用其主要竞争对手的芯片方案、依赖竞争对手的方案构建交换机,从而丧失自身核心竞争力,而倾向于选择商用以太网交换芯片厂商的芯片方案。另一方面,网络设备商通过长期研发、高额投入、长期验证形成的自研以太网交换芯片方案更倾向于构建自研以太网交换机,而非为竞争对手提供其优势方案。
从历史情况来看,华为和思科的自研以太网交换芯片主要运用于自有以太网交换机中,而非用于供应予其竞争对手。可见网络设备商一方面不会采购其他竞争对手的自研芯片,其自研芯片亦不会选择对外销售。
05
“UEC”成立,多家巨头拥抱开放式以太网
随着AI和高性能计算工作负载的快速发展,传统以太网在提供智算网络互连上存在较多的局限性,而目前超级计算领域主流之一的Infiniband技术,因为历史演进原因变成封闭技术,无法充分利用当前繁荣的以太网生态。因此以太网技术的进一步演进成为必然。
2023年7月,由Linux基金会主办的超以太网联盟(UltraEthernetConsortium,UEC)正式成立,旨在超越现有的以太网功能。UEC的创始成员包括AMD、Arista、博通、思科、Eviden、HPE、Intel、Meta和微软,都拥有数十年的网络、人工智能、云和高性能计算大规模部署经验。
2023年11月21日,超以太网联盟迎来新成员,包括阿里云、百度、字节跳动、戴尔、华为、JuniperNetworks、Marvell、新华三、诺基亚、腾讯等27家公司。
UEC致力于打造一个与超级计算互连一样高性能、与以太网一样普遍且经济高效、与云数据中心一样可扩展的“新以太网”。UEC基于当前以太网的开放、可互操作、高性能的通信架构,提供针对高性能计算和人工智能进行优化的高性能、分布式和无损的传输层协议,满足HPC和AI分布式计算的高带宽和低延迟需求,提供最佳网络利用率。预计UEC未来将会从四个纬度进行现有以太网技术的演进开发。
(1)物理层:制定增强以太网物理层、底层介质和物理层客户端(链路层)的性能、延迟和管理的规范。(2)链路层:开发增强以太网链路层性能、延迟和管理的规范。(3)传输层:制定AI/HPC传输规范,增强以太网的吞吐量、延迟、可扩展性和管理。(4)软件层:为各种AI/HPC用例或应用程序开发规范和/或软件API和/或开源代码。范围包括但不限于:远程内存访问优化、网络计算(INC)以及安全、管理和存储。
2023年8月,在IEEEHotInterconnects(HOTI,关注先进的硬件和软件架构、各种互连网络实现)国际论坛上,Intel、Nvidia、AMD等巨头进行了“EtherNETorEtherNOT”的讨论,多家厂商坚定看好以太网方案。我们认为在未来很长一段时间内,以太网凭借其通用性及开放性,仍会占据市场主导地位。
英特尔看好以太网的开放性
英特尔高级研究员、网络和边缘组首席硬件架构师BradBurres在2023HOTI会议的讨论中明显偏向于EtherNET。BradBurres认为,无论采用何种技术,都需要一个开放的生态系统来降低整个行业的成本,并实现所需的软件基础设施。而随着协议的成熟,除非另一个开放的标准结构立即出现,否则以太网将成为赢家。
AMD认为“Ethernetistheanswer”
与英特尔相似,AMD同样更看好以太网方案。AMD数据中心GPU系统架构师FrankHelms在2023HOTI会议上列举了全球超级计算机TOP500榜单中第一名Frontier、第二名Aurora和第五名LUMI,它们都基于以太网的HPECraySlingshot-11网络结构进行连接。AMD坚信“Ethernetistheanswer”。
2023年12月7日,AdvancingAI发布会在美国加州圣何塞举行,会上AMD正式发布了其最新一代AI产品MI300A与MI300X,直接对标英伟达之前推出的H100。此外AMD发言称“Ethernetistheanswer”,坚信以太网拥有更好的性能以及更好的大规模集群能力,在网络开放性上远胜其他方案。
Oracle全面拥抱以太网
Oracle坚决使用以太网而非IB。Oracle云基础设施(OCI)利用NvidiaGPU和ConnectXNIC构建基于ROCEv2RDMA的超级集群。OCI构建了一个独立的RDMA网络,并针对AI和HPC工作负载进行了微调的自定义配置文件。
交换芯片国产替代加速
我们看好在数字经济政策不断落地、AI产业爆发的背景下,国产厂商进一步抢占以太网交换芯片的市场份额,加速国产替代。主要逻辑如下:
(1)国内交换芯片厂商均为以太网组网路线,契合国内主要需求。目前业内交换机主要分为以太网交换机和IB交换机两种。以太网组网诞生伊始仅仅是为了追求夏威夷群岛上多系统的信息互通,其优势在于考虑到lossy有损网络的丢包情况,容错率更高;但同时这种允许丢包的lossy机制难以支持超算数据中心。而IB组网最初就是为了消除HPC场景下集群数据传输的瓶颈,用的是端到端的lossless的无损方案,更加适合如今的超算中心;但其网络部署成本高于以太网且应用场景的通用性较低。
上世纪90年代起IB与以太网就已经开始互相竞争,最终以太网凭借着通用性和灵活性成为市场的主导,到2019年英伟达收购Mellanox之时,Mellanox就本已经是市面上仅剩的InfiniBand通讯产品主要供应商了。
目前仅有部分海外云厂商布局IB交换机,以英伟达为主导;而思科、arista等交换机巨头自建立之初便坚定聚焦以太网方案。国内厂商则由于以太网交换机的通用性较高及成本相对较低,聚焦于以太网交换机。国产厂商如盛科通信等均生产以太网交换芯片,因此本土产品与国内需求相契合。
(2)本土厂商主导交换机市场,供应链安全可控需求迫在眉睫。与交换芯片的海外巨头垄断格局不同,我国交换机市场中本土厂商市占率较高。根据IDC数据统计,2022年中国交换机市场由华为、新华三、锐捷、思科、中兴通讯等龙头厂商占据90%以上的主要份额。
华为、思科、中兴通讯以自研芯片为主,其中中兴通讯较早成立中兴微电子启动自研之路,不断加大自研投入和比例,于2011年推出第一代自研交换网套片,目前已完成最新一代交换套片SA2/SF2的研发,进一步夯实数据产品发展的基石;而新华三、锐捷网络产品所用交换芯片均以外采为主。
根据锐捷网络招股书,锐捷网络在2019~2022H1期间,接入交换机、汇聚交换机大约50%使用国产芯片,核心交换机芯片则基本以国外厂商供应为主。交换机作为我国企业网、数据中心等各类网络环境中的核心设备,其质量性能及可靠程度直接影响整体网络环境的安全性,因此整机厂商选择自主可控的国产零部件供应商成为重中之重。我们认为未来国产交换机厂商将逐渐加速导入本土交换芯片,确保下游网络应用的安全可控。
(3)我国网络芯片自给率仍需进一步提升。我国作为全球核心的半导体芯片消费国家,芯片对外依存度高,高端芯片严重依赖进口,芯片自给率较低。根据ICinsights的数据显示,2015年以来我国芯片自给率从15.9%提升至17%,但总体仍处于较低水平;同时根据前瞻产业研究院的测算显示,2019年我国核心网络设备芯片自给率低于20%,仍需进一步提升。
综上所述,我们认为目前市占率较低的国产厂商有望进一步抢占市场份额,加速国产替代。建议关注自研、商用两条主线,推荐近年来产品突破较快的行业龙头。
06
51.2T交换芯片“决战紫禁之巅”
博通、思科、Marvell、英伟达
当前全球范围最“顶级”的交换芯片性能是51.2T,主要的应用场景包括:AI大模型训练场景400G\800G互联、云技术超大规模400G接口互联SPIN+LEAF互联场景;
1、AI大模型训练场景400G\800G互联:128个400G接口交换机,64个800G接口交换机;
2、云技术超大规模400G接口互联场景:128个400G接口交换机;
目前发布51.2T交换芯片的厂商只有4家,分别是:博通、思科、Marvell、英伟达,以下是按照各家芯片的发布时间排序。
1、英伟达Spectrum-4
2022年6月,英伟达隆重发布了新一代以太网平台NVIDIASpectrum-4。该平台由NVIDIASpectrum-4交换机系列、ConnectX-7智能网卡、NVIDIABlueField-3DPU和DOCA数据中心基础设施软件组成,能够大幅加速大规模云原生应用。
作为全球首个400Gbps端到端网络平台,NVIDIASpectrum-4的单芯片交换吞吐量达到了51.2Tbps,比上一代产品高出4倍,能够为规模大数据中心基础设施提供超高的网络性能和强大的安全性。由Spectrum-4加持的SN5000交换机,最高可以支持128个400GbE端口或64个800GbE端口。
为了实现更好的AI智能管理运维,NVIDIASpectrum-4还优化了RoCE网络架构,并提供自适应路由(AdaptiveRouting)和增强拥塞控制。其加密带宽不但达到了令人惊叹的12.8Tbps,而且还可以支持硬件级MACsec和VXLANsec。这样一来,搭载了NVIDIASpectrum-4的数据中心不仅各种应用跑得更加畅快,而且在网络与安全性能上也有了更加可靠的保障。
值得一提的是,考虑到不同企业的实际情况,NVIDIA还为用户准备了全系列的智能网卡,实现了从10G到400G速率的全覆盖(10/25/40/50/100/200/400G),并且提供了包括CumulusLinux、Mellanox系列产品在内的丰富网络OS、软件及工具。英伟达收购Mellanox和CumulusNetworks所产生的巨大价值,也在NVIDIASpectrum-4身上得到了极佳的展现。
2、博通Tomahawk5
2022年8月,博通发布了业内首款商用51.2T容量的交换芯片Tomahawk5,采用5nm制程,由台积电代工生产。采用Monolithic,裸die封装,每100Gbps功耗小于1W。
Tomahawk5在支持传统可插拔光模块的基础上,更进一步兼容了CPO封装。与传统的可插拔光模块相比,CPO封装能够降低高达50%的功耗,这一显著优势使得数据中心在追求高性能的同时,也能实现更低的能耗。此外,Tomahawk5还支持多种配置的交换机,包括64端口800Gbps、128端口400Gbps和256端口200Gbps,其性能是前代产品TomaHawk4的两倍,充分满足了数据中心不断增长的网络需求。
在Tomahawk5包含512个SerDes以每秒100Gb的速度运行,共同构建了高达51.2Tb/秒的带宽。这一强大的性能使得Tomahawk5能够轻松应对数据中心日益增长的数据传输和处理压力。
除了卓越的性能表现外,Tomahawk5还针对超大规模数据中心和云构建者的需求,提供了丰富的功能特性。其中包括网络虚拟化和分段技术,这些技术能够帮助数据中心实现更灵活的网络架构和更高效的资源管理。此外,Tomahawk5还支持单通道VxLAN路由和桥接功能,为数据中心提供了更为强大的网络扩展能力和更高的传输效率。而其独特的“认知路由”功能则能够智能地避免网络拥塞,从而缩短作业完成时间,提升整体运行效率。
3、MarvellTeralynx10
2023年3月Marvell推出了用于800Gb/秒交换机的51.2T性能的Teralynx10交换芯片。据Marvell介绍,Teralynx10是更大、更胖(fat)的交换机ASIC,是一款专为800GbE时代设计的51.2T可编程5nm交换机芯片,旨在解决运营商带宽爆炸的问题,同时满足严格的功耗和成本要求。它可适用于下一代数据中心网络中的leaf和spine应用,以及AI/ML和高性能计算(HPC)结构。
Teralynx10具有512长距离(LR)112GSerDes。提供全面的数据中心功能集,包括IP转发、隧道、丰富的QoS和强大的RDMA。它还提供可变的灵活转发,使运营商能够随着网络需求的发展对新的数据包转发协议进行编程,而不会影响吞吐量、延迟或功耗。
Teralynx10采用了超低延迟结构,兼容Teralynx软件,而且还支持TeralynxFlashlight高级遥测技术,包括P4带内网络遥测(INT)。
Teralynx10单芯片尺寸为93X93mm,I/O数量为8855,在PCB设计部分,板材使用业界最新LowDk/Df材料,PCB结构设计上采用12+12+12的结构设计,其中中间12层均采用2OZ铜箔,以满足芯片供电需求。
值得一提的是,早期Marvell主要生产面向园区网场景的中低端交换芯片,而在2021年Marvell收购了云数据中心商业交换机芯片供应商Innovium。Innovium于2019年9月推出了Teralynx5芯片,速度范围从1Tb/秒到6.4Tb/秒,随后推出的Teralynx7直接与博通的“Tomahawk4”StrataXGS对标,2020年5月,Innovium推出了Teralynx8交换芯片,针对超大规模器和云构建器的叶、脊和数据中心互连(DCI)用例,使用100Gb/秒PAM-4编码跨8Tb/秒到25.6Tb/秒在给定带宽下创建以太网端口。
4、思科SiliconOneG200
2023年6月思科高调发布了其51.2T芯片G200以及其对应的25.6T芯片G202,针对AI/ML网络做了大量特性优化,正式开启了与Tomahawk5/Jericho3/Spectrum4在AI高性能网络领域的竞争。
CiscoSiliconOneG200是一款5纳米、51.2Tbps、512x112Gbps的SerDes设备,具有可编程、确定性、低延迟等特性,且具备高级可见性和控制能力。CiscoSiliconOneG200提供了统一架构的优势,专注于基于以太网的增强型AI/ML和网络规模主干部署。
G200展示了业界首款完全定制的P4可编程并行数据包处理器,每秒能够启动超过4350亿次查找。它以全速提供SRv6Micro-SID(uSID)等高级功能,并支持复杂流程的完整运行到完成处理。这种独特的数据包处理架构确保了灵活性以及确定性的低延迟和功耗。
G200拥有512个以太网MAC地址,比博通Tomahawk5多一倍的MAC地址(Tomahawk最多有256个MAC地址),支持100G及以下接口更大规模的组网;
思科从1999年收购半导体公司StratumOneCommunications,之后通过多次收购半导体相关公司,积累了丰富的人才和技术资源。2019年,思科掀开了公司自研芯片的轰轰烈烈新序幕,并于当年12月首次推出了SiliconOne芯片架构,当时称其目标是为“未来网络奠定通用基础”。
07
行业技术水平及特点
目前,网络技术已由移动互联时代全面进入全互联时代。随着云计算、大数据、物联网、人工智能技术的快速发展以及传统产业数字化转型,人类社会从移动互联时代进入人与人、人与机器、机器与机器之间无处不在的全互联时代。万物互联的全互联时代支撑云计算为中心、边缘计算为外延,无处不在的连接支撑算力在云、边、端的灵活运转。
全互联打破了企业网络、运营商网络、数据中心网络和工业网络的边界,将各种网络技术体系融会贯通。全互联时代对以太网交换芯片提出了全面的性能提升需求,包括高性能交换容量、高密度高速端口、跨网络体系技术、网络安全、智能化自动化统一运维、端到端确定性网络以及网络可编程能力。
(1)高密度400G端口支撑下一代数据中心内部互联
全互联时代,数据计算量大幅提高,推动传统产业数字化的转型和云计算、大数据、物联网、人工智能等技术产业的快速发展,对网络带宽持续提出新的要求。对于数据中心而言,全国多地均拟建立大量公有云和私有云的数据中心集群,需要极大带宽将数据中心进行内部互联,以便于数据资源的迁移,而高密度400G端口能帮助公有云在成本和网络质量两个方面进行提升。当前的100G端口已无法满足带宽需求,从100G端口迁移至400G端口是向数据中心注入更多带宽的最佳方案。400G端口将成为下一代数据中心网络内部主流端口形态。
(2)跨网络体系技术融合推进全面以太网化
全互联打破了企业网络、运营商网络、数据中心网络和工业网络的领域边界,弱化专有网络技术,各应用领域实现技术融合,促使四个应用领域全面推进以太网化。其中,企业网络使用运营商接入网的PON技术实现全光网络,实现高密度、低成本的网络带宽提升;运营商网络使用数据中心互联的FlexE技术实现与传统OTN光传输技术同能力的高带宽和确定性;数据中心采用运营商网络的单芯片组网方案、开放光网络,破繁从简地实现高性能和低时延传输;工业网络使用TSN和运营商边缘计算的确定性技术,代替带宽不足的工业专用总线技术、SDH等网络技术。
(3)保障网络安全成为基础工程
全互联形成了人与人、人与机器、机器与机器之间无处不在的网络连接,保障网络安全将成为网络基础工程。网络安全要求以太网交换芯片具备零信任的接入能力,要求SDN技术具备灵活的流管理策略,以支撑关键业务端到端的网络安全能力,保障零信任的全局网络管理。
(4)智能化、自动化运维支撑网络弹性扩张管理需求
数据中心服务器面临每年百万级增量,工业物联网面临海量节点互联,人工运维方式已无法满足需求,数据中心的高吞吐和工业网络的确定性带来新的网络运维挑战,智能化、自动化运维成为唯一解决途径。智能化、自动化网络运维需要海量数据样本作为基础,这对以太网交换芯片的网络信息挖掘能力如芯片的缓存、时延、业务流异常状态、基于全局路径状态分析提出更高要求,以此形成针对网络最深入、最全面的信息,支撑网络管理体系的进一步演化。
(5)端到端确定性网络加速工业4.0落地
工业网络具备高带宽、标准化、扩展性等优势,陆续对传统工业总线实现替代。但由于以太网技术的原理为包分复用,需要突破TSN技术和5G切片技术等新技术以满足确定性时延的需要。TSN技术为网内连接提供了确定性时延转发技术,5G切片技术为网间连接提供了确定性时延技术。在产业界的共同努力下,TSN标准趋于成熟,5G切片技术走向落地,端到端的确定性时延技术将支撑工业4.0的大规模落地。
(6)网络技术高速迭代需要网络具备更强的可编程能力
随着5G、数据中心、工业网络等网络应用的快速发展,传统标准确定、芯片研发、整机研发到规模部署的周期无法满足下游应用快速迭代的需要。一方面,白盒化等新产业模式使最终用户直接面向芯片开发,网络可编程成为解决网络痛点和网络优化的重要手段,例如INT、iOAM等网络可视化技术演进;另一方面,服务器形成的虚拟化网络希望卸载到交换机网络中,以提供更高的性能,需要以太网交换芯片提供可编程能力,并提供高级编程语言界面。
(7)AI驱动高速率交换芯片逐渐成为主流
近年来AI、云计算等技术产业的发展,驱动相关行业数据量快速增长的同时,对于通信网络提出了新的挑战。AI模型通常是采用分布式训练的方式进行计算,分布式训练需要多台主机之间同步参数、梯度,以及中间变量。对于大模型,单次的参数同步量一般都在百MB~GB的量级,参数量巨大。
考虑到大模型巨大的数据量,除了“高带宽”,大模型训练还对于网络提出了“低延时”的需求。大模型训练一般会将数据并行、流水线并行、张量并行等多种并行模式混合使用,以充分利用集群的算力。然而所有的并行模式都会涉及“AllReduce”集合通信。多个“AllReduce”需要完成每一个点对点通信,因此集合通信存在“木桶效应”,完成时间由其中最慢的一段通信时间决定。任何一条链路的负载出现不均匀的情况,都会导致网络拥塞,大幅增加时延,严重影响训练效率。
RDMA时延更低并提供更高带宽,成为破局关键技术。传统TCP网络因为主机侧协议栈开销大,无法充分利用网络带宽。RDMA通信技术通过网卡硬件实现通信控制,绕过了主机侧协议栈,让一台主机可以直接访问另外一台主机的内存,可以将用户应用数据直接传入服务器存储区,因此既避免了协议栈内存拷贝,又节约了CPU的开销。RDMA通信相比TCP可降低通信时延,且数据吞吐量更大,契合大模型GPU训练的场景。
目前实现RDMA技术主要有InfiniBand和RoCEv2两种方案,均可显著降低端到端时延。
RDMA技术带来的高带宽驱动交换机高速化。RDMA技术让一台主机可以直接访问另外一台主机的内存,消除了外部存储器复制和上下文切换的开销,因而能解放内存带宽,使单位时间内网络可传输的数据量大幅增加。更多可传输的数据量推动了业界对于交换机“高速化”的需求,例如新华三推出了支持RoCE的以太网交换机,交换机的端口从100G向着400G演进。
高速率交换机出货量逐步上升。根据IDC的数据,全球及中国交换机市场中,速率100M以下的低速率端口将在2024年后逐步退出市场,千兆端口依旧为市场主流,而10G以上速率端口出货量将逐步上升。
高速率交换芯片需求激增:交换芯片直接决定整机的交换容量、端口速率等核心性能指标,“高速化”的市场需求趋势与交换机相似。中国商用交换芯片市场中,100G及以上的以太网交换芯片需求逐渐增多。根据灼识咨询的数据,预计至2025年,100G及以上的中国商用以太网交换芯片市场规模将大幅增长,占比将分别达到44.2%。
(8)以太网最大限度地提高存储网络性能
随着数据生成的不断增加,线性性能扩展已成为横向扩展存储的绝对要求。存储网络就像汽车道路系统:如果道路不是为速度而建造的,那么汽车的潜在速度就无关紧要了。即使是法拉利在充满障碍的非铺装的土路上也会很慢。
连接存储节点的以太网网络架构可能会阻碍横向扩展存储性能。NVIDIA加速以太网可以消除性能瓶颈,从而为一般应用程序,特别是AI/ML实现最高的存储性能。
横向扩展存储需要强大的网络
全球每秒有54000张照片被拍摄。当您阅读本文时,这一数字将会更高。无论您的业务是什么,您都有可能拥有大量需要存储和分析的数据,而且数据量每天都在增长。
以前使用越来越大的存储文件服务器的纵向扩展方法已被横向扩展方法所取代,以提供在容量和性能方面线性扩展的存储。
借助横向扩展存储或分布式存储,可以配置和连接多个较小的节点,使其成为一个逻辑单元。单个文件或对象可以分布在多个节点上。
当需要更大的规模时,可以轻松添加额外的存储节点,以提高存储容量和性能。这既适用于传统的企业存储供应商解决方案,也适用于软件和硬件独立采购的软件定义解决方案。
分布式存储实现了灵活的扩展和成本效益,但需要高性能网络来连接存储节点。许多数据中心交换机不适合存储的独特流量特性,实际上可能会削弱横向扩展存储解决方案的性能。
存储流量与传统流量的区别
对于许多用例来说,网络流量是一致且同构的,传统以太网就足够了。但是,存储设备生成的流量可能会导致以下详述问题。
01网络压力
当前的存储解决方案受益于更快的SSD和存储接口,如NVMe和PCIeGen4(即将推出PCIeGen5),旨在提供更高的性能。
02拥塞
当存储网络架构饱和时,网络拥塞就不可避免,就像高速公路上交通量过多时造成道路拥堵一样。网络拥塞对于横向扩展存储来说尤其成问题,因为每个存储节点都需要提供快速的数据传输。但当出现拥塞时,许多数据中心交换机都存在公平问题,其中一些节点的速度会比其他节点慢得多。单个文件或对象通常分布在多个节点上,因此任何降低单个节点速度的操作都会有效地降低整个集群的速度。
03突发流量
大多数存储工作负载都是突发的,会产生密集的数据传输,并在短时间内反复需要大量带宽。当这种情况发生时,网络交换机必须使用其缓冲区来吸收突发,直到瞬时突发结束,从而防止数据包丢失。否则,数据包丢失将需要重新传输数据,从而显著降低应用程序性能。
04存储巨型帧
传统的数据中心网络流量使用的最大数据包大小(MTU)为1.5KB。当横向扩展存储节点可以使用9KB的“巨型帧”时,它们的性能会更好,这样可以在提高吞吐量的同时降低CPU处理开销。许多使用商用交换机ASIC构建的数据中心交换机在处理巨型帧时表现不佳或不可预测。
05低延迟
提高存储IOP的方法之一是通过为基于闪存介质中的读/写操作实现几个数量级延迟降低。然而,当网络引入高延迟时,尤其是由于过度缓冲,这些昂贵的性能改进可能会丢失。
训练和推理都需要足够的数据量和高速访问,以确保GPU处理器足够快地输入数据,使其保持被充分使用。在训练期间,所有节点都会执行写操作,以提高模型的准确性。这导致了突发,使得交换机必须有效地处理拥塞。最后,较低的存储延迟使GPU能够更有效地处理计算任务。
为什么ASIC不适合存储流量
大多数数据中心交换机都是使用商用交换机ASIC构建的,这些ASIC针对传统的数据流量模式和数据包大小进行了成本优化。为了在实现带宽目标的同时保持低成本,以太网交换机芯片供应商通过使用分离缓冲区架构,这牺牲了公平性。
每个交换机都有一个缓冲区,用于吸收流量突发,并在发生拥塞时防止数据包丢失。常见的方法是拥有一个跨多个端口共享的缓冲区。然而,并非所有共享缓冲区都是相同的——存在不同的缓冲区架构。
商用交换机没有完全共享的缓冲区,而是使用入口共享缓冲区或出口共享缓冲区。
对于入口共享缓冲区,在一组传入端口和特定内存切片之间存在静态映射。这些端口只能使用分配切片中的内存,而不能使用整个缓冲区,即使缓冲区的其余部分可用并且没有人在使用它。
对于出口共享缓冲区,在一组输出端口和特定缓冲区内存切片之间进行映射。同样,每组出口只能使用其分配的缓冲区切片,而不能使用整个缓冲区。
对于这两种体系结构,保持在同一内存切片中的流与在内存切片之间传输的流存在行为的不同。如果许多流使用具有相同缓冲区的端口,那么这些端口将面临更高的延迟和更低的吞吐量,而使用缓冲区其他切片的流量将享受更高的性能。
存储性能取决于存储流量(和其他流量)使用的端口以及这些端口缓冲区切片的繁忙程度。这就是为什么使用分离缓冲区的交换机经常遇到公平性、可预测性和微突发吸收相关的问题。
为什么深度缓冲区交换机在存储方面未得到优化
深度缓冲区交换机通常指的是提供更多缓冲区(GB而不是MB)的交换机。深度缓冲区交换机通常被推广用作路由器,因为如果网络速度不匹配或出现多对一通信情况,它们可以吸收并保持大量流量突发。
但在大多数数据中心应用程序(包括横向扩展存储)中,深度缓冲区交换机会对性能产生负面影响,原因如下:
01作业完成时间
对于并行文件系统,响应速度最慢的存储节点决定了获取文件所需的时间。与具有切片的片上缓冲区的商用交换机ASIC不同,深度缓冲区交换机同时具有片上和片外缓冲区,并且它们都是切片的,而非完全共享的缓冲区。
想象一下,在流离开交换机之前,有多少种流进入交换机的方式。它们可以保持在一个片上内存切片内(速度最快),在片上内存切片间传输(速度较慢),或在片上和片外内存切片间传输(速度非常慢)。
所有这些流的行为都会有所不同,因此会导致存储流量的公平性和可预测性问题。由于这些问题会降低一个或多个节点的速度,因此会对作业完成时间产生负面影响,并降低整个分布式存储集群的速度。
02延迟
交换机缓冲区越大,每个数据包必须经过的队列就越长,延迟也就越大。深度缓冲区交换机的测试平均端口到端口延迟超过500微秒。与同代的完全共享缓冲区交换机相比,NVIDIASpectrum1的延迟仅为0.3微秒。而交换/路由数据包需要的时间是纳秒而不是微秒。
深度缓冲区延迟高出1000倍。您可能想知道,这只是发生在拥塞的时候吗?不会。在拥塞的情况下,深度缓冲区的延迟会高得多;事实上,最高可达20毫秒,或高出50000倍。对于数据中心之间的路由器来说,500微秒的延迟可能还可以,但在数据中心内,这意味着闪存存储性能的不可用。
03功率和成本
深缓冲区交换机即使在空闲时也需要数百瓦的功率才能运行,这使得其持续的运营成本更高。深度缓冲区交换机的初始购买成本也高得多。如果性能更好,这可能是合理的,但实际测试证明恰恰相反。
选择不合适的网络交换机会严重拖慢存储工作负载,使昂贵的快速存储变得像更便宜、更慢的存储一样。
内容来源:
https://mp.weixin.qq.com/s/avGWgQHolQTn7EwZfW8atQ
- THE END -
精品活动推荐
因文章部分文字及图片涉及到引用,如有侵权,请及时联系17316577586,我们将删除内容以保证您的权益。