AI网络为什么需要以太网?

谈思实验室 2025-01-13 17:54

点击上方蓝字谈思实验室

获取更多汽车网络安全资讯

我们正置身于一个日新月异的网络时代,每一次技术革新都引领着新的潮流。回顾过去,云服务作为一个划时代的重大技术革命,催生了全新的大规模网络和基础设施构建方法。在这一背景下,基于标准的以太网交换技术崭露头角,成为连接大型“scale-out”服务器集群的关键。

如今,人工智能革命正为云网络领域带来前所未有的变革。它不仅在规模和性能上提出了更高要求,还对低延迟和高带宽提出了迫切需求。尽管人工智能仍处于发展的初级阶段,但其潜力已经得到广泛认可。随着企业和个人纷纷采用这一技术来提升生产力,人工智能将在众多市场中持续壮大。这将不断推动云服务和企业的带宽、计算资源达到新的极限。为了应对这一挑战,我们需要积极构建新系统,以支持人工智能所需的海量数据和计算资源。

本文将深入探讨人工智能基础设施的关键发展趋势,并阐述如何将以太网等成熟技术与创新实践相结合,来应对当前面临的挑战。在人工智能网络基础设施不断发展的过程中,我们应关注以下几个方面:

  • 多样化的人工智能网络需求:随着人工智能应用的不断扩展,我们需要满足不同场景下的网络需求,包括用于训练和推理的大规模网络。

  • 以太网技术的持续创新:为了满足人工智能对网络规模的更高要求,我们需要不断推动以太网技术的革新和发展。

  • 企业基础设施的统一与优化:为了降低人工智能服务和应用的成本,企业需要部署统一的人工智能网络基础设施和运营模式。

接下来,让我们继续探索以太网将如何进化,以更好地满足高性能人工智能网络的需求。

01

人工智能繁荣下的新一代网络需求

人工智能正以前所未有的速度颠覆着云和IT行业。自2022年11月Chat GPT问世以来,这一领域便掀起了投资热潮,并持续吸引着公众的关注。在这一背景下,各大云提供商纷纷推出新产品和服务,以满足日益增长的人工智能需求。与此同时,大型企业也在积极探索生成式人工智能(GenAI)和其他AI用例,以期提升运营生产力和投资回报率(ROI)。

除了OpenAI的ChatGPT之外,很多大型云提供商也研发了自己的大型语言模型(LLM),如阿里的通义千问、百度的文心一言、谷歌的Gemini、Meta的Llama等。这些LLM及相关服务的大规模投资和推出,不仅展示了人工智能的巨大潜力,也推动了整个行业的发展。

然而,LLM的开发需要前所未有的计算和网络规模。为了满足这一需求,计算集群需要连接数千个GPU,并利用收集的海量数据进行模型训练。除了GPU之外,AI系统还需要额外的处理能力,如CPU、TPU等,以优化数据的处理和传输方式。

当然,大规模LLM只是人工智能领域的一部分,许多企业也在考虑其他人工智能选择。他们希望利用自己的数据进行重点用例的开发,通过采用小型语言模型(SLM)以及私有人工智能等多种方式。在某些情况下,还会存在混合解决方案,例如利用云提供商进行模型训练,同时保留数据和推理在私有系统上。

02

人工智能网络发展的关键要求

人工智能的崛起对云服务提供商和企业数据中心的基础设施需求产生了深远的影响。这一变革的核心驱动力在于数据,它是人工智能发展的关键“燃料”。数据的收集、保护与传输成为组织在探索人工智能新应用时必须面对的首要挑战。组织正权衡是否应与其他AI系统共享数据,或是仅依赖私有数据构建专属的人工智能模型,并探索所需的新型安全与网络基础设施以支撑数据的传输与存储。

以下是构建人工智能网络基础设施的首要考虑因素:

  • 速度。人工智能服务的快速发展正在加快对数据中心及边缘网络的速度需求,推动网络向400 Gbit/s乃至800 Gbit/s的新一代迈进。

  • 隐私和安全。网络必须高效处理数据,同时确保高端加密与多租户环境的安全性,这是保护数据隐私的关键。

  • 边缘推理。目前大家关注更多的是后端训练,但随着企业部署LLM或SLM及私有AI云混合方案,推理能力的前端部署将成为焦点。

  • 短JCT和低延迟。除了低延迟外,减少JCT至关重要,它可能因冲突和错误而延长。优化网络以提供无损传输,通过拥塞管理和负载平衡确保最有效带宽利用,是实现快速JCT的关键。

  • 灵活的集群。在AI数据中心,处理器集群可配置成多种拓扑结构,优化性能需避免层或区域间的超额订阅,减少JCT。

  • 支持多租户。出于安全考虑,AI网络需分离数据流。

  • 标准化架构。一般来说,人工智能网络由后端基础设施(训练)和前端(推理)组成。后端负责开发和训练模型,前端向客户提供结果。运营商可以通过基于以太网的通用性获得优势,包括允许后端和前端集群之间的技术重用等等。

当前,基于标准的、模块化的技术,特别是以太网,正吸引着越来越多企业的目光。以云数据中心为例,经济高效的以太网服务器和基于标准的scale up系统等组件已经推动了市场的蓬勃发展。Arista Networks的首席执行官Jayshree Ullal曾撰文讨论这些趋势,提及了“人工智能孤岛”现象,即前端与后端架构的差异问题。从另一个角度来看,孤岛现象将训练、推理和边缘市场的网络架构分隔开来,不利于整体的发展。

企业并不希望看到这种局面,因为不同架构意味着不同的堆栈或组件,这将阻碍标准化进程并影响经济性。为了推动大众市场的形成,价格应当呈现下降趋势而非上涨。鉴于InfiniBand主要由单一供应商主导,无法享受开放式以太网生态系统所带来的市场竞争定价优势,开放式以太网能够提供更加出色的规模经济效应。

Arista提倡构建一个“人工智能中心”,旨在满足前端与后端系统在兼容性方面的需求。在这一框架下,GPU通过无损网络进行高效训练。这些经过训练的AI模型会与AI推理集群相连,使得最终用户能够便捷地查询这些模型。为了避免冗余,开发两个相互独立的技术架构来分别支持训练与推理环节并无实际意义。相反,这些系统应当实现兼容性和模块化,而基于行业标准的以太网则是实现这一目标的最经济途径。

当前的以太网网络解决方案虽已展现出良好的扩展性,但要真正满足人工智能应用对更高速度和更强可扩展性的需求,底层的以太网技术仍需进一步简化和优化设计,以提升作业效率。为此,行业内的工程师们正积极投身于针对AI用例的以太网优化工作。在这一背景下,超以太网联盟(UEC)应运而生,它汇聚了众多行业公司,共同致力于通过基于标准的改进来推动以太网的发展。其中,超以太网传输作为一项现代传输协议,旨在充分利用以太网/IP生态系统的优势,为人工智能应用程序提供卓越的性能。

目前,UEC的成员队伍已扩大至60余家公司(且仍在不断壮大),涵盖了众多在人工智能和高性能计算网络领域具有领先地位的供应商及运营商,如AMD、思科、戴尔、HPE、英特尔、英伟达以及高通等。尤为值得一提的是,英伟达作为人工智能基础设施领域的佼佼者,已经拥有成熟的InfiniBand解决方案,但仍选择加入UEC,这进一步彰显了UEC联盟在推动人工智能网络标准化方面的主导地位。

03

以太网技术进步如何引领人工智能

在推进人工智能的部署过程中,消除人工智能孤岛对于缩减成本和降低风险至关重要。其中,采用基于标准的以太网作为支撑技术是一个核心要素。以太网展现出强大的潜力,能够应对人工智能的高要求,并提供一个统一的平台,这对人工智能的经济性具有重要影响,因为它能够在各种网络和云端上实现一致的运营模式。对于大多数运营场景而言,维护InfiniBand和以太网双重基础设施的成本过于为高昂。因此,直接转向以太网成为了一个不错的选择,以太网通过不断创新,能够以更低的成本提供与InfiniBand相媲美的AI性能。具体的技术进步体现在以下几个方面:

数据包喷洒:在20世纪90年代,网络拓扑主要基于生成树协议,确保从A到B的单一路径以避免网络环路,然后出现了像ECMP这样的多路径技术,让网络尽可能地多利用通信之间的链路。如今,人工智能网络拓扑迈入了数据包喷洒的新阶段,该技术允许每个网络流同时访问到达目的地的所有路径。数据包的灵活排序充分利用了所有具备最佳负载平衡的以太网链路,仅在AI工作负载涉及带宽密集型操作需要它时才进行强制排序。

拥塞管理:在高性能网络中,网络拥塞问题不容忽视。当多个发送方同时向AI接收器发送流量时,AI接收器的最后一条链路上可能会出现“incast”拥塞问题。在GPU集群执行“all-to-all”AI任务时,这一问题可能变得尤为严重并呈指数级增长。因此,基于以太网的拥塞控制算法对于人工智能工作负载至关重要,它们能够避免热点现象,并在多条路径上均匀分布负载。这些算法可以与多路径数据包喷洒技术协同工作,确保AI流量的可靠传输。

随着人工智能市场的蓬勃发展,企业正积极评估新的人工智能用例对网络架构的影响,并探索部署新服务的成本及投资回报率。据Futuriom预测,未来几年内,人工智能的用例和部署模型将持续扩展,涵盖超大规模LLM、SLM、私有人工智能及边缘推理等领域。这些用例均支持以太网连接,从边缘到数据中心,以太网已在企业网络中广泛应用。

以太网凭借其开放性、灵活性和适应性强等特点,在人工智能部署中展现出强大竞争力。其性能优于InfiniBand,且随着UEC的增强,优势将进一步扩大。同时,以太网成本更低,生态系统更广泛且更开放,为后端和前端集群提供了通用性、统一的操作和技能集,以及集群之间的平台重用机会。随着人工智能用例和服务的不断扩展,以太网基础设施的机会也将大幅增加。无论是在超大规模LLM的核心还是在企业边缘,AI-ready以太网都能满足需求,提供基于行业特定私有数据的AI推理。

原文链接:

https://www.futuriom.com/articles/news/the-secret-behind-aristas-ethernet-succces/2024/12

 end 

 精品活动推荐 

 专业社群 

部分入群专家来自:

新势力车企:

特斯拉、合众新能源-哪吒、理想、极氪、小米、宾理汽车、极越、零跑汽车、阿维塔汽车、智己汽车、小鹏、岚图汽车、蔚来汽车、吉祥汽车、赛力斯......

外资传统主流车企代表:

大众中国、大众酷翼、奥迪汽车、宝马、福特、戴姆勒-奔驰、通用、保时捷、沃尔沃、现代汽车、日产汽车、捷豹路虎、斯堪尼亚......

内资传统主流车企:

吉利汽车、上汽乘用车、长城汽车、上汽大众、长安汽车、北京汽车、东风汽车、广汽、比亚迪、一汽集团、一汽解放、东风商用、上汽商用......

全球领先一级供应商:

博世、大陆集团、联合汽车电子、安波福、采埃孚、科世达、舍弗勒、霍尼韦尔、大疆、日立、哈曼、华为、百度、联想、联发科、普瑞均胜、德赛西威、蜂巢转向、均联智行、武汉光庭、星纪魅族、中车集团、赢彻科技、潍柴集团、地平线、紫光同芯、字节跳动、......

二级供应商(500+以上):

Upstream、ETAS、Synopsys、NXP、TUV、上海软件中心、Deloitte、奇安信、为辰信安、云驰未来、信大捷安、信长城、泽鹿安全、纽创信安、复旦微电子、天融信、奇虎360、中汽中心、中国汽研、上海汽检、软安科技、浙江大学......

人员占比


公司类型占比


更多文章

不要错过哦,这可能是汽车网络安全产业最大的专属社区!

关于涉嫌仿冒AutoSec会议品牌的律师声明

一文带你了解智能汽车车载网络通信安全架构

网络安全:TARA方法、工具与案例

汽车数据安全合规重点分析

浅析汽车芯片信息安全之安全启动

域集中式架构的汽车车载通信安全方案探究

系统安全架构之车辆网络安全架构

车联网中的隐私保护问题

智能网联汽车网络安全技术研究

AUTOSAR 信息安全框架和关键技术分析

AUTOSAR 信息安全机制有哪些?

信息安全的底层机制

汽车网络安全

Autosar硬件安全模块HSM的使用

首发!小米雷军两会上就汽车数据安全问题建言:关于构建完善汽车数据安全管理体系的建议

谈思实验室 深入专注智能汽车网络安全与数据安全技术,专属汽车网络安全圈的头部学习交流平台和社区。平台定期会通过线上线下等形式进行一手干货内容输出,并依托丰富产业及专家资源,深化上下游供需对接,逐步壮大我国汽车安全文化及产业生态圈。
评论
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 427浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 419浏览
  • 随着通信技术的迅速发展,现代通信设备需要更高效、可靠且紧凑的解决方案来应对日益复杂的系统。中国自主研发和制造的国产接口芯片,正逐渐成为通信设备(从5G基站到工业通信模块)中的重要基石。这些芯片凭借卓越性能、成本效益及灵活性,满足了现代通信基础设施的多样化需求。 1. 接口芯片在通信设备中的关键作用接口芯片作为数据交互的桥梁,是通信设备中不可或缺的核心组件。它们在设备内的各种子系统之间实现无缝数据传输,支持高速数据交换、协议转换和信号调节等功能。无论是5G基站中的数据处理,还是物联网网关
    克里雅半导体科技 2025-01-10 16:20 415浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 430浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 53浏览
  • 随着全球向绿色能源转型的加速,对高效、可靠和环保元件的需求从未如此强烈。在这种背景下,国产固态继电器(SSR)在实现太阳能逆变器、风力涡轮机和储能系统等关键技术方面发挥着关键作用。本文探讨了绿色能源系统背景下中国固态继电器行业的前景,并强调了2025年的前景。 1.对绿色能源解决方案日益增长的需求绿色能源系统依靠先进的电源管理技术来最大限度地提高效率并最大限度地减少损失。固态继电器以其耐用性、快速开关速度和抗机械磨损而闻名,正日益成为传统机电继电器的首选。可再生能源(尤其是太阳能和风能
    克里雅半导体科技 2025-01-10 16:18 317浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 459浏览
  • 在不断发展的电子元件领域,继电器——作为切换电路的关键设备,正在经历前所未有的技术变革。固态继电器(SSR)和机械继电器之间的争论由来已久。然而,从未来发展的角度来看,固态继电器正逐渐占据上风。本文将从耐用性、速度和能效三个方面,全面剖析固态继电器为何更具优势,并探讨其在行业中的应用与发展趋势。1. 耐用性:经久耐用的设计机械继电器:机械继电器依靠物理触点完成电路切换。然而,随着时间的推移,这些触点因电弧、氧化和材料老化而逐渐磨损,导致其使用寿命有限。因此,它们更适合低频或对切换耐久性要求不高的
    腾恩科技-彭工 2025-01-10 16:15 88浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 142浏览
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 444浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 417浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦