加速基础设施战略也不例外。也许更重要的是,Marvell正在充实生态系统中的一个领域,这个领域往往被处理技术的闪亮进步所掩盖,但对实现生成式人工智能的下一阶段同样至关重要。如今的挑战是,如何随着人工智能模型的规模、用例以及最终的应用激增,还能持续保持在创新浪潮的前沿。

最近在加州圣克拉拉公司总部举行的分析师大会上,Marvell高管明确表示,“人工智能”不仅仅意味着人工智能,还意味着必须加快基础设施建设。

人工智能通常又分为传统人工智能和生成式人工智能。虽然已证明现有数据中心基础设施至少足以满足前者的目前需求,但后者正在推动数据中心基础设施设计的根本转变,以解决计算、内存和电源的爆炸式增长需求。

Marvell的高管们认为其战略已经前瞻地考虑到了生成式人工智能的这些最新发展。因此,首席运营官Chris Koopmans重申公司之前发布的战略,即专注于开发“移动、存储、处理和数据保护” 半导体技术。他说,公司战略已经在为数据处理的爆炸式增长做准备,而生成式人工智能恰好是目前推动需求的数据密集型应用,正在推动进入加速基础设施新时代。

什么是加速基础设施?

Marvell产品和技术总裁Raghib Hussain,将高水平的加速基础设施描述为高度复杂的计算资源与高速、低延迟连接的结合。然而,从更深入的角度来看,这不仅仅事关器件的功能,还包括用于构建数据中心的拓扑结构。

通常设计传统数据中心用于处理多个工作负载,这些工作负载由大小已知且结构良好的数据组成。大多数数据中心通信通常具有“南北”性质,即通信基本上都是在数据中心与类似于另一个数据中心的一些外部设备(即访问数据中心里的应用程序或数据的客户端)之间进行。

图1:传统的通用数据中心。(本文图片来源:Marvell)

另一方面,加速基础设施数据中心(主要设计用于人工智能工作负载)必须支持大数据量,这些数据量可以是结构化的,也可以是非结构化的,通常不适合单台服务器。因此,在同一数据中心内,加速基础设施在需要强大的“南北”通信的同时,也需要进行更多的“东西”通信,即服务器到服务器的通信。

这对服务器到服务器的带宽和延迟要求带来影响,而这最终会推动交换机和互连功能的发展。它还推动了数据中心的拓扑结构,人工智能加速的基础设施需要更平坦,每台交换机所需的服务器更少,服务器之间的网络带宽更高,服务器与数据中心互连(DCI)之间的交换层更少。DCI将一个数据中心连接到其他数据中心。

图2:人工智能数据中心。

是的,计算是至关重要的,但……忽视交换和互连会带来危险

围绕生成式人工智能的大部分对话,主要都集中在模型训练、推理以及支持工作负载的核心组件上,而像处理资源这类组件也会消耗一些,这类组件包括中央处理单元(CPU)、图形处理单元(GPU)和神经处理单元(NPU),内存资源以及管理这些资源的所有组件。虽然这些组件在加速的基础设施中至关重要,但同样重要的是(即便不是更重要的话)确保使所有其他组件都能正常运行的互连和交换设计。

如果这些组件设计不足,就可能会导致性能瓶颈,从而浪费处理器和内存的高级功能。为了帮助理解这一点,这里以一个数据中心为例:该中心设计了价值10亿美元的服务器,由最新和最棒的CPU、GPU和NPU提供动力,但在网络和交换解决方案方面有所欠缺。这一欠缺导致拥塞和带宽限制,禁止数据中心充分利用可用的计算资源,从而导致计算资源低效率。即便保守计算,该性能降低也有10%,如果有效地转化为价值的话,这也意味着带来1亿美元的损失。而IT经理很难证明这种浪费是合理的。

在这种背景下,Marvell认为对面向人工智能工作负载的加速基础设施尤为重要的两项技术为:光网络和以太网交换。

就给定的部署来说,选择哪种网络连接解决方案最适合,取决于距离、速度、可靠性和上市时间等因素。铜线的成本最低,但最适合用于较短的距离和较慢的速度。为了支持更高的速度,铜线的直径需要更大,这带来了物理挑战和限制。其中一些可以通过加入DSP而构成所谓的有源电缆来缓解,从而有助于提高速度和距离,同时也支持使用更细的电缆。然而,这只能在一定程度上有所帮助。另一方面,光缆更昂贵,但可以实现更快的速度和更长的距离。在带宽和规模至关重要的加速基础设施中,Marvell认为光缆最终是唯一能够满足数据中心人工智能工作负载需求的解决方案。

同样,Marvell建议将具有高带宽和低延迟功能的以太网交换作为加速基础设施的基础。它不仅是对现有云基础设施的补充,而且是一种广泛采用的开放标准,可在各种硬件的完整生态系统中支持互操作。然而,以太网确实需要继续增强,不仅要提供更高的带宽和更低的延迟,还要提高拥塞适应性。

考虑到巨大的数据量需要移动,以及人工智能用例的延迟依赖性,拥塞适应性对于加速基础设施扩展到支持未来人工智能工作负载所需的程度极为重要,虽然现在有一定程度的拥塞适应性,但其消极性很强,远远不能达到实时响应,Marvell网络交换高级副总裁兼总经理Nick Kucharewski强调道。

以太网交换中的拥塞管理,需要具有高度的适应性,这不仅是因为网络负载条件的动态变化,还因为每个超规模/云运营商都有自己的优化方式,解决方案需要支持这些技术的轻松实施。此外,以太网交换将需要具有实时和自动响应能力。这将需要将以太网交换提升到纯粹的高速度和馈送之上,包括为其引入智能。

加速进入人工智能时代

虽然人工智能似乎在一夜之间取得了成功,但那些正在收获生成式人工智能时代早期回报的人们会认为,这绝非易事。因为实际上,目前利用人工智能所开发解决方案的各种策略,都是在ChatGPT出现之前好几年就已经设计好并实施的。

所以,加速基础设施战略也不例外。也许更重要的是,Marvell正在充实生态系统中的一个领域,这个领域往往被处理技术的闪亮进步所掩盖,但对实现生成式人工智能的下一阶段同样至关重要。如今的挑战是,如何随着人工智能模型的规模、用例以及最终的应用激增,还能持续保持在创新浪潮的前沿。

(参考原文:how-to-manage-uncertainty-when-creating-iot-solutions-for-enterprises

本文为《电子工程专辑》2024年3月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
新款开发板售价仅为249美元,而上一代40 TOPS开发板售价为499美元,价格仅为上一代的一半。这使得Jetson Orin Nano Super成为“世界上最经济实惠的生成式AI计算机”,特别适合商业AI开发者、爱好者和学生使用。
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
通过机器学习技术,EDA工具可以获取更精确的模型来预测设计中存在的问题,如布线拥塞、信号干扰、热效应等,从而为用户提供更准确快速的指导,避免后期返工。
这一新规则可能会引起美国在世界各地的合作伙伴和盟友的重大担忧,以及一些国家的不满,担心美国会充当单方面仲裁者,决定谁可以获得对AI至关重要的先进芯片。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力,以及在马斯克在当选总统特朗普政府中的“特殊地位”,多家分析机构认为,马斯克的财富未来还将进一步增长。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
今日,长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办,长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言,厂房建设一般主要分为四个阶段:设备选型、设
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1