IBM为啥要买AMD的XilinxFPGA芯片?

EETOP 2023-10-27 11:31

前天有个新闻上了头条,讲AMD最近拿到几个大单,包括Oracle、IBM。Oracle计划在云服务中采用AMD Instinct MI300X AI芯片,以及HPC用GPU;IBM预计将采用AMD的Xilinx FPGA解决方案,用于人工智能工作负载。

英伟达GPU供不应求,导致了大量需求溢出,以至于Oracle成为了首批部署MI300X的公司之一。这就像是我们去吃饭,想去的网红餐厅排队人山人海,但吃饭总得要吃,不行就另找一家好吃的。

MI300X尚处于“襁褓之中”,将于第四季度推出,目前还在提供样品阶段。AMD的软件生态也没有英伟达那么完善。训练和运行AI大模型不仅仅取决于GPU性能,系统设计也尤为重要。

IBM却不太一样,IBM的AI推理平台使用了NeuReality的NR1芯片,而AMD(Xilinx)的FPGA加速产品在其中发挥了关键作用。

NeuReality 是一家于 2019 年在以色列成立的初创公司,2021年2月,NeuReality推出了 NR1-P,这是一个以AI为中心的推理平台。2021年11月,NeuReality 宣布与IBM建立合作伙伴关系,其中包括许可IBM的低精度AI内核来构建 NR1。

NR1是NeuReality NAPU系列中基于FPGA的芯片,这是一种具有嵌入式AI推理加速器以及网络和虚拟化功能的SoC。据NeuReality透露,与其他深度学习芯片供应商的GPU和ASIC方案相比,NR1的每美元性能将提高15倍。

按照我的理解,NeuReality可以算是Xilinx FPGA在AI领域的方案商,在其基础上提供基于FPGA的AI推理加速平台。

在芯片或者人工智能领域,新闻传播讨论最多的是台积电,英特尔,英伟达,AMD等著名公司,大家好像已经听不到IBM的声音了,低调的蓝色巨人似乎已经退居幕后。

然而,IBM仍然是大佬中的大佬,在芯片和人工智能领域无法忽视的存在。10月25日IBM发布了第三季度财报,季度收入达到147.5亿美元,营业利润率从11.4%扩大至14.8%。

在IBM的历史上,在芯片和人工智能非常辉煌。

1960年,IBM开发出倒装芯片封装技术,提高组件可靠性。

1966年,IBM提出了单晶体管DRAM的想法。

1974年,IBM研究院设计了采用精简指令集计算机 (RISC) 架构计算机原型,该架构沿用至今。

在芯片领域的贡献,IBM还包括CMP、SiGe stress、ArF光刻、计算机化光刻技术、化学增量光刻及绝缘层上硅(SOI)技术、Power处理器、AI芯片、量子芯片等。

2020年,IBM研发出一种基于相变存储器(PCM)的非·冯诺依曼架构芯片技术,能像人脑一样在存储中执行计算任务,以超低功耗实现复杂且准确的深度神经网络推理。

2022年10月,IBM发布首款人工智能计算单元(Artificial Intelligent Unit,AIU)片上系统,AIU专为加速深度学习模型使用的矩阵和向量计算而设计和优化,不仅可以解决计算复杂的问题,并以远远超过CPU能力的速度执行数据分析。

在量子计算领域,2020年,IBM发布了65量子位的Quantum Hummingbird。2022年11月10日,IBM发布433个量子比特的Osprey芯片。2023年,IBM将发布1123比特的IBM Quantum Condor。IBM也计划在2025年推出一个超过4000个量子比特的系统。

在芯片制程研发方面,IBM 每次都能抢在传统芯片制造商之前,设计出新制程的原型芯片来。比如说10nm芯片是由他们在2014年研发出来的,到了2017年才量产,5nm 芯片在 2015年提出,到2018年量产。

而在2021年,IBM率先推出了全球首个2nm芯片,采用纳米片堆叠的晶体管,也被称为GAA晶体管。

IBM的基础研究实力,是整个世界IT科技树的树根之一,完全不受现有框框的束缚,方向激进而前瞻。

IBM和Xilinx的合作关系,早在AMD进来之前,两家的策略联盟已经持续多年了。

早期Xilinx发布V5系列的FPGA时,就已经将IBM公司的PowerPC硬核集成在其芯片中。

2015年,当微软成功引入Altera FPGA对其Bing搜索引擎数据中心进行加速改造后,IBM当即启动与Xilinx的合作,共同研发FPGA加速平台。

2017年IBM打造的新服务器架构方案,将FPGA和服务器的CPU分离,直接将FPGA连接到数据中心的网络之中。这种解决方案将会使FPGA作为一种单独的计算单元,将多个FPGA单元形成的集群用于新兴的超大规模数据中心中使用的服务器。

IBM的研究室里,科研人员将64个Xilinx公司的Kintex UltraScale XCKU060 型号的FPGA集成到一起形成一个服务器插片单元,能够达到最大带宽640Gb/s。将16个基本的插片单元集成在一个服务器的柜子上,便形成了一个有着1024个FPGA和16TB的2400Mb/s的DDR4内存的服务器。这个平台充分考虑了成本效率,使用水冷的方式实现了最优的能量效率。

将FPGA从传统的通过总线链接到CPU的方法中解放出来,使FPGA在数据中心的大规模部署成为可能。将传统的机架式服务器和刀片式服务器变成了许多微服务器节点的集合体,通过共享例如电源供给、PCB背板、网络链接等服务器资源来提高服务器的集成度,从而大大提高服务器的单位价格的性能参数(performance-per-dollar)。详细内容见IBM的论文,“An FPGA Platform for Hyperscalers,”发表在2017年8月的IEEE Hot Interconnects Conference上。

今年,IBM又宣布其协同加速处理器接口(CAPI)全面支持Xilinx FPGA和Power处理器,IBM将开发并验证装置于IBM Power Systems服务器的赛灵思加速板,赛灵思正着手开发并将推出软件定义SDAccel开发环境POWER专属版本,以及专为OpenPOWER开发者社群提供的的函数库。

对比GPU,FPGA的优势在于更低的功耗和时延。GPU无法很好地利用片上内存,需要频繁读取片外的DRAM,因此功耗非常高。FPGA可以灵活运用片上存储,因此功耗远低于GPU。另外,FPGA的架构,使其在AI推理中相比GPU具有非常强的时延优势。

FPGA加速板卡在2018年只有10亿美元的市场规模,Semicon研究报告预计今年将超过50亿美元。

数据中心的AI算力市场上,目前英伟达的GPU是如日中天,在AI芯片市场中占比最高,达91.9%。NPU、ASIC、FPGA市场占比分别为6.3%、1.5%、0.3%。

英伟达成功的主要原因,我认为还是CuDA的生态比较好,程序员覆盖面广,开源资源和成熟方案应有尽有,国内大模型技术大多由海外开源搬运而来,因此绝大多数都会采用现成的英伟达方案。

但是仅就AI算力前沿技术的高速发展来看,国外仍然会呈现百花齐放互相追赶的态势,无论是谷歌的TPU,还是IBM的Power架构,抑或是Intel/AMD的异构加速芯片,都将长期角逐市场。这么大的一块肉,没有大佬会放弃。

AI算力的中场战事才刚刚开始。

文章来源于土人观芯,作者土人观芯


特别推荐:

AMD FPGA/SoC 技术盛会! 

报名开启,坐席有限! 

【11月28日 北京】

  


EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论 (0)
  • 文/Leon编辑/侯煜‍就在小米SU7因高速交通事故、智驾性能受到质疑的时候,另一家中国领先的智驾解决方案供应商华为,低调地进行了一场重大人事变动。(详情见:雷军熬过黑夜,寄望小米SU7成为及时雨)4月4日上午,有网友发现余承东的职务发生了变化,华为官网、其个人微博认证信息为“常务董事,终端BG董事长”,不再包括“智能汽车解决方案BU董事长”。余承东的确不再兼任华为车BU董事长,但并非完全脱离华为的汽车业务,而是聚焦鸿蒙智行。据悉,华为方面寻求将车BU独立出去,但鸿蒙智行仍留在华为终端BG部门。
    华尔街科技眼 2025-04-09 15:28 100浏览
  •     在研究Corona现象时发现:临界电压与介电材料表面的清洁程度有关。表面越清洁的介电材料,临界电压越高;表面污染物越多的地方,越容易“爬电”。关于Corona现象,另见基础理论第007篇。    这里说的“污染物”,定义为——可能影响介电强度或表面电阻率的固体、液体或气体(电离气体)的任何情况。    IEC 60664-1 (对应GB/T 16935.1-2023) 定义了 Pollution Degree,中文术语是“污染等
    电子知识打边炉 2025-04-07 22:06 118浏览
  • ## DL/T645-2007* 帧格式:* 帧起始字符:68H* 地址域:A0 A1 A2 A3 A4 A5* 帧起始字符:68H* 控制码:1字节* 主站:* 13H:请求读电能表通信地址* 11H:请求读电能表数据* 1CH:请求跳闸、合闸* 从站:* 91H:正常应答读电能表* 9CH:正常应答跳闸、合闸* 数据域长度:1字节* 数据域:DI0 DI1 DI2 DI3* 发送方:每字节+33H* 接收方:每字节-33H* 数据标识:* 电能量* 最大需量及发生时间* 变量* 事件记录*
    四毛打印店 2025-04-09 10:53 70浏览
  • 在人工智能技术飞速发展的今天,语音交互正以颠覆性的方式重塑我们的生活体验。WTK6900系列语音识别芯片凭借其离线高性能、抗噪远场识别、毫秒级响应的核心优势,为智能家居领域注入全新活力。以智能风扇为起点,我们开启一场“解放双手”的科技革命,让每一缕凉风都随“声”而至。一、核心技术:精准识别,无惧环境挑战自适应降噪,听懂你的每一句话WTK6900系列芯片搭载前沿信号处理技术,通过自适应降噪算法,可智能过滤环境噪声干扰。无论是家中电视声、户外虫鸣声,还是厨房烹饪的嘈杂声,芯片均能精准提取有效指令,识
    广州唯创电子 2025-04-08 08:40 194浏览
  •   卫星图像智能测绘系统全面解析   一、系统概述   卫星图像智能测绘系统是基于卫星遥感技术、图像处理算法与人工智能(AI)技术的综合应用平台,旨在实现高精度、高效率的地理空间数据获取、处理与分析。该系统通过融合多源卫星数据(如光学、雷达、高光谱等),结合AI驱动的智能算法,实现自动化、智能化的测绘流程,广泛应用于城市规划、自然资源调查、灾害监测等领域。   应用案例   目前,已有多个卫星图像智能测绘系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润卫星图像智能测绘系统
    华盛恒辉l58ll334744 2025-04-08 15:04 108浏览
  •     根据 IEC术语,瞬态过电压是指持续时间几个毫秒及以下的过高电压,通常是以高阻尼(快速衰减)形式出现,波形可以是振荡的,也可以是非振荡的。    瞬态过电压的成因和机理,IEC 60664-1给出了以下四种:    1. 自然放电,最典型的例子是雷击,感应到电力线路上,并通过电网配电系统传输,抵达用户端;        2. 电网中非特定感性负载通断。例如热处理工厂、机加工工厂对
    电子知识打边炉 2025-04-07 22:59 164浏览
  • 在万物互联时代,智能化安防需求持续升级,传统报警系统已难以满足实时性、可靠性与安全性并重的要求。WT2003H-16S低功耗语音芯片方案,以4G实时音频传输、超低功耗设计、端云加密交互为核心,重新定义智能报警设备的性能边界,为家庭、工业、公共安防等领域提供高效、稳定的安全守护。一、技术内核:五大核心突破,构建全场景安防基座1. 双模音频传输,灵活应对复杂场景实时音频流传输:内置高灵敏度MIC,支持环境音实时采集,通过4G模块直接上传至云端服务器,响应速度低至毫秒级,适用于火灾警报、紧急呼救等需即
    广州唯创电子 2025-04-08 08:59 159浏览
  •   物质扩散与污染物监测系统:环境守护的关键拼图   一、物质扩散原理剖析   物质扩散,本质上是物质在浓度梯度、温度梯度或者压力梯度等驱动力的作用下,从高浓度区域向低浓度区域迁移的过程。在环境科学范畴,物质扩散作为污染物在大气、水体以及土壤中迁移的关键机制,对污染物的分布态势、浓度动态变化以及环境风险程度有着直接且重大的影响。   应用案例   目前,已有多个物质扩散与污染物监测系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润物质扩散与污染物监测系统。这些成功案例为物质
    华盛恒辉l58ll334744 2025-04-09 11:24 66浏览
  •   卫星图像智能测绘系统:地理空间数据处理的创新引擎   卫星图像智能测绘系统作为融合卫星遥感、地理信息系统(GIS)、人工智能(AI)以及大数据分析等前沿技术的综合性平台,致力于达成高精度、高效率的地理空间数据采集、处理与应用目标。借助自动化、智能化的技术路径,该系统为国土资源管理、城市规划、灾害监测、环境保护等诸多领域输送关键数据支撑。   应用案例   目前,已有多个卫星图像智能测绘系统在实际应用中取得了显著成效。例如,北京华盛恒辉北京五木恒润卫星图像智能测绘系统。这些成功案例为卫星
    华盛恒辉l58ll334744 2025-04-08 16:19 91浏览
  • 文/郭楚妤编辑/cc孙聪颖‍伴随贸易全球化的持续深入,跨境电商迎来蓬勃发展期,物流行业 “出海” 成为不可阻挡的必然趋势。加之国内快递市场渐趋饱和,存量竞争愈发激烈。在此背景下,国内头部快递企业为突破发展瓶颈,寻求新的增长曲线,纷纷将战略目光投向海外市场。2024 年,堪称中国物流企业出海进程中的关键节点,众多企业纷纷扬帆起航,开启海外拓展之旅。然而,在一片向好的行业发展表象下,部分跨境物流企业的经营状况却不容乐观。它们受困于激烈的市场竞争、不断攀升的运营成本,以及复杂的国际物流环境,陷入了微利
    华尔街科技眼 2025-04-09 15:15 105浏览
  • HDMI从2.1版本开始采用FRL传输模式,和2.0及之前的版本不同。两者在物理层信号上有所区别,这就需要在一些2.1版本的电路设计上增加匹配电路,使得2.1版本的电路能够向下兼容2.0及之前版本。2.1版本的信号特性下面截取自2.1版本规范定义,可以看到2.1版本支持直流耦合和交流耦合,其共模电压和AVCC相关,信号摆幅在400mV-1200mV2.0及之前版本的信号特性HDMI2.0及之前版本采用TMDS信号物理层,其结构和参数如下:兼容设计根据以上规范定义,可以看出TMDS信号的共模电压范
    durid 2025-04-08 19:01 175浏览
  • 文/Leon编辑/cc孙聪颖‍转手绢、跳舞、骑车、后空翻,就在宇树、智元等独角兽企业率领“机器人大军”入侵短视频时,却有资本和科技大佬向此产业泼了一盆冷水。金沙江创投管理合伙人朱啸虎近日突然对人形机器人发难,他表示“最近几个月正在批量退出人形机器人公司”。“只是买回去做研究的,或者买回去做展示的,这种都不是我们意义上的商业化,谁会花十几万买一个机器人去干这些活?”朱啸虎吐槽。不过,朱啸虎的观点很快就遭到驳斥,众擎机器人的创始人、董事长赵同阳回怼道:“(朱啸虎)甚至问出了人形机器人在这个阶段有什么
    华尔街科技眼 2025-04-07 19:24 153浏览
  • 曾几何时,汽车之家可是汽车资讯平台领域响当当的“扛把子”。2005 年成立之初,它就像一位贴心的汽车小助手,一下子就抓住了大家的心。它不仅吸引了海量用户,更是成为汽车厂商和经销商眼中的“香饽饽”,广告投放、合作推广不断,营收和利润一路高歌猛进,2013年成功在纽交所上市,风光无限。2021年更是在香港二次上市,达到了发展的巅峰,当年3月15日上市首日,港股股价一度高达184.6港元,市值可观。然而,如今的汽车之家却陷入了困境,业务下滑明显。业务增长瓶颈从近年来汽车之家公布的财报数据来看,情况不容
    用户1742991715177 2025-04-07 21:48 117浏览
  •   工业自动化领域电磁兼容与接地系统深度剖析   一、电磁兼容(EMC)基础认知   定义及关键意义   电磁兼容性(EMC),指的是设备或者系统在既定的电磁环境里,不但能按预期功能正常运转,而且不会对周边其他设备或系统造成难以承受的电磁干扰。在工业自动化不断发展的当下,大功率电机、变频器等设备被大量应用,现场总线、工业网络等技术也日益普及,致使工业自动化系统所处的电磁环境变得愈发复杂,电磁兼容(EMC)问题也越发严峻。   ​电磁兼容三大核心要素   屏蔽:屏蔽旨在切断电磁波的传播路
    北京华盛恒辉软件开发 2025-04-07 22:55 259浏览
  •   物质扩散与污染物监测系统软件:多领域环境守护的智能中枢   北京华盛恒辉物质扩散与污染物监测系统软件,作为一款融合了物质扩散模拟、污染物监测、数据分析以及可视化等多元功能的综合性工具,致力于为环境科学、公共安全、工业生产等诸多领域给予强有力的技术支撑。接下来,将从功能特性、应用场景、技术实现途径、未来发展趋势等多个维度对这类软件展开详尽介绍。   应用案例   目前,已有多个物质扩散与污染物监测系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润物质扩散与污染物监测系统。这
    华盛恒辉l58ll334744 2025-04-09 14:54 122浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦