2019年5月,也就是曾经的FPGA巨头Altera被英特尔收购的4年之后,英特尔宣布推出了“全面借助自身能力”开发的新一代FPGA产品—Agilex。与此前Altera推出的Stratix、Arria、Cyclone等产品系列完全不同,Agilex是一个全新的FPGA系列,“体现了你能想象到的所有与Intel相关的技术资源”,被英特尔寄予了更多的期待。 

Agilex是Agile(敏捷)和Flexible(灵活)两个词语的结合体,也是现代FPGA技术最为核心的两大要点。而上文所提及的“相关技术资源”,基本上等同于英特尔在2018年底“架构日”上所提出的制程和封装、架构、内存和存储、互连、安全、软件这“六大技术支柱”。这意味着,Agilex FPGA通过异构架构,实现了对不同制程工艺、不同逻辑单元之间的集成,在灵活性和定制化方面实现了突破。 

2021年1月,随着Agilex FPGA的大规模量产出货,更多技术细节得以公布。

赋能数据中心

为了让客户拥有更多更灵活的选择,Agilex FPGA包含F、I、M三个系列,在配置和性能依次提升。具体来说,F系列适用于数据中心、网络和边缘的各种应用;I系列适用于需要大量接口带宽和高性能的应用;M系列提供面向英特尔至强处理器的一致性连接、HBM集成、增强型DDR5控制器和英特尔傲腾DC持久内存支持,针对需要大量内存和高带宽的数据密集型应用进行了优化。

英特尔数据平台事业部副总裁兼可编程解决方案事业部(PSG)产品营销总经理Deepali Trehan对《电子工程专辑》表示,英特尔此前对Agilex性能的预期,是在最大时钟速率(Fmax)上比上一代14nm Stratix 10提高40%,但最新的实测数据显示是高出了45%的性能。

她也将Agilex FPGA与赛灵思7nm Versal进行了对比。英特尔方面提供的数据显示,Agilex FPGA比Versal的逻辑结构性能功耗比高约2倍,而在算力方面,Agilex FPGA相比赛灵思Versal有超过50%的视频IP性能提升,具体体现在以下5方面:

● Warp图像转换器快32%;

● OSVP 1X可扩展视频处理器快48%;

● OSVP 8X可扩展视频处理器快33%;

● MPVDMA多端口视频直接内存访问快71%;

● Combiner视频流合并快73%。

在谈及与Stratix 系列的定位差异时,Deepali Trehan指出,Stratix 10属于高性能FPGA,非常适合业内大多数高端FPGA应用;Agilex F/I/M系列FPGA进一步提升了行业标杆,提供业内领先的性能和能效,以及其它领先的特性,比如116Gbps收发器、率先支持专注于AI的DSP模式(例如BFLOAT16和半精度浮点)、以及第一个面向傲腾持久内存的硬接口,因而在以数据为中心的世界中非常适合最大、计算最密集的FPGA应用。

“5G、数据中心和边缘三大领域将继续是重点创新领域。值得注意的是,这三大领域的需求多种多样而且不断变化。因此,相关解决方案提供商面临的挑战是继续在核心领域取得进步,例如提高数据传输和处理的性能,同时还要满足每个具体领域的独特需求。”她说。

例如在5G领域,基础设施的某些环节需要超高能效,而无线应用中常见的信号处理功能需要高性能;在云和企业领域,不断变化的基础设施和应用加速中有相当多的工作负载需要高性能和高能效;在边缘,需要更高的计算力来满足对更高的交互、更多富媒体内容和更低的时延的需求,同时仍需满足严苛的功耗、散热和空间限制要求。

因此,要想成功,解决方案提供商必须通过得到良好支持的开发流程快速地把处理、内存、数字信号处理、专门接口和FPGA灵活性整合到高度集成化的组件中,满足目标市场的确切需求。

众多“黑科技”加持

但坦率的说,如果仅凭异构架构这一点,Agilex FPGA其实是无法实现上述性能指标的,那么,Agilex FPGA中还隐藏着哪些不为人知的“黑科技”呢?

  • 10纳米工艺和高级3D封装

Agilex器件核心的FPGA逻辑结构芯片采用了英特尔10纳米SuperFin芯片制程技术构建,这也是目前世界上最先进的FinFET制程技术之一。同时,Agilex还融合了英特尔专有嵌入式多芯片互连桥接(EMIB)集成的3D异构系统级封装(SiP)技术,它提供了一种高性能、低成本的方法,有助于将Chiplets和FPGA逻辑结构芯片集成至相同的封装中。

  • 第二代英特尔HyperFlex架构和Chiplets架构

Agilex FPGA的逻辑结构芯片采用了第二代英特尔HyperFlex架构,除了与第一代架构一样,在整个核心结构中都使用额外的寄存器Hyper-Registers外,二代架构还提升了整体结构性能,同时最大限度地降低了功耗,其中最显著的一项改进是在超级寄存器中添加了高速旁路。

而Chiplets是一种物理IP模块,可通过封装级集成方法和标准化接口集成其他Chiplets。借助Chiplets这种混合搭配模式,收发器数量不再受通道数量的限制。设计人员要想增加或减少收发器通道数量,只需添加所需的收发器Chiplets即可,无需重新布局芯片以集成不同数量的通道。仅此一项,英特尔就将单个收发器通道的速度从58Gbps提升到了代表着全行业最佳收发速率的116Gbps。

“如果需要,我们现在的测试芯片还可以达到每秒224Gbps。”Deepali Trehan说。

F、I和M系列采用了不同的chiplet组合,以实现差异化。例如,I系列包括一个特别的chiplet,它支持F系列中没有的CXL接口。此外,M系列包括一个增强的核心结构chiplet,让接口支持DDR5和英特尔傲腾持久内存。可以看到,基于chiplet的开发策略在为F、I和M系列实现差异化特性功能方面发挥了巨大作用。

  • 高性能处理器接口

在数据中心里作为CPU的硬件加速器,用来加速深度学习的模型训练、金融计算、网络功能卸载等各类应用,是当前FPGA的一个主要应用场景。但该领域亟待解决的核心问题之一,就是缓存一致性。换句话说,就是必须要明确CPU与硬件加速器之间的内存互联协议。

2019年3月,英特尔宣布联合微软、阿里、思科、戴尔EMC、Facebook、谷歌、惠普企业HPE和华为等公司,共同推出一个全新的互联标准,取名为Compute Express Link(CXL),应用目标锁定互联网数据中心、通信基础设施、云计算与云服务等领域,而这也正是FPGA大显身手的重要平台。

为了确保高性能在线处理和处理器负载加速,英特尔Agilex FPGA支持最新一代高性能处理器接口,包括PCIe Gen 5和CXL,并将成为首款采用Xeon可扩展处理器的一致的高速缓存和内存互联结构的FPGA。

  • 先进的内存层级结构

Agilex FPGA 支持各个层级的内存资源,包括通过专用接口提供的嵌入式内存资源、封装内内存和片外内存。该层级结构的第一层是嵌入式片上内存,包括MLAB、块RAM和eSRAM,每种内存均可提供不同的容量,以满足不同的处理需求。此外,英特尔在设计中还使用SIP技术将高带宽内存(HBM)直接集成至Agilex FPGA器件中,有助于缩减电路板尺寸和成本,简化与降低电源需求。

另一个值得关注的重点是Agilex平台还集成了eASIC技术。这种集成eASIC芯片定制技术能够实现从FPGA到结构化ASIC的迁移。换句话说,用户可以利用eASIC自身具备的可复用 IP 的自定义逻辑连续体,在整个产品生命周期内进行灵活优化,快速从FPGA转移到ASIC。

英特尔方面称,作为唯一同时提供FPGA、结构化ASIC(Easic)和ASIC的半导体公司,有各种使用模式能确定什么时候使用英特尔eASIC设备。第一个是降低FPGA的成本。在这个使用模式中,可用于现有FPGA或新设计(可能因为上市时间或设计验证的原因而在FPGA内开始);第二个使用模式是需要英特尔eASIC设备的低功耗和高性能优势。在这个使用模式中,功率、散热管理或更高的性能成为关键指标,而FPGA用于设计验证或原型制作,从而加快向eASIC迁移;最后一个使用模式是一起使用FPGA和eASIC设备,通过eASIC的好处而提供可编程优势。现在,这是两个单独的设备,但英特尔的愿景是使用AIB将FPGA和eASIC模块封装到一起。       

  • 软件

全新硬件架构每一个数量级的性能提升,软件能相应带来两个数量级的性能提升。在新一代Agilex FPGA上,配套支持软件Quartus Prime优化了重定时感知综合、布局布线以及全局重定时算法,从而在创新的逻辑结构和增强的平面布局中获取最大性能。此外,通过精细的寄存器重新定时和时钟偏斜调度,实现并发的建立和保持时间优化,Quartus Prime达到了签核质量(signoff-quality)的时序分析。

数据显示,在Quartus Prime和超过135个Design Assistant规则的双重加持下,硬件开发者的编译时间缩短了45%,内存利用率也提高了15%,工作效率大幅提升。 

同时,新一代的Agilex FPGA也被纳入到oneAPI的架构当中。2020年,英特尔发布了英特尔oneAPI Gold版工具包。基于oneAPI基础工具包的英特尔FPGA Add-on支持Agilex FPGA,让用户可以充分利用FPGA加上软件的优势打造自己的解决方案。此外,多个合作伙伴已经宣布今年晚些时候将推出基于oneAPI基础工具包的英特尔FPGA Add-on板卡。从英特尔可编程加速卡迁移到这些未来板卡的用户,将能够充分利用Agilex FPGA性能提升,而无需改变自己的软件应用。

结语:

我们现在正逐渐转向以数据为中心的时代。伴随着数据量的爆炸式增长,数据类型也发生了革命性变化,人工智能、5G、自动驾驶、云计算、物联网等新兴应用带来了更加多元化的计算需求。这意味着,在这个海量数据推动计算架构快速演进并呈指数级扩展的时代,没有一种单一的技术可以全面满足消费者或企业客户对未来的计算需求,不可能只通过直接的标量架构就能解决所有应用,他们需要的是在多样化的层级结构中连接多样化的架构

“公司正在转型以加速增长,我们不仅要学会防御,还要在历史上最大的市场机会面前扩大市场份额。”Deepali Trehan指出,英特尔将为从边缘到云的工作负载提供广泛的计算架构,这是一个延续多年的旅程,包括CPU、GPU、加速器和FPGA在内的XPU路线图将使英特尔在云、人工智能、5G和智能自主边缘等关键转折性技术上拥有相当的竞争优势。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 这些东西会不会又被美国国会哪个议员盯上,在维护美国国家安全的幌子下,对中国禁售。现在看到美国东西真的感冒了,不知道哪天会掉坑里。
阅读全文,请先
您可能感兴趣
以市值860亿美元计算,英特尔已跌出全球十大芯片制造商之列。它是今年费城芯片指数中表现第二差的公司……
《纽约时报》近日报道称,尽管美国对俄罗斯实施了严格的芯片出口限制,但俄罗斯仍在其导弹系统中大量使用来自 AMD、德州仪器、美光和英特尔等美国公司的芯片。
AMD官宣AMD 总裁 Victor Peng即将退休,将于 2024 年 8 月 30 日退休。在此期间,Victor Peng继续担任 AMD 执行团队的顾问,并支持过渡,直至退休。
近日有外媒报道称,头字节跳动与美国博通达成合作,共同研发先进的5纳米定制化AI芯片。6月24日晚间,字节跳动对问询媒体表示,该消息不实。
与前代产品AMD Alveo U55C计算加速卡相比,Alveo V80的逻辑密度至高翻倍、存储器带宽至高翻倍,且网络带宽可高至4倍,可以实现强大的计算集群,也不再需要DDR4或其他外部芯片,从而优化了卡、服务器数量以及机架空间。
世界半导体贸易统计组织(WSTS)的最新预测,2024年全球半导体市场预计将实现16%的增长,市场估值达到6110亿美元。这一增长主要得益于过去两个季度的强劲表现,尤其是在计算终端市场。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
天眼查信息显示,天津三星电子有限公司经营状态9月6日由存续变更为注销,注销原因是经营期限届满。该公司成立于1993年4月,法定代表人为YUN JONGCHUL(尹钟撤),注册资本约1.93亿美元,
据市场调查机构Allied Market Research的《单晶硅晶圆市场》报告指出,2022年单晶硅晶圆市场价值为109亿美元,预计到2032年将达到201亿美元,2023年~2032年的复合年均
‍‍据龙芯中科介绍,近日,基于龙芯3A6000处理器的储迹NAS在南京师范大学附属小学丹凤街幼儿园、狮山路小学、南京大学附属中学等学校相继落地。储迹NAS是基于最新的龙芯CPU--3A6000,其代表
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
展位信息深圳跨境电商展览会(CCBEC)时间:2024年9月11-13日 9:30-17:30地点:深圳国际会展中心(宝安)展馆:16号馆 16D73/16D75 展位报名注册准备好“观众注册”入场二
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金
往期精选2023年度中国移动机器人产业发展研究报告发布!超200个——2024年上半年AGV/AMR行业中标项目盘点市场保有量超10000台的8大中国AGV/AMR厂商总额超190亿-盘点全球移动机器
近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆