2019年5月,也就是曾经的FPGA巨头Altera被英特尔收购的4年之后,英特尔宣布推出了“全面借助自身能力”开发的新一代FPGA产品—Agilex。与此前Altera推出的Stratix、Arria、Cyclone等产品系列完全不同,Agilex是一个全新的FPGA系列,“体现了你能想象到的所有与Intel相关的技术资源”,被英特尔寄予了更多的期待。 

Agilex是Agile(敏捷)和Flexible(灵活)两个词语的结合体,也是现代FPGA技术最为核心的两大要点。而上文所提及的“相关技术资源”,基本上等同于英特尔在2018年底“架构日”上所提出的制程和封装、架构、内存和存储、互连、安全、软件这“六大技术支柱”。这意味着,Agilex FPGA通过异构架构,实现了对不同制程工艺、不同逻辑单元之间的集成,在灵活性和定制化方面实现了突破。 

2021年1月,随着Agilex FPGA的大规模量产出货,更多技术细节得以公布。

赋能数据中心

为了让客户拥有更多更灵活的选择,Agilex FPGA包含F、I、M三个系列,在配置和性能依次提升。具体来说,F系列适用于数据中心、网络和边缘的各种应用;I系列适用于需要大量接口带宽和高性能的应用;M系列提供面向英特尔至强处理器的一致性连接、HBM集成、增强型DDR5控制器和英特尔傲腾DC持久内存支持,针对需要大量内存和高带宽的数据密集型应用进行了优化。

英特尔数据平台事业部副总裁兼可编程解决方案事业部(PSG)产品营销总经理Deepali Trehan对《电子工程专辑》表示,英特尔此前对Agilex性能的预期,是在最大时钟速率(Fmax)上比上一代14nm Stratix 10提高40%,但最新的实测数据显示是高出了45%的性能。

她也将Agilex FPGA与赛灵思7nm Versal进行了对比。英特尔方面提供的数据显示,Agilex FPGA比Versal的逻辑结构性能功耗比高约2倍,而在算力方面,Agilex FPGA相比赛灵思Versal有超过50%的视频IP性能提升,具体体现在以下5方面:

● Warp图像转换器快32%;

● OSVP 1X可扩展视频处理器快48%;

● OSVP 8X可扩展视频处理器快33%;

● MPVDMA多端口视频直接内存访问快71%;

● Combiner视频流合并快73%。

在谈及与Stratix 系列的定位差异时,Deepali Trehan指出,Stratix 10属于高性能FPGA,非常适合业内大多数高端FPGA应用;Agilex F/I/M系列FPGA进一步提升了行业标杆,提供业内领先的性能和能效,以及其它领先的特性,比如116Gbps收发器、率先支持专注于AI的DSP模式(例如BFLOAT16和半精度浮点)、以及第一个面向傲腾持久内存的硬接口,因而在以数据为中心的世界中非常适合最大、计算最密集的FPGA应用。

“5G、数据中心和边缘三大领域将继续是重点创新领域。值得注意的是,这三大领域的需求多种多样而且不断变化。因此,相关解决方案提供商面临的挑战是继续在核心领域取得进步,例如提高数据传输和处理的性能,同时还要满足每个具体领域的独特需求。”她说。

例如在5G领域,基础设施的某些环节需要超高能效,而无线应用中常见的信号处理功能需要高性能;在云和企业领域,不断变化的基础设施和应用加速中有相当多的工作负载需要高性能和高能效;在边缘,需要更高的计算力来满足对更高的交互、更多富媒体内容和更低的时延的需求,同时仍需满足严苛的功耗、散热和空间限制要求。

因此,要想成功,解决方案提供商必须通过得到良好支持的开发流程快速地把处理、内存、数字信号处理、专门接口和FPGA灵活性整合到高度集成化的组件中,满足目标市场的确切需求。

众多“黑科技”加持

但坦率的说,如果仅凭异构架构这一点,Agilex FPGA其实是无法实现上述性能指标的,那么,Agilex FPGA中还隐藏着哪些不为人知的“黑科技”呢?

  • 10纳米工艺和高级3D封装

Agilex器件核心的FPGA逻辑结构芯片采用了英特尔10纳米SuperFin芯片制程技术构建,这也是目前世界上最先进的FinFET制程技术之一。同时,Agilex还融合了英特尔专有嵌入式多芯片互连桥接(EMIB)集成的3D异构系统级封装(SiP)技术,它提供了一种高性能、低成本的方法,有助于将Chiplets和FPGA逻辑结构芯片集成至相同的封装中。

  • 第二代英特尔HyperFlex架构和Chiplets架构

Agilex FPGA的逻辑结构芯片采用了第二代英特尔HyperFlex架构,除了与第一代架构一样,在整个核心结构中都使用额外的寄存器Hyper-Registers外,二代架构还提升了整体结构性能,同时最大限度地降低了功耗,其中最显著的一项改进是在超级寄存器中添加了高速旁路。

而Chiplets是一种物理IP模块,可通过封装级集成方法和标准化接口集成其他Chiplets。借助Chiplets这种混合搭配模式,收发器数量不再受通道数量的限制。设计人员要想增加或减少收发器通道数量,只需添加所需的收发器Chiplets即可,无需重新布局芯片以集成不同数量的通道。仅此一项,英特尔就将单个收发器通道的速度从58Gbps提升到了代表着全行业最佳收发速率的116Gbps。

“如果需要,我们现在的测试芯片还可以达到每秒224Gbps。”Deepali Trehan说。

F、I和M系列采用了不同的chiplet组合,以实现差异化。例如,I系列包括一个特别的chiplet,它支持F系列中没有的CXL接口。此外,M系列包括一个增强的核心结构chiplet,让接口支持DDR5和英特尔傲腾持久内存。可以看到,基于chiplet的开发策略在为F、I和M系列实现差异化特性功能方面发挥了巨大作用。

  • 高性能处理器接口

在数据中心里作为CPU的硬件加速器,用来加速深度学习的模型训练、金融计算、网络功能卸载等各类应用,是当前FPGA的一个主要应用场景。但该领域亟待解决的核心问题之一,就是缓存一致性。换句话说,就是必须要明确CPU与硬件加速器之间的内存互联协议。

2019年3月,英特尔宣布联合微软、阿里、思科、戴尔EMC、Facebook、谷歌、惠普企业HPE和华为等公司,共同推出一个全新的互联标准,取名为Compute Express Link(CXL),应用目标锁定互联网数据中心、通信基础设施、云计算与云服务等领域,而这也正是FPGA大显身手的重要平台。

为了确保高性能在线处理和处理器负载加速,英特尔Agilex FPGA支持最新一代高性能处理器接口,包括PCIe Gen 5和CXL,并将成为首款采用Xeon可扩展处理器的一致的高速缓存和内存互联结构的FPGA。

  • 先进的内存层级结构

Agilex FPGA 支持各个层级的内存资源,包括通过专用接口提供的嵌入式内存资源、封装内内存和片外内存。该层级结构的第一层是嵌入式片上内存,包括MLAB、块RAM和eSRAM,每种内存均可提供不同的容量,以满足不同的处理需求。此外,英特尔在设计中还使用SIP技术将高带宽内存(HBM)直接集成至Agilex FPGA器件中,有助于缩减电路板尺寸和成本,简化与降低电源需求。

另一个值得关注的重点是Agilex平台还集成了eASIC技术。这种集成eASIC芯片定制技术能够实现从FPGA到结构化ASIC的迁移。换句话说,用户可以利用eASIC自身具备的可复用 IP 的自定义逻辑连续体,在整个产品生命周期内进行灵活优化,快速从FPGA转移到ASIC。

英特尔方面称,作为唯一同时提供FPGA、结构化ASIC(Easic)和ASIC的半导体公司,有各种使用模式能确定什么时候使用英特尔eASIC设备。第一个是降低FPGA的成本。在这个使用模式中,可用于现有FPGA或新设计(可能因为上市时间或设计验证的原因而在FPGA内开始);第二个使用模式是需要英特尔eASIC设备的低功耗和高性能优势。在这个使用模式中,功率、散热管理或更高的性能成为关键指标,而FPGA用于设计验证或原型制作,从而加快向eASIC迁移;最后一个使用模式是一起使用FPGA和eASIC设备,通过eASIC的好处而提供可编程优势。现在,这是两个单独的设备,但英特尔的愿景是使用AIB将FPGA和eASIC模块封装到一起。       

  • 软件

全新硬件架构每一个数量级的性能提升,软件能相应带来两个数量级的性能提升。在新一代Agilex FPGA上,配套支持软件Quartus Prime优化了重定时感知综合、布局布线以及全局重定时算法,从而在创新的逻辑结构和增强的平面布局中获取最大性能。此外,通过精细的寄存器重新定时和时钟偏斜调度,实现并发的建立和保持时间优化,Quartus Prime达到了签核质量(signoff-quality)的时序分析。

数据显示,在Quartus Prime和超过135个Design Assistant规则的双重加持下,硬件开发者的编译时间缩短了45%,内存利用率也提高了15%,工作效率大幅提升。 

同时,新一代的Agilex FPGA也被纳入到oneAPI的架构当中。2020年,英特尔发布了英特尔oneAPI Gold版工具包。基于oneAPI基础工具包的英特尔FPGA Add-on支持Agilex FPGA,让用户可以充分利用FPGA加上软件的优势打造自己的解决方案。此外,多个合作伙伴已经宣布今年晚些时候将推出基于oneAPI基础工具包的英特尔FPGA Add-on板卡。从英特尔可编程加速卡迁移到这些未来板卡的用户,将能够充分利用Agilex FPGA性能提升,而无需改变自己的软件应用。

结语:

我们现在正逐渐转向以数据为中心的时代。伴随着数据量的爆炸式增长,数据类型也发生了革命性变化,人工智能、5G、自动驾驶、云计算、物联网等新兴应用带来了更加多元化的计算需求。这意味着,在这个海量数据推动计算架构快速演进并呈指数级扩展的时代,没有一种单一的技术可以全面满足消费者或企业客户对未来的计算需求,不可能只通过直接的标量架构就能解决所有应用,他们需要的是在多样化的层级结构中连接多样化的架构

“公司正在转型以加速增长,我们不仅要学会防御,还要在历史上最大的市场机会面前扩大市场份额。”Deepali Trehan指出,英特尔将为从边缘到云的工作负载提供广泛的计算架构,这是一个延续多年的旅程,包括CPU、GPU、加速器和FPGA在内的XPU路线图将使英特尔在云、人工智能、5G和智能自主边缘等关键转折性技术上拥有相当的竞争优势。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 这些东西会不会又被美国国会哪个议员盯上,在维护美国国家安全的幌子下,对中国禁售。现在看到美国东西真的感冒了,不知道哪天会掉坑里。
阅读全文,请先
您可能感兴趣
莱迪思在最近的开发者大会上发布了最新的Nexus 2平台和对应的小型FPGA产品。这次我们有机会看看相比竞品,Nexus 2是怎么做到低功耗和高性能的...
莱迪思(Lattice)正在考虑对英特尔旗下的FPGA业务Altera发起收购要约,对于国产FPGA行业而言,这一消息无疑带来了新的挑战和机遇。尽管在技术实力、产品性能及市场份额等方面与国际巨头尚有一定差距,但近年来国产FPGA的发展势头不容小觑……
继今年4月AMD宣布推出第二代Versal AI Edge系列和Versal Prime系列之后,日前,该公司又宣布推出第二代Versal Premium系列,使得第二代Versal系列的版图更趋完整。
在金融行业的高频交易中,每一纳秒都至关重要,会导致从盈利几百万美元到巨额亏损之间的差别。正是在这样的背景下,AMD推出了其最新的金融科技加速卡——Alveo™ UL3422。这款加速卡不仅满足了金融机构对高性能和低时延的迫切需求,还以其独特的优势引领着金融交易的新时代。
中国市场对于Lattice而言不仅是至关重要的战略市场,更是其全球业务不可或缺的一部分。他提到,Lattice在中国的业务历史已超过30年,作为首批进入中国市场的半导体企业之一,Lattice已经建立了专门的本地团队,这些团队不仅深入理解并服务中国市场,还致力于为中国客户量身打造解决方案。
TI最近刚刚发布了新款PLD(可编程逻辑)产品系列,据说不需要编程知识,就能在十分钟内完成设计、仿真和配置...
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
上个月,亿万富翁埃隆·马斯克谈到了年轻一代的生育问题。他强调生育的紧迫性,认为无论面临何种困难,生育后代都是必要的,否则人类可能会在无声中走向消亡。他认为人们对于生育的担忧有些过头,担心经济压力等问题
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1