LatticeNexus2平台:低功耗、高性能、小尺寸FPGA再创新高

原创 Latticesemi 2024-12-20 17:43

摘要 

小型FPGA平台通常是指逻辑密度低于200K SLC(系统逻辑单元)的FPGA,这正是莱迪思FPGA的优势所在。莱迪思Nexus™ 2 FPGA平台基于16 nm工艺节点。本文介绍了莱迪思Nexus 2平台在推出时与其他现有的同类FPGA的比较分析。分析包括功耗、启动时间、尺寸和安全特性。本白皮书探讨了这些因素如何影响总体拥有成本(TCO)和各种应用。

1

引言 

莱迪思半导体于2019年推出了Lattice Nexus™平台,为低功耗、小尺寸FPGA设定了新标准。在这一成功的基础上,莱迪思Nexus™ 2平台进一步增强了这些功能,与竞品相比,在功耗、尺寸、启动速度和安全性方面有了显著的提升。本白皮书探讨了莱迪思Nexus 2平台相对于市场上同类FPGA竞品器件的主要优势,并重点介绍了莱迪思Nexus 2器件加入莱迪思小型FPGA产品组合中后拓展了哪些应用

2

Lattice Nexus 2拓展了逻辑和性能

2.1莱迪思Nexus 2平台的新功能

莱迪思Nexus 2平台通过扩展其逻辑密度和性能,对原有的Nexus平台进行了补充。一般来说,莱迪思Nexus 2器件的逻辑密度、SERDES带宽和外部存储器接口速度接近原来的2倍。下表重点介绍了两者的差异:

Lattice Nexus 2的强大性能可以带来以下好处:

  • 更高的数据吞吐量:更高的SERDES带宽和支持PCI Express可实现更快的数据传输速率,这对高带宽数据和视频桥接应用至关重要。 

  • 提高存储性能:更高的LPDDR4数据传输速率有助于更快地访问存储器,提高整体系统性能并降低延迟。 

  • 更快的闪存配置:将闪存接口宽度从4增加到8,并将单倍数据速率(SDR)提高到双倍数据速率(DDR),即使在逻辑密度增加的情况下也能保证瞬时完成配置。 

  • 增强时序收敛:优化时序收敛为布局布线提供了更大的灵活性,降低了延迟,提高了资源利用率,从而支持更复杂的应用。 

  • 单位逻辑更多的DSP:更多的DSP模块允许对复杂算法、视频处理和网络边缘人工智能推理进行更多并行操作,降低延迟,从而提高应用的实时性能。

凭借莱迪思小型FPGA产品组合中的这些扩展功能,开发人员可以选择从莱迪思Nexus或Nexus 2平台中挑选最佳器件来满足他们的设计目标。

3

Lattice Nexus 2平台的主要竞争优势 

莱迪思是小型FPGA领域的领导者。莱迪思Nexus FPGA系列(莱迪思CrossLink™-NX、莱迪思Certus™-NX和莱迪思MachXO5™-NX)支持各类注重低功耗、小尺寸和需要降低总体拥有成本(TCO)的应用。莱迪思Nexus 2平台继续强调这些特性,与竞品相比具有多项竞争优势: 

  • 外部闪存启动速度提高20倍:确保快速启动、缩短响应时间和即时故障恢复,这些都是高可靠性系统的重要要求。 

  • 功耗降低高达3倍:莱迪思Nexus 2平台的优化架构与同类FPGA竞品相比,功耗最多可降低3倍。 

  • 尺寸最多减小5倍:莱迪思Nexus 2拥有16 Gbps SERDES,尺寸比竞品小5倍。开发人员可以在更小的PCB上自由地放置器件。 

  • 简化电源管理:莱迪思Nexus 2器件使用简化的供电网络(PDN),无电源时序要求。 

  • 同类产品中最强的安全性:莱迪思Nexus 2集成了先进的安全特性以抵御潜在威胁,确保数据完整性和器件可靠性。功能包括AES-GCM、SHA-3、ECDSA和RSA。

莱迪思通过硬件测试以及比较产品数据表和用户指南中的参数对上述内容进行了验证。 

3.1 竞品比较和应用实例

在对比与竞品器件的性能时,莱迪思选择了AMD的Artix™ Ultrascale+ AU20P、Altera的Cyclone® 10GX 220和莱迪思Certus-N2 CT20 FPGA。比较的重点是功耗、尺寸、配置时间和总拥有成本。结果表明,莱迪思Certus-N2 CT20 FPGA在所有这些方面都优于竞品。 

3.2 快速的外部闪存配置

在任何设计中,快速配置都是至关重要的,尤其是在安全性至关重要的环境中,如生产车间或仓库中的机器人。为确保工人安全,所有系统都必须具备即时故障恢复能力。如果系统出现故障,需要立即恢复,这依赖于设计的启动速度。例如,如果智能传感器发生故障,它必须几乎在瞬间恢复运行,继续监控生产现场的安全状况。 

同样,在汽车分区网关中,系统必须迅速唤醒响应外部事件,确保驾驶员和乘客的安全。支持快速启动的设计可以在大部分时间内保持低功耗状态,并对唤醒信号迅速做出反应,提高整体效率和安全性。 

3.2.1 比较配置速度 

测量闪存配置速度的方法如下: 

  1. 所有设计均基于RTL(寄存器传输级)。没有随机存储器初始化,这增加了配置文件的大小。 

  2. 配置镜像是未压缩的纯位流。 

  3. 无位流验证。 

  4. 器件仅使用单个配置闪存来模拟最低BOM。 

  5. 配置时间是从INIT有效(不包括各种电源轨的上升时间)到DONE(完成)信号引脚有效的时间。

结果如下表所示:


测量结果表明,莱迪思Certus-N2 CT20器件比竞品最高快20倍。这是莱迪思Nexus 2平台的一个显著优势。 

3.2.2 影响FPGA启动时间的因素 

有几个因素会影响FPGA从外部闪存进行配置的时间: 

  1. 闪存速度:闪存的读取速度直接影响到向FPGA传输配置数据的速度。 

  2. 时钟频率:配置过程中使用的时钟频率会影响数据传输速率。 

  3. 接口类型:闪存和FPGA之间使用的接口类型(如SPI、并行、接口宽度)都会对数据传输速率产生重大影响。

  4. 配置数据大小:更大的位流需要更长的传输和配置时间。 

让我们对每个因素进行分析,了解为什么莱迪思Certus-N2比竞品器件启动得更快。 

3.2.3 莱迪思Certus-N2如何实现更快启动? 

所有三种FPGA都使用其最大内部配置时钟频率,通过类似的闪存结构进行配置。然而,莱迪思Certus-N2器件的闪存时钟频率是所有FPGA器件中最快的,达到了160 MHz。紧随其后的是127.5 MHz的AU20P和60 MHz的Cyclone 10GX220。 

影响FPGA启动时间的下一个因素是接口类型。AMD和Altera FPGA支持QSPI闪存接口(4位)和单倍数据速率(SDR)。相比之下,Certus-N2支持DDR xSPI闪存接口(8位),在使用相同时钟速率时,带宽是QSPI接口的四倍。 

最后,莱迪思Certus-N2器件得益于Nexus 2平台的4输入LUT架构而脱颖而出,该架构可以很好地优化面积利用率。相比之下,AMD采用的是6输入LUT,Altera采用的是ALM,这是一种8输入LUT,可以配置为LUT4或LUT6。这些较大的结构其配置数据也更大。莱迪思Certus-N2更小的位流和更快的配置接口相结合,在启动时间方面具有显著的优势。 

影响启动时间的因素概述如下。估计的比较系数与实际测量值相近。

3.3 比较功耗 

功耗是所有应用中的一个关键因素。尽量降低功耗不仅能提高系统效率,还能带来多种好处。功耗降低可延长电池寿命,简化热管理,提高器件寿命和可靠性。这些优势共同降低了总体拥有成本,让低功耗设计备受青睐。 

3.3.1.测量的功耗结果 

以下是测量功耗的方法: 

  1. 所有三款FPGA均采用相同的RTL设计。

  2. RTL设计在三个FPGA中占用的资源近似,约为107K SLC(61K LUT和122K寄存器)。

  3. 功耗测量在0MHz至300 MHz的频率范围内进行。 

结果如下图所示:

比较结果表明,在整个工作频率范围内,莱迪思Certus-N2的静态和动态功耗都最低。

3.3.2. 影响FPGA功耗的因素 

FPGA平台的架构决策是造成功耗差异的主要原因。FPGA中LUT4(4输入查找表)与LUT6(6输入查找表)的功耗会因多种因素而有所不同: 

  1. 静态功耗:与LUT6相比,LUT4的静态功耗通常更低,因为它们的配置位数更少,面积更小。 

  2. 动态功耗:LUT6可以最大限度地减少实现功能所需的逻辑级数,从而降低动态功耗。 

  3. 面积效率:LUT4具有更高的面积效率,可减少漏电,从而降低静态功耗。

  4. 性能/设计选择:LUT6能够以较少的逻辑级数实现更复杂的功能,因此通常具有更高的性能。 

总之,虽然LUT4通常在静态功耗和面积效率方面更胜一筹,但LUT6在性能方面也更有优势。在大多数小型FPGA应用中,LUT4可提供足够的性能。 

3.4. 比较尺寸 

在比较器件尺寸时,我们的目标是在提供基本功能的同时,选择最小的外形尺寸。莱迪思Certus-N2 CT20采用11 x 9 mm²封装,带有高速SERDES。相比之下,19 x 19 mm² Altera Cyclone 10GX 220和23 x 23 mm² AMD Artix Ultrascale+ AU20P也具有类似的功能。莱迪思Certus-N2 CT20 FPGA比最小的AU20P封装还小五倍。 

较小的尺寸不仅能节省PCB面积,还能简化系统内的元件布局。此外,更小的器件通常意味着更低的功耗和更高的成本效益,使其成为各种应用的理想选择。

3.5. 比较总拥有成本 

电路板的总拥有成本(TCO)包括电路板在整个生命周期内与设计、制造、运行和维护相关的所有费用。我们可以从使用这些FPGA进行设计时的物料清单(BOM)开始比较。

由于配置位流较大,AU20P和10GX220所需的配置闪存至少是莱迪思Certus-N2的两倍,因此成本较高。莱迪思Certus-N2功耗更低,外形小巧,因此无需散热器或占用额外的PCB尺寸。此外,与AU20P和10GX220相比,莱迪思Certus-N2具有更简单的供电设计,降低了使用莱迪思Certus-N2进行设计时的BOM和开发成本。 

在考虑总体拥有成本(TCO)时,系统的生命周期维护至关重要。因此,所用器件的安全性和可靠性成为关键因素。采用更安全可靠的FPGA设计的系统可降低黑客成功入侵的几率。莱迪思Nexus 2器件支持后量子安全AES-GCM和SHA-3算法,以及业界公认的ECDSA-521和RSA4K验证。在发生中断的情况下,更可靠的FPGA也能更快地恢复,并将黑客的影响降至最低。莱迪思Certus-N2可以通过瞬时上电配置快速恢复,保持系统运行,不会出现明显的中断。如下表所示,莱迪思Nexus 2器件在安全可靠性方面尽显优势。

3.6. 莱迪思Nexus 2的应用 

在本节中,我们将概述莱迪思Nexus 2平台的主要特性可以实现哪些应用。 

  • 马达控制机器人:自动化机器人技术在工业车间的应用越来越广泛,这就要求为经常与机器打交道的工人提供更多保护。增强的安全性和快速故障恢复功能可确保机器在工业环境中安全可靠地运行。 

  • 汽车区域网关:这是现代汽车电气和电子架构中的一个关键组件,旨在按物理位置管理汽车内的电子系统。分区网关的好处之一是提高效率,减少传感器、传动器和同一区域内其他设备的延迟。使用具有瞬时配置的莱迪思Nexus 2器件可缩短唤醒时间,确保对外部事件做出及时响应。 

  • 网络边缘监控:有些应用可能只需要FPGA进行周期性处理,例如人或物体存在检测。传统上,如果不持续处理网络边缘的数据,FPGA可能会处于空闲状态。对于电池供电系统或在散热条件较差的户外环境中的应用,莱迪思Nexus 2 FPGA可以在空闲期间断电,并使用瞬时启动的配置来捕捉下一个处理周期。电源的占空比(Duty-Cycle)功能可进一步降低平均功耗,减少散热压力,提高系统的可靠性。

莱迪思将电源占空比用例与竞争对手进行了比较。使用电源占空比功能时,莱迪思Certus-N2的平均功耗最多比竞品低8倍。AU20P和Cyclone 10GX 220的启动时间较长,约为200-300毫秒。为了利用占空比节省能量,它们只能以1到3Hz的周期运行,否则将保持全时“工作”状态。有关这一概念的说明,请参见下图。

通过比较总功率(曲线下的面积),我们可以明显看出,莱迪思Nexus 器件在网络边缘监控应用中,在保持高性能的同时,还能高效利用占空比节约能源。

4

结论 

莱迪思Nexus 2平台代表了小型FPGA技术的重大进步,以紧凑的小尺寸提供无与伦比的能效、性能和安全性。开发人员可以通过这些增强功能,加快产品开发,满足网络边缘应用不断发展的需求。未来的Nexus 2系列将引入更多的功能,包括集成闪存、更强的安全性、更快的D-PHY和硬核C-PHY功能,进一步巩固莱迪思作为低功耗小型FPGA领导者的地位。

Latticesemi 莱迪思半导体(NASDAQ: LSCC)提供基于低功耗FPGA、视频ASSP、60 GHz毫米波无线技术以及各类IP的智能互连解决方案,服务于全球消费电子、通信、工业、计算和汽车市场。我们致力于帮助客户加速创新,构建一个更智能互连的世界。
评论
  • 服务器应用环境与客户需求PCIe 5.0高速接口技术的成熟驱动着生成式AI与高效能运算等相关应用蓬勃发展。在随着企业对服务器性能的要求日益严苛,服务器更新换代的周期也持续加快。在此背景下,白牌与DIY(Do It Yourself)服务器市场迎来了新的发展契机,但同时也面临着更趋复杂的技术挑战。传统上,白牌与DIY服务器以其高度客制化与成本效益优势受到市场青睐。然而,随着PCIe 5.0等高速技术的导入,服务器系统的复杂度大幅提升,对组装技术与组件兼容性也就提出更高的要求。举个简单的例子来说,P
    百佳泰测试实验室 2025-03-06 17:00 50浏览
  • 引言嘿,各位电动汽车的爱好者们!咱们今儿个就来聊聊电动汽车里那些“看不见,摸不着”,但又至关重要的零部件。要说电动汽车这玩意儿,那可真是科技含量满满,各种高精尖的技术都往里堆。但要让这些高科技玩意儿协同工作,稳定可靠地运转,那就得靠一些幕后英雄,比如说——电容器。你可能会想,电容器?这不就是电子电路里常见的元件嘛,能有多重要? 哎,你可别小瞧了这小小的电容器。在电动汽车的心脏地带——高压直流转换器(DC-DC转换器)里,车规级的电容器那可是扮演着举足轻重的角色。 今天,咱们就聚焦分析三星电机车规
    贞光科技 2025-03-05 17:02 90浏览
  • 多人同时共享相同无线网络,以下场景是否是您熟悉的日常?姐姐:「妈~我在房间在线上课,影音一直断断续续的怎么上课啊!」奶奶:「媳妇啊~我在在线追剧,影片一直卡卡的,实在让人生气!」除此之外,同时间有老公在跟客户开在线会议,还有弟弟在玩在线游戏,而妈妈自己其实也在客厅追剧,同时间加总起来,共有五个人同时使用这个网络!我们不论是在家里、咖啡厅、餐厅、商场或是公司,都会面临到周遭充斥着非常多的无线路由器(AP),若同时间每位使用者透过手机、平板或是笔电连接到相同的一个网络,可想而知网络上的壅塞及相互干扰
    百佳泰测试实验室 2025-03-06 16:50 42浏览
  • 文/Leon编辑/cc孙聪颖2025年全国两会进行时,作为“十四五”规划收官之年,本届两会释放出坚定目标、稳中求进、以进促稳等信号。其中,企业家们的建议备受关注,关系到民营经济在2025年的走向。作为国内科技制造业的“老兵”,全国人大代表、TCL集团创始人及董事长李东生在本届两会中提出三份代表建议,包括《关于优化中国科技制造业融资环境的建议》、《关于加强AI深度伪造欺诈管理的建议》和《关于降低灵活就业人员社会保险参保门槛的建议》,表现出对科技制造、AI发展和劳动者保障方面的关注。会后,李东生接受
    华尔街科技眼 2025-03-06 19:41 47浏览
  • 产品质量合格率偏低会引起质量成本(也称“劣质成本”)的大幅增加。质量成本通常分为内部损失成本和外部损失成本两部分。内部损失成本是指产品交付前因质量不合格造成的损失,包括返工、报废等;外部损失成本是指产品交付后因质量问题导致的损失,如退货、召回等。此外,质量问题还会影响生产效率,带来额外人工和停工损失。下面分别介绍各类损失的具体计算方法和公式。直接成本损失(内部故障成本)直接成本是由于产品在出厂前质量不合格所造成的看得见的损失。常见的直接损失包括返工、报废以及由此产生的额外原材料消耗等。返工成本:
    优思学院 2025-03-05 15:25 80浏览
  • 文/Leon编辑/侯煜‍2008至2021年间,创维以高举高打的凌厉之势,果断进行投资,一度成为中国市场大屏OLED产业的旗手,引领着显示技术的发展方向。但近年来,创维在 OLED 领域的发展轨迹却逐渐模糊,态度陷入暧昧不明的混沌状态。究其根源,一方面,创维对过往的押注难以割舍,在技术革新与市场变化的浪潮中,不愿轻易推翻曾经的战略布局;另一方面,早期在大屏OLED 技术研发、市场推广等环节投入的巨额资金,已然形成沉没成本,极大地限制了创维在显示技术路线上的重新抉择。但市场瞬息万变,为适应激烈的行
    华尔街科技眼 2025-03-05 20:03 147浏览
  • 在六西格玛项目中,团队的选择往往决定了最终的成败。合适的团队成员不仅能推动项目顺利进行,更能确保最终成果符合预期。因此,组建六西格玛团队时,必须挑选最合适的人才,确保他们具备必要的能力和特质。团队主管的关键特质每个精益六西格玛项目都需要一位主管来带领团队。他们不仅需要具备领导力,还要能够分析数据、制定策略,并与管理层和团队成员高效沟通。团队主管的核心职责包括:领导团队行动:能够激励成员,确保团队朝着既定目标前进。数据分析能力:精通数据处理和分析,能基于数据做出决策。沟通协调:能够在管理层和团队之
    优思学院 2025-03-06 12:51 98浏览
  • 在当今竞争激烈的市场环境中,企业不仅需要优化成本,还需积极响应国家的能源政策,减少对环境的影响。提升工业能源效率正是实现这一双重目标的关键。中国近年来大力推进“双碳”目标(碳达峰、碳中和),并出台了一系列政策鼓励企业节能减排。通过宏集CODRA的Panorama解决方案,企业可以获得专为这一目标设计的SCADA工具,实时监控和调整所有工业设备的能耗。特别是其中的能源管理模块,能够有效分析数据,预防故障,避免能源浪费。Panorama的优化技术宏集CODRA提供的解决方案,尤其是Panorama
    宏集科技 2025-03-06 11:25 115浏览
  • 概述随着工业4.0的深入推进,制造业对自动化和智能化的需求日益增长。传统生产线面临空间不足、效率低下、灵活性差等问题,尤其在现有工厂改造项目中,如何在有限空间内实现高效自动化成为一大挑战。此次项目的客户需要在现有工厂基础上进行改造,空间有限。为此,客户选择了SCARA型线性轴机器人作为执行设备。然而,SCARA机器人的高效运行离不开强大的控制系统支持。宏集凭借其先进的智能控制系统,为客户提供了高效、灵活的自动化解决方案,确保SCARA机器人在有限空间内发挥最大效能。一、客户需求在此次改造项目中,
    宏集科技 2025-03-06 11:27 120浏览
  • 随着自动驾驶技术的迅猛发展,构建高保真、动态的仿真场景成为了行业的迫切需求。传统的三维重建方法在处理复杂场景时常常面临效率和精度的挑战。在此背景下,3D高斯点阵渲染(3DGS)技术应运而生,成为自动驾驶仿真场景重建的关键突破。一、3DGS技术概述与原理1、3DGS的技术概述3DGS是一种基于3D高斯分布的三维场景表示方法。通过将场景中的对象转化为多个3D高斯点,每个点包含位置、协方差矩阵和不透明度等信息,3DGS能够精确地表达复杂场景的几何形状和光照特性。与传统的神经辐射场(NeRF)方法相比,
    康谋 2025-03-06 13:17 123浏览
  • ASL6328芯片支持高达 6.0 Gbps 运行速率的交流和直流耦合输入T-MDS 信号,具备可编程均衡和抖动清理功能。ASL6328 是一款单端口 HDMI/DVI 电平转换 / 中继器,具有重新定时功能。它包含 TypeC双模式 DP 线缆适配器寄存器,可用于识别线缆适配器的性能。抖动清理 PLL(锁相环)能够消除输入抖动,并完全重置系统抖动容限,因此能更好地满足更高数据速率下 HDMI 抖动合规性要求。设备的运行和配置可通过引脚设置或 I2C 总线实现。自动断电和静噪功能提供了灵活的电
    QQ1540182856 2025-03-06 14:26 86浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦