FPGA20年最有影响力的25个研究成果 – 微架构篇

电子森林 2020-03-02 00:00

点击蓝字,关注老石谈芯


很多世界顶尖的“建筑师”可能是你从未听说过的人,他们设计并创造出了很多你可能从未见过的神奇结构,比如在芯片内部的复杂体系。制造芯片的基本材料源于沙子,但芯片本身已经成为人们当代生活不可或缺的东西。如果你使用手机、电脑,或者通过互联网收发信息,那么你就无时无刻不在受益于这些建筑师们的伟大工作。


FPGA是芯片的其中一种,从上世纪八十年代诞生起,FPGA已经从简单的可编程门阵列,发展成为了有着大量可编程逻辑的复杂片上系统。除了硬件结构之外,FPGA的开发工具和应用场景也都取得了长足的进步和扩展,FPGA在整个半导体行业的重要性也在不断增强。FPGA芯片的演进,离不开这些“建筑师”的不断发明创造。


几年前,这些FPGA的顶级建筑师们选出了自上世纪九十年代起的20年以来FPGA领域最有影响力的25个研究成果。通过这些重要的成果,我们会理解FPGA是如何发展至今,并且知道FPGA技术未来将会发展向何处。


这25个研究成果按研究领域分为架构、EDA工具、电路、应用等大类,每项成果都由一名该领域的顶级学者做推介。接下来,我将在几篇文章里,分别介绍这这些改变了FPGA发展进程的重要研究成果。本文是微架构篇。有关FPGA系统架构领域的重要创新成果,可以参见这篇文章。


(本文介绍的5项成果原文,均已上传至知识星球:老石谈芯进阶版,请在文末扫码进入星球查看)


01

在可重构计算阵列中平衡互联与计算

一句话总结:首次考虑了逻辑资源与布线资源的平衡使用,从而得到更优的资源利用率,对FPGA架构与CAD工具设计具有深远影响。

英文名:Balancing Interconnect and Computation in a Reconfigurable Computing Array (or, why you don’t really want 100% LUT utilization)

作者:André DeHon

发表时间:1999年

推介人:Mike Hutton(谷歌)


这项成果完美结合了理论、实证分析,以及富有洞见的探讨。这项工作打破了关于FPGA架构优化的常见假设,特别是通过对比逻辑面积与布线面积,证明了100%的硬件利用率并不一定会带来最优的结果


这项成果首次深入研究了FPGA设计中不同部分的布线需求,分析了最坏情况下的布线要求及其对器件整体的影响。这项成果影响了后来很多关于FPGA架构的研究工作,并在发表十多年后仍然被多次引用。由这项成果发展而成的一项名为HSRA的布线方法,也重新引起了学术界和工业界对层次化FPGA架构设计及分析的兴趣。


这项工作的另外一个贡献是,它清晰的描述了FPGA架构风格与CAD算法风格之间的对应关系 – 在这个工作中就是分层递归分解。Andre DeHon进一步对比了FPGA逻辑互联的增长率与器件大小之间的关系,阐述了高效的系统架构设计的一系列实证结果。


除此之外,这项工作最值得借鉴的地方是它的方法论。通过使用基于树形网格的架构,见下图,可以得到伸缩性更强的FPGA互联架构模型,并对基于逻辑簇(logic clusters)的传统方法提出了挑战。当结果与传统观念不同的时候,Andre DeHon对问题的本质有着清晰而敏锐的认识。这也使得这项工作在FPGA的很多领域有着全面而深远的影响。



02

LUT和簇大小对深亚微米FPGA性能与密度的影响

一句话总结:现代FPGA里6输入LUT结构的理论基础。

英文名:The Effect of LUT and Cluster Size on Deep-Submicron FPGA Performance and Density

作者:Elias Ahmed, Jonathan Rose

发表时间:2000年

推介人:Mike Hutton(谷歌)


Jonathan Rose(现任多伦多大学教授)


这项开创性的研究深入分析了将逻辑单元组成层次化结构的过程中,LUT大小和簇(cluster,结构见下图)大小对系统性能和整体面积的影响。在这项成果发表之前,学术界刚刚开始探索和讨论FPGA里的簇结构。在工业界,Altera和赛灵思尽管已经开始使用层次化结构,但它们有着不同的大小和接口类型,从而限制了其进一步使用。在这个大背景下,这项工作首次探讨了面积和延时的权衡与折中,以及它们与簇输入数量的关系。



这项工作的主要成果,是在给定电路面积的情况下,对理想情况下的输入数量进行了建模,并给出了LUT大小和簇大小的最优范围,以满足特定的面积与延时要求。值得注意的是,这项工作指出5~6输入的LUT会取得比以往都好的面积与延时结果,见下图。而这个结论也为当代PGA里采用的6输入LUT结构奠定了理论基础。



这项工作除了它的结果影响深远之外,它所采用的方法论也有着很强的借鉴意义。两位作者指出,他们得到的这些最优解取决于当时的工艺参数和条件,随着半导体制造工艺的不断进步,这些最优解也会随之变化。他们也在这项工作中给出了一个清晰且可以重用的框架,用来预测和判断当工艺进步时这些最优点的变化情况。


这项工作另外的一个主要贡献是,它建立了一个评估FPGA架构的标准化体系,这其中包含了从综合到布局布线的各个FPGA开发阶段。它也为后续的FPGA架构研究以及CAD算法开发提供了参考标准。


03

在LUT簇中使用稀疏交换结构

一句话总结:现代FPGA布线微架构设计的奠基之作

英文名:Using Sparse Crossbars within LUT Clusters

作者:Guy Lemieux, David Lewis

发表时间:2001年

推介人:Sinan Kaptanoglu(Microsemi公司)


Guy Lemieux(现任英属哥伦比亚大学副教授)


这项成果着重探讨了一个全新的问题,即在不假设全连接的情况下,构建FPGA逻辑簇里的布线架构。在之前的其他工作中,基于逻辑簇的FPGA结构已经被很多研究人员进行了深入研究。然而,这些对簇和LUT大小、互联方式等的研究,都基于簇内布线是全连接的假设。在这项成果中,我们看到如果大量减少负责全连接的交换结构(crossbar),就可以显著的改变簇的最优特性,并保持很好的布线灵活度与较高的系统性能


为了印证这个观点,这项工作首先提出了一种通用度很高的FPGA簇结构,见下图,并引入了面积与延时模型,用来计算和比较面积和性能的相关参数。此外,这项工作还讨论了FPGA架构中各项参数对面积和性能的影响,包括加入额外的LUT输入等等。



这篇文章对FPGA业界有着极大的启发意义。在今天,绝大多数商业级FPGA的布线架构都基于逻辑簇结构,而这些簇都是由部分连接(而非全连接)的交换结构组成的。虽然不同的FPGA厂商、不同的FPGA芯片采用了不同的方法,以实现这种部分连接的交换结构,但其中蕴含的中心思想是类似的。


此外,这篇文章对学术研究也有着重大的影响。这项成果发表后的数年间,其中包含的实验结果被不断的进行理论归纳,并为其他研究者奠定了坚实的理论基础。


04

实验假设、工具和分析技术对FPGA架构研究结论的影响

一句话总结:超越FPGA研究领域的研究方法论佳作。

英文名:On the Sensitivity of FPGA Architectural Conclusions to Experimental Assumptions, Tools, and Techniques

作者:Andy Yan, Rebecca Cheng, Steven J.E. Wilton

发表时间:2002年

推介人:Katherine Compton(威斯康辛麦迪逊大学)


Steve Wilton(现任英属哥伦比亚大学教授)


从事FPGA架构研究的学者都知道,研究使用的实验方法会对架构研究的结果产生重要的影响。对于一个FPGA架构参数,有太多的因素会对它造成影响,比如选取的测试基准电路、用来把电路映射到FPGA上的CAD工具等等。


然而,知道这些因素可能会影响结果是一回事,看到它们确实会影响结果则是另外一回事。这项工作为我们揭示了一个重要结论,那就是通过实验的方法寻找最优的FPGA架构参数可能并不会带来最优结果,因为实验结果可能在很大程度上取决于实验是如何设置的。例如,下图中清晰的展示了当使用不同的CAD工具和设置时,最优的LUT大小会在4到6输入之间来回变化。



更重要的是,这项工作从方法论的角度鼓励研究人员去更加仔细的设计他们的实验,并构建他们的结论。这已经超出了FPGA研究范畴,而对所有刚刚从事科学研究的人都有很大的借鉴意义。这项成果所传递的研究思路,会让研究者仔细审视自己的研究方法,避免只从表面上看到结果。通过这项成果,人们应该意识到仔细构建实验和客观分析结果的重要性,并要永远质疑结果的有效性和适用性。


05

基于纳米线的亚光刻可编程逻辑阵列

一句话总结:利用时代前沿技术设计制造FPGA的开创性研究

英文名:Nanowire-Based Sublithographic Programmable Logic Arrays

作者:André DeHon, Michael J. Wilson

推介人:Deming Chen(伊利诺伊大学香槟分校)


在2003年,基于纳米线的集成电路设计取得了两个突破性成就。其一是哈佛大学发表的一种通用的控制纳米线结构和层级的方法,另一个是惠普实验室发表的对纳米级电路元件进行制造和测试的方法。尽管如此,这个领域的大多数研究仅是专注于纳米线晶体管以及简单的基于纳米线的逻辑和存储单元设计。



受此启发,这项工作的作者抓住机会将纳米元件的制造与纳米系统的设计结合起来,并展现了纳米技术的真正力量。这项成果使用纳米线构建了大型可编程逻辑阵列的布线交换结构,并对系统设计进行了详细建模。此外,这项成果还指出了许多独特的设计挑战与问题,包括如何使用一种随机机制来对纳米级别的二极管的恢复(restoration)问题等等。这项成果还对纳米架构的芯片面积、良率、时序等问题进行了详尽的分析,并将一系列基准测试电路映射到这个新型纳米架构上,以评估他们的逻辑密度。



这项成果详细分析了这种架构的设计和制造挑战,以及它对传统的CMOS FPGA架构的潜在竞争优势。这样的研究对于业界理解纳米科技、以及它将如何给FPGA带来提升有着重要意义。在这项成果的后续工作中,作者还讨论了纳米线结构的制造缺陷等问题。


光刻技术一直是制造CMOS电路的根本性技术之一。这项成果表明,在不使用光刻技术的情况下,利用新兴的制造技术来构建高密度、大规模的可编程逻辑结构是可行的。这也为学术界和业界提供了一种可以超越传统光刻限制的替代方案。



结语

这五个FPGA微架构的重要工作,有的奠定了现代FPGA查找表(LUT)结构与大小的理论基础,有的探讨了FPGA布线结构的设计与优化方法,有的探索了当代最新科技与FPGA的结合。更重要的是,这些工作所采用的方法论、思维方式、前瞻性与实用性的统一、以及严谨的治学态度,都为之后的学术和工业研究树立了最高的典范。


硬禾小帮手 - 硬件工程师的学习助手
硬禾学堂 - 硬件工程师的在线学习平台
电子森林 讲述电子工程师需要掌握的重要技能: PCB设计、FPGA应用、模拟信号链路、电源管理等等;不断刷新的行业新技术 - 树莓派、ESP32、Arduino等开源系统;随时代演进的热点应用 - 物联网、无人驾驶、人工智能....
评论 (0)
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 157浏览
  • 现代旅游风气盛行,无论国内或国外旅游,导航装置无疑就是最佳的行动导游;在工作使用上也有部分职业(如:外送服务业)需要依靠导航系统的精准,才能将餐点准确无误的送至客户手上。因此手机导航已开始成为现代生活上不可或缺的手机应用之一。「它」是造成产品潜在风险的原因之一外送服务业利用手机导航,通常是使用手机支架固定在机车上,但行进间的机车其环境并不一定适用于安装手机,因行进间所产生的振动可能会影响部分的功能,进而导致受损。您是否曾在新闻报导中看过:有使用者回报在机车上使用手机架导航会造成相机无法开启?苹果
    百佳泰测试实验室 2025-03-13 18:17 234浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 150浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 148浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 130浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 171浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 196浏览
  • 各大Logo更新汇报 | NEW百佳泰为ISO/IEC17025实验室,特为您整理2025年3月各大Logo的最新规格信息。USB™▶ USB Type-C/PD 互操作性MacBook Pro 16英寸(Apple M4 Max 芯片,36GB 内存–1TB SSD–140W USB-C电源适配器)或 MacBook Pro 16英寸(M4 Pro芯片,24GB内存–512 TB SSD–140W USB-C电源适配器),这些型号支持USB4 80Gbps传输速度和 140W EPR功率。需尽
    百佳泰测试实验室 2025-03-13 18:20 204浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 201浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 188浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦