大规模SoC原型验证面临哪些技术挑战?

FPGA开发圈 2024-06-06 12:03

引言

随着电子设计自动化(EDA)验证工具的重要性日益增加,开发者们开始寻求减少流片成本和缩短开发周期的方法。其中,使用可编程逻辑芯片(FPGA)来构建有效的验证流程成为一种流行的解决方案,这种方法被称为原型验证


原型验证在EDA流程中起到了至关重要的作用。一方面,它可以对芯片进行功能验证,确保设计的基本功能符合预期。在基本功能验证通过后,通过原型验证就可以提前开始驱动的开发,不用等待芯片流片(Tape Out)后的结果。当芯片回片后,应用程序可以直接基于原型验证版本的驱动进行简单的适配,从而应用于SoC(系统级芯片)上,这极大地缩短了SoC芯片的上市时间(Time-to-Market)。


但随着ASIC设计变得越来越庞大和复杂,开发周期也日益紧迫,需要左移验证周期。相较于硬件仿真,原型验证变得愈发重要。然而,单片FPGA已无法满足大规模SoC的需求,商用原型验证系统的使用已经迈入多FPGA系统的时代。如今的研发团队迫切需要一款自动化程度高、性能强、稳定性好的国产商用原型验证平台。这样的平台不仅需要具备强大的RTL级分割、多片FPGA之间的互联拓扑结构、高效的自动化流程、优化的性能和可靠的稳定性,还需要满足国产化和可扩展性的要求,才能帮助芯片公司在激烈的市场竞争中脱颖而出。这些都对当前的原型验证提出了更高的要求,也带来了前所未有的技术挑战。


01

大规模SoC原型验证技术的挑战


高性能


软件开发团队的目标是在平台上尽早进行软件开发,确保验证的软件能快速移植到实际芯片上,性能达到测试需求(10MHz以上)。这意味着原型验证平台不仅要准确模拟最终芯片的行为,还要提供与实际硬件一致的环境,确保开发阶段发现的问题不会在最终产品中重现。这对平台的准确性和兼容性提出了高要求,主要挑战在于保持模拟环境与实际硬件的一致性,并在较低频率下进行高效调试和验证。


大规模设计分割


由于大规模复杂SoC设计规模庞大,将设计映射到由多个FPGA组成的网络,即设计分割。如何自动化、高性能并加速实现大规模原型验证系统?要做好设计分割,关键就在于解决并行综合、并行编译、自动化编译、增量编译、RTL自动分割和自动化管脚复用TDM IP等技术点。


首先是设计综合时间长。对于几亿甚至数十亿门的SoC设计,如果将整个设计映射到FPGA进行综合,时间可能长达数天或数周。这对于需要频繁修改代码的用户来说是不可接受的。因此,需要采用并行综合的方法。


再者就是编译时间长。面对特别大的设计规模,编译时间过长不仅会延缓开发进度,还会影响设计的迭代和优化。具体而言,开发者需要等待编译完成,无法快速进行下一步操作,降低了工作效率;每次修改代码后都需要长时间等待编译结果,限制了设计的快速迭代和优化;长时间的编译需要占用大量计算资源和时间,增加了项目的成本和资源消耗。这就需要采用并行编译、全自动编译和增量编译等方法。


其次是RTL级分割。使用RTL分割工具对大规模SoC设计进行分析和资源估算,然后分层分割为多个以目标FPGA为顶层的RTL模块,并行综合这些模块以缩短时间。虽然RTL级自动分割能显著减少工作量,但其实现难点在于分割算法的效率和精度。市场上供应商的分割算法成熟度不一,面对更复杂和大规模设计时,仍需不断改进。


最后是时分复用(TDM)技术的挑战。TDM通过在不同时间段内共享同一物理资源,提高资源利用率。在原型验证中,TDM可以用于复用FPGA管脚,从而减少对FPGA资源的需求。这对于高密度设计尤为重要,能有效应对有限的FPGA资源限制,确保设计能够正确映射并运行。


基于高速收发器(Transceiver)IO的管脚时分复用(TDM)IP有两种分割模式:


自动化分割模式:使用专门的软件进行大规模SoC设计的自动化分割,并利用FPGA的Transceiver IO实现单拍传输的TDM IP。这种方式省时省力,但带来的性能开销使分割后的系统最高只能工作在20MHz左右,无法满足某些大规模芯片设计的原型验证速度需求。


总线协议分割模式:基于FPGA之间的Transceiver IO进行总线协议分割。分割后的系统时钟能工作在几十MHz到100MHz以上,满足高性能需求。但这种方式要求FPGA之间的分割边界只能是总线接口,且用户需要手动例化Transceiver接口IP设计。


这两种分割模式各有优缺点。自动化分割模式更省时省力,但性能有限;总线协议分割模式性能更高,但只能在限定环境下使用。如何结合先进的分割算法和TDM技术,显著提高SoC设计的验证效率,是许多商用原型验证供应商的关键技术竞争点。


完整工具链支持


完善的工具链是缩短实现周期、减轻团队负担的关键,包含协同仿真软件、远程访问与管理、多用户模式等。不成熟的工具会导致团队花费大量时间在调试上,并可能导致频繁的错误和不准确的分割结果,从而延长开发时间和浪费资源。只有具备这些特性的自动化工具链,才能满足现代芯片设计和验证的需求,显著提高生产力和工作效率。


丰富的外设子卡方案


为了更好地支持软硬件联合开发,原型验证平台需要配备特殊的高速外围接口,如DDR4、USB 3.0和PCIe Gen5等,实现高效的数据传输和交互。选择BYO(Build Your Own)的开发团队自行设计子卡,会增加调试的不确定性和调试周期。高速接口的调试通常消耗大量人力资源,很多问题只能依靠调试经验解决,费时费力且效果不佳。此外,一些Memory控制器IP由于缺乏FPGA厂商提供的PHY解决方案,无法在原型验证系统中正常运行,增加了设计验证的风险。


因此,原型验证平台需要提供丰富的外设子卡方案,支持多种高速接口,并确保其性能稳定,以减少开发团队的工作量,提高调试效率,确保SoC设计的准确性和可靠性。


调试与观测


大规模设计调试是原型验证领域又一挑战,当用户的待验证 SoC 设计下载到原型验证系统无法正常运行的时候,开发人员需要有效的调试方案来排查故障的原因。开发人员需要有效的软件调试和观测工具,以快速定位和解决问题。


强大的调试工具包括逻辑分析仪(ILA)、协议分析仪和实时监控工具等。这些工具必须能够与原型验证平台无缝集成,提供实时的调试信息和可视化的数据分析功能。此外,还需要支持远程调试,以便在不同地理位置的团队之间进行协作。主要挑战在于如何在不影响系统性能的情况下,提供详尽的调试信息,以及设计直观高效的调试界面。确保这些工具能够快速、准确地反馈系统状态和数据,以便开发人员及时发现和解决潜在问题。


虽然用户可以用 FPGA 厂商提供的 ILA 进行多 FPGA 的级联调试,但是也存在着诸如用户逻辑资源占用,存储深度,Probe 数量及多FPGA 的 Trigger 信号触发的使用场景限制。为了满足用户以上的高密原型验证系统调试场景需求,用户需要有更强大的调试方案支持对大型 SoC 设计进行全系统的调试,利用最少的资源,完成多颗FPGA 的并行深度调试。


平台稳定性&产品方案


从项目角度来看,选择商用原型验证平台需要根据设计规模确定合适的容量,满足各种项目需求。该平台必须实现全芯片设计和验证,具备稳定、可靠的性能,能执行长时间、不间断的硬件压力测试。此外,供应商应有丰富的产品选择,大量现货供快速交付,以及有效的供应链管理,能够快速响应客户需求,提供全面的技术支持,包括快速响应的FAE服务。国外厂商可能无法提供本地化服务,而新兴供应商往往缺乏客户积累和成熟的售后支持团队。


02

Prodigy芯神瞳原型验证解决方案



思尔芯的Prodigy芯神瞳提供稳定可靠的产品,配备完整的工具链,以及丰富的外设接口子卡、内存模型、降速桥方案等,提升验证效率,缩短芯片的验证周期。其设计分割后的性能高达20-50MHz,单机可达500MHz,满足多种复杂SoC验证需求,适用于架构设计、系统集成、软件开发、全系统验证和回归测试等多个应用场景。思尔芯在软件功能和子卡方面不断加大投入,特别是针对RTL逻辑分割、子卡开发和复用等复杂问题,Prodigy芯神瞳采用多种调试手段,时序驱动的RTL级分割算法和内置的增量编译算法,为工程师提供强有力的支持。


时序驱动的RTL分割,实现全自动编译


思尔芯的Prodigy芯神瞳支持时序驱动的RTL分割,提供高速且稳定的通用Serdes TDM IP,能够处理大型IP设计,支持高达25Gbps的分割速率和8K:1的时分复用比。它还支持并行编译、分布式编译、全自动编译和增量编译,大大减轻了团队的负担。


具体而言,在多片系统中,大规模设计分割对于确保复杂ASIC设计能够高效、准确地进行原型验证至关重要。思尔芯的Prodigy芯神瞳通过先进的增量编译和TDM时分复用等技术,进一步优化了分割的效率和性能。其时序驱动的RTL级分割算法能够自动处理分割后设计中的TDM插入问题,实现全自动的分割编译流程。这一过程不仅简化了设计分割,还通过内置的增量编译算法功能提供了更快的设计迭代和错误排查能力,使设计工程师能够更高效地评估和验证设计改动,从而直接提升系统的整体性能。


此外,思尔芯提供了Chiplink作为AXI总线的分割方案,可为Arm、RISC-V等外置支持方案提供了更高效的解决方案。思尔芯的低延迟Chiplink AXI IP方案支持高达1024位宽的AXI DATA位宽,并能在每个Bank支持最多4组AXI协议,同时提供多种可配置的Serdes线速率,显著提升了多核处理器和AXI周边设备的速度和性能。



图为Prodigy 芯神瞳RTL级设计分割流程


通过这些先进的工具和功能,思尔芯不断简化验证过程,提高设计效率,确保用户能够快速且准确地完成验证任务。


多种调试手段,可远程管理和调试


Prodigy芯神瞳提供了一系列灵活且高效的调试手段,使得远程管理和调试变得简单高效。它支持多配置方式、实时硬件监控、远程系统控制和硬件自检测等功能。尤其是基于网络的AXI Transactor,允许远程通过网络访问和控制连接到AXI接口的设备。这对于远程调试和测试非常有用,可以在不同地点对硬件进行操作和监控。此外,思尔芯还提供了MDM Pro调试解决方案,提供最高125MHz的采样频率和最大64GB的波形存储容量,能有效解决原型验证中多FPGA的协同调试问题。


丰富的产品配置与容量


在硬件方面,Prodigy芯神瞳原型验证解决方案具备丰富多样的产品配置,适用于小、中、大等各种规模设计,比如:




逻辑模块 Logic Module(LM)-采用轻便型的单板结构和外设接口,单机器3M~116M ASIC gates。通过支持高速 I/O 连接器互连实现高可扩展性和高可重用性,为用户在多个项目之间快速切换和重复使用提供了便利。


逻辑系统 Logic System(LS)-桌面级原型验证系统,单机器14M~400M ASIC gates,。采用高度模块化及一体化的设计,提供高灵活性和优良性能,是中小型设计项目的理想选择。


逻辑矩阵 Logic Matrix(LX)-适用于超大规模芯片设计与验证的企业级高密原型验证产品,单机器232M~392M ASIC gates。成熟的多板级联方案使其具有易于超大规模逻辑扩展特性,客户端已成功部署百亿门级系统。


90多种子卡,实现快速部署


Prodigy芯神瞳还提供多种子卡和参考设计,使用户能够快速实现所需的I/O接口和外围设备,实现快速部署原型环境。Prodigy芯神瞳外置应用库具有以下优势:覆盖率高,90多种子卡和配件覆盖主流应用领域;实用性强,现成的解决方案加速系统原型验证。多种模块类别可供选择:Arm处理器接口模块、嵌入式和多媒体模块、通用扩展模块、通用接口模块、高速GT接口模块、存储模块等。




产品稳定可靠,全球客户600+


思尔芯自2004年在上海成立以来,一直聚焦于数字前端EDA领域,并且是业内最早开发原型验证工具的企业之一。自2005年推出第一款原型验证产品起,思尔芯持续推出了八代产品,经过多次迭代,在材质、架构、系统以及高速PCB仿真技术等方面的不断优化下,思尔芯已成为加快软件开发和芯片设计验证的优选解决方案。


凭借20年的技术积累,Prodigy芯神瞳已成为市场认可的成熟产品,满足了不断演进的原型验证需求,并补充了诸多独特的产品功能。如今,思尔芯的产品因其成熟和质量稳定,获得了全球600多家客户的认可和使用。作为国产EDA的代表企业,思尔芯以其快速响应能力赢得了客户的信任和支持,多年来客户对产品的认可已超过三大家,已成为该领域的行业标杆。

关于思尔芯 S2C


思尔芯(S2C)自 2004 年设立上海总部以来始终专注于集成电路 EDA 领域。作为国内首家数字 EDA 供应商,公司业务已覆盖架构设计、软件仿真、硬件仿真、原型验证、数字调试、EDA 云等工具及服务。已与超过 600 家国内外企业建立了良好的合作关系,服务于人工智能、高性能计算、图像处理、数据存储、信号处理等数字电路设计功能的实现,广泛应用于物联网、云计算、5G 通信、智慧医疗、汽车电子等终端领域。


公司总部位于上海,并建立了全球化的技术研发与市场服务网络,在北京、深圳、西安、香港、东京、首尔及圣何塞等地均设有分支机构或办事处。


思尔芯在 EDA 领域的技术实力受到了业界的广泛认可,通过多年耕耘,已在数字前端 EDA 领域构筑了技术与市场的双优势地位。并参与了我国 EDA 团体标准的制定,承担了多项国家及地方重大科研项目,获国家级专精特新“小巨人”企业、国家工业软件优秀产品、上海市级企业技术中心等多项荣誉资质。


了解更多详情,请访问www.s2ceda.com


【预约直播】


FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 114浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 180浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 42浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 66浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 170浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 73浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦