如何大幅度提升EDA仿真效率?华为、概伦电子专家这样说

FPGA开发圈 2022-06-07 10:10

2nm、GAA、3D封装、chiplet、异构....近年来,随着半导体工艺的进步,单颗IC的晶体管数量已经从百亿向千亿甚至万亿数量发展,功能复杂需求也让单颗IC也集成了越来越多的IP,此外 ,工艺的进步也带来了制造商良率的问题,这都给IC设计师带来了极大的挑战,一方面要应付工艺、复杂度提升带来的设计难度挑战,另外还要应付time-to-market带来的效率压力。

而熟悉IC设计的人都知道,过去十年中,IC设计中仿真验证成本的增长速度远高于设计成本。数据表明,包括工程师、软件、硬件在内的验证资源占到整个前端设计的70%,而设计本身只占30%,所以仿真验证在整个集成电路行业当中的占比会越来越高,而且随着工艺的升级,所占比还在提升(如上图所示),所以要确保芯片高效开发,就要提升仿真验证的效率。

5月31日,在电子创新网旗下芯英雄联盟直播频道举办的《EDA仿真最新趋势和效率提升》线上直播活动中,华为数据存储半导体行业解决方案架构师施钻专和概伦电子研发副总裁方君分享了提升EDA仿真效率一些做法。

1、华为存储四大举措提升EDA仿真效率

施钻专指出,目前,EDA仿真平台面临几个困境,一个是面对混合型业务,存储更容易成为瓶颈。这是因为EDA仿真主要分前端业务和后端业务。前端业务主要以RTL编码仿真为主,数据特点基本都是KB级别的小文件,并且主要是8KB左右的文件为主,超过60%以上都是元数据读写,这类场景针对存储的要求就是更高的OPS性能诉求。后端业务,主要以综合优化仿真、编译网表及网表测试为主,主要是GB级别的大文件写场景,这类场景对存储性能要求带宽更高。

EDA仿真平台面临的另个困境是解决方案不匹配或者不会用,表现在:

1、服务器本地盘方案资源利用率低投资浪费, 表现为项目组间资源无法调度无法共享;Temp文件增长迅速服务器容量受限容易爆盘;无专业存储企业特性,易用性差;数据安全无法保障等。

2、共享存储方案选型不对、导致仿真性能差影响研发进度。主要表现为分布式文件系统分片机制只适合大文件大带宽场景、 万亿海量KB级小文件性能不足,存储时延高,仿真卡顿、Lustre等文件系统需MDS等额外元数据节点服务器,增加故障点、高负载下删除时,EDA软件卡顿等。

3、专业存储不会规划使用,具体表现为不懂如何确保仿真业务不中断、关键仿真任务高效执行、不懂如何确保高价值数据安全性?不懂如何实现业务安全隔离、不懂如何在有限的存储空间实现价值最大化,这样会导致资源利用率低、投资浪费等。

针对这样的痛点,华为存储是如何提升EDA仿真效率的呢?施钻专表示华为存储联合IC设计企业在EDA设计仿真过程中的业务诉求,通过系列化的优化,打造半导体设计EDA存储解决方案,大幅缩短EDA仿真周期。

概括起来,有四大举措:

1、从存储层面针对EDA场景8项优化提升仿真性能30%+

施钻专表示针对海量小文件场景,可以通过小IO聚合满条带ROW连续写来优化IO性能,同时也提升了SSD寿命。

针对大量的元数据操作,通过多项核心算法,比如元数据的压紧算法,元数据的预取与淘汰算法等,提升元数据操作性能。

元数据和数据独立分区,有利于提升垃圾回收效率,消除性能瓶颈。

在硬件方面,华为存储专门用了DTOE的智能网卡,把协议从CPU卸载到网卡上,节约网卡缓存到缓存的拷贝时间。

CPU需要处理读写IO、GC、快照等其他特性,把读写IO优先级排最高,这样可以保障读写IO的时延最低。

华为存储采用全局共享的分布式文件系统,基于目录均衡打散,消除控制器的瓶颈,支持自动迁移热点目录到空闲控制器上,实现自动负载均衡。

华为存储使用多核鲲鹏920 CPU,通过CPU智能分区,绑核处理,避免跨CPU核跨控开销,提升CPU的处理效率、降低时延。

EDA场景会有大量删除Temp文件的操作,华为存储专门针对删除操作做了CPU绑核处理,专核专用,确保高负载情况下Delete操作不卡顿。

2、全闪存介质升级,能效优化降低整体TCO

施钻专表示存储介质主要分HDD机械硬盘以及SSD全闪存硬盘。以前大多数IC设计企业,会选择采用1.2TB左右的HDD机械硬盘,通过好几个硬盘柜来堆存储性能,但是这样会导致机房空间、功耗大幅增高。目前越来越多的IC设计企业,尤其是一些先进制程的比如7nm、5nm芯片设计企业,为了性能需求会选择SSD全闪存存储。

从投入产出比看,SSD应用可以大大降低企业的运维成本,相比于传统存储需要配置几十个磁盘机柜、上万块HDD磁盘,SSD只需要几个机柜即可;SSD不仅在空间需求上优势明显,在能耗、运维成本上也非常突出:相对于HDD,在相同的容量下,SSD的电力能耗降低70%,空间占用节省50%。在存储系统中每更换1块SSD,带来的节能减排效果,相当于种了150棵树,以及3360个普通家庭熄灯一小时。

3、存储层丰富的企业软件特性,帮助IC设计企业更好的管理数据提升效率

华为存储提供了很多丰富的软件特性,帮助IC设计企业更好的管理数据,提升工作效率。如多租户特性可以用来确保数据安全隔离。

施钻专表示EDA仿真临时文件较多,如果不做及时删除,空间就会被快速消耗掉,影响到其他用户,这个问题可以通过设置配额的方式来解决,确保存储空间的有效利用。有些关键仿真为了不被其他任务挤占掉存储性能资源,会特别设置一个关键VIP任务的最低性能要求,来确保仿真任务高效完成。

海量小文件一直都是EDA仿真场景的最大难题,华为存储不是通过备份软件对应用层扫描的方式来备份,而是通过底层的快照技术和异步复制技术,来做到Disk to Disk的快速备份,可以有效提升几倍甚至十倍的性能提升。

4、存储层四级可靠为EDA仿真平台平稳运行保驾护航

永远在线的方案:通过业界唯一的NAS Active-Active双活解决方案,确保单套存储故障时不会影响生产。

永远在线的系统:通过RAID TP可以容忍3块硬盘同时失效,另外全闪存储重构1TB时间只需要15分钟,解决块硬盘不影响生产的问题。

永远在线的架构:通过Smart Matrix全互联架构和独有的SMB Failover功能,可以容忍单套存储系统内单个引擎故障或者7个控制器故障,业务不中断。

永远在线的SSD:通过全局磨损与反磨损,来提升SSD的使用寿命,降低IT运维人员压力。

施钻专特别指出华为存储在海思EDA仿真平台使用表明使用之后其前端业务OPS领先48% ,后端业务带宽领先49%!


2、概伦电子如何提升EDA仿真效率?

方君认为可以通过三个方面提升EDA仿真效率,分别是文件存储、EDA算法和算力资源。

文件存储体现在读写速度的不断提升以便处理超大文件、高性能文件IO以支持大量文件同时操作以及文件存储空间的扩展以满足数据量的不断增加。

EDA算法层面体现在EDA 仿真和验证工具的不断演进、更有效的数学算法,比如矩阵求解、更智能的电路结构检测和分区技术、更好硬件结合,高效的CPU指令集、存储管理等;

算力资源体现在多核服务器的支持、计算机集群的支持和速度优化、有效的任务分发和管理机制等。

他指出概伦电子提供的是融合上述三个要素的一站式仿真解决方案,从仿真工具到标准单元库再到电路设计都有覆盖。

如NanoSpice就是概伦电子推出的新一代大容量、高精度、高性能并行SPICE电路仿真器,覆盖模块级模拟电路到全芯片存储器电路,特别对高精度模拟电路和大规模后仿电路的电路仿真进行优化,同时满足高精度、大容量和高性能的高端电路仿真需求。

NanoSpice Pro是一款概伦电子自主研发的FastSPICE电路仿真器,可满足存储器单元设计、存储阵列和编译器验证、存储器特征化及全芯片验证等所有需求,相比其它同类仿真器性能有较明显提高。

而概伦电子的NanoYield良率导向设计平台则可以用于电路良率分析和设计优化。

方君表示概伦电子的NanoCell 是一款快速精确且易用的标准单元库特征化 EDA 工 具,它通过内置的 NanoSpice仿真器,采用先进的分布式并行架构技术和单元电路分析提取算法,精确且高效的对单元电路进行时序、功耗及噪声等特征进行仿真与提取,提供友好易使用的接口,帮助用户缩短产品开发周期。它支持ARM/X86 环境。

此外他还强调,概伦电子建设有基于ARM架构的计算服务中心,服务器超过800台,CPU超过10万核,内存达800TB;服务器本地存储为10PB、 集中高速存储:270TB,网络方面支持25G网络互连 ,最大100G带宽 、支持全链路负载均负载。

他强调概伦电子会围绕三大要素持续和改进以提升EDA仿真效率。

半导体工艺会不断演进,未来EDA工具的重要性日益凸显,随着人工智能、大数据的应用深入 ,EDA仿真效率将不断提升,助力IC设计师设计出更复杂更高性能的IC产品。

未来,电子创新网芯英雄联盟未来还将就EDA仿真数据的可靠性存储、最佳实践、新兴技术应用等举办系列直播活动,敬请关注。欢迎关注芯英雄联盟微信号获取直播信息。

如您想回看《EDA仿真最新趋势和效率提升》直播,可以通过识别二维码观看

*******************

直播预告,6月14日,芯英雄联盟与您相约《3D封装挑战与机遇》,欢迎扫码预约!



FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 119浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 101浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 50浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 120浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 84浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 71浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 100浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 106浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 122浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 68浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 98浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 108浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦