在数字芯片后端设计流程中,布局规划的好坏直接影响整体设计的时序收敛以及布线质量,因此其过程需要经历反复迭代。随着先进工艺的不断发展,设计规模日趋庞大,后端设计的每个环节所需的时间也相应增长,有的单个环节需要花费数天甚至数周,这对于模块后端设计人员应对紧张的项目时间节点也提出了更大的考验......

在数字芯片后端设计流程中,布局规划的好坏直接影响整体设计的时序收敛以及布线质量,因此其过程需要经历反复迭代。随着先进工艺的不断发展,设计规模日趋庞大,后端设计的每个环节所需的时间也相应增长,有的单个环节需要花费数天甚至数周,这对于模块后端设计人员应对紧张的项目时间节点也提出了更大的考验,因此减少设计中的迭代次数就成为优化设计流程的关键。

      

图1 数字芯片后端布局布线流程

数字实现EDA先进解决方案供应商芯行纪科技有限公司(以下简称“芯行纪”)宣布推出的首款完全自主研发的数字实现EDA产品——AmazeFP智能布局规划工具,将机器学习技术应用于布局规划引擎,在兼顾性能、功耗和面积(PPA)的同时,提供了高度智能的拥塞感知、便捷的数据流分析和宏单元自动整理对齐功能,有效解决当前数字芯片在后端设计的布局规划节点面临的对经验依赖度高、手工耗时长、数据流分析手段单一、设计问题依赖后期定位导致的收敛性差等难题。

       

图2 融合机器学习和拥塞感知技术的布局规划引擎

AmazeFP采用的机器学习技术可快速获取高质量的宏单元布局思路,提供给用户初步布局规划;内置的数据流导向引擎,可智能规划宏单元摆放,加速宏单元关键路径的时序收敛;拥塞感知功能可准确预测拥塞度并调整宏单元位置,实现高效且有针对性的全局优化;宏单元自动整理对齐功能可以动态地根据所选的宏单元自动生成网格化窗口,极大地节省用户规整对齐宏单元的时间。

产品发布的同时,芯行纪也发起“AmazeFP优客计划”,用于听取广大集成电路设计企业对于软件功能的创意需求或者亟待解决的设计难点,在已有的自主研发的产品基础上进行快速定制化开发,将新功能及时呈现至后续的更新产品中。

本文将着重分享AmazeFP在应用中的具体表现,并详细介绍“AmazeFP优客计划”,鼓励开发者使用软件并随之共同创新,携手推动数字实现EDA的进步。

案例: 在GPGPU设计模块中的测试情况

案例一为GPGPU设计模块,工作频率1GHz,包含宏单元246,布局规划如图3所示。其中,左图为设计人员耗时5天通过手工调整和迭代摆放出的宏单元布局,右图为AmazeFP用时不到2小时自动摆放的宏单元布局。

       图3 GPGPU模块的宏单元布局对比

将图3中的两个布局规划结果应用于完全相同的布局布线流程,最终对比绕线之后的PPA质量,如图4所示。AmazeFP在时序、绕线以及功耗方面均取得了可观的进步。其中,对比设计人员的布局规划,AmazeFP的布局规划在时序方面,WNS(Worst Negative Slack,最差负时序裕量)由-266ps提升至-14ps, 提升了94.7%;TNS(Total Negative Slack,总负时序裕量)提升了99.93%;设计总绕线长度缩短12.6%;静态功耗降低18.3%。

        图4 GPGPU用户和工具布局规划的PPA对比

对比两个不同的布局布线结果的模块分布,如图5所示。

       图5 GPGPU用户和工具布局规划的模块分布以及路径对比

相对于用户的布局规划,应用AmazeFP布局规划的模块分布更加紧凑,而用户布局规划的模块分布相对分散,对比其中标识橙色的模块分布对比尤为明显。具体分析时序最差的一条路径,分别在两个不同布局规划中对比,即图5中标识为黄色的路径。在用户的布局规划中,这条路径由寄存器连接到宏单元,起点寄存器在整个设计的最底端,而终点寄存器在设计的最顶端,整条路径长度超过1600um。而在AmazeFP布局规划中对比同一条路径,可以看到路径终点的宏单元被放置在设计的最底端,起点寄存器仍然在靠近设计端口的位置,同一条路径的长度大幅度缩短,时序也得到了明显的提升。

案例二:在视频编解码设计模块中的测试情况

案例二为视频编解码设计模块,工作频率为1.5GHz,包含宏单元44个,其布局规划如图6所示。

       图6 视频编解码模块的宏单元布局对比

其中,左图为设计人员耗时3天通过手工调整和迭代摆放出的宏单元布局,右图为AmazeFP用时0.5小时得到的宏单元布局。将图6中的两个布局规划结果应用于完全相同的布局布线流程,最终对比绕线之后的PPA质量,如图7所示。

     图7 视频编解码模块基于用户和工具布局规划的PPA对比

对比设计人员的布局规划结果,AmazeFP的布局规划在时序上实现了54.1%的WNS提升和86.0%的TNS提升;绕线长度也得到了一定改善;静态功耗降低了5.7%。

进一步对比两个布局规划的模块分布,如图8所示。可以看到,用户设计的布局规划结果中,模块的分布相对分散,受制于模块之间的交互关联,一些模块被分割成了多个部分,并且分布在相对较远的位置,如左图中的模块A,模块B和C都被分割成多个部分。而对比右图中相应的模块分布,可以看到同一模块被分割的现象并不明显,模块的分布较为集中,这将更有利于推进该设计的PPA优化。

      图8 视频编解码设计基于用户和工具布局规划的模块分布对比

具体分析两个布局规划的时序结果,按照路径分组(Path Group)进行分类对比,如表1 所示。其中对于寄存器到时钟门(Reg_to_ICG)的时序路径分组,AmazeFP的布局规划获得了57.77%的WNS收益,66.67%的TNS收益,以及47.22%的NVP(Number of Violating Path, 违例路径条数)提升;而对于寄存器到宏单元的时序路径(Reg_to_Mem)分组,AmazeFP的布局规划则获得了87.32%的WNS收益,94.74%的TNS收益,以及23.91%的NVP收益。

   表1 视频编解码模块布局布线后的时序对比

图9中左图高亮出了用户布局规划中最差的一条Reg_to_ICG时序路径,其中红色五星标识了该路径的终点,即时钟门逻辑(ICG)的位置,黄色圆点标识了该时钟门逻辑的扇出(Fan-out)寄存器的分布,橘色圆点标识了该时钟门逻辑的扇入(Fan-in)寄存器的分布。右图则对应高亮出了同一个时钟门逻辑的位置以及其Fan-out和Fan-in的寄存器分布。对比图9的左右两幅图,可以看出在AmazeFP的布局规划中,ICG上一级寄存器分布范围相对左图更为集中,Reg_to_ICG的整体路径相对更短,路径时序也得到了更好的优化结果,WNS由-107ps提升至-33ps。

     图9 视频编解码模块的Reg_to_ICG路径对比

对于寄存器到宏单元的时序路径(Reg_to_Mem),AmazeFP的布局规划结果也表现优异。对比用户布局规划中最差的一条Reg_to_Mem路径,以及AmazeFP的布局规划中到同一个宏单元的路径,如图10所示。用户布局规划中,该宏单元放置在整个设计的右下角,其上一级寄存器则位于距离较远的绿色模块(模块A)的位置。而对比右图AmazeFP的布局规划结果,该宏单元被工具放置在设计的顶端,而模块A也分布在距离路径终点的宏单元不远的位置,因此Reg_to_Mem的路径相对更短,时序优化结果更佳,WNS由-71ps提升至0ps。

     图10 视频编解码模块的Reg_to_Mem路径对比

AmazeFP的数据流导向引擎以及高度智能的拥塞感知能力能够在兼顾性能、功耗、面积(PPA)的同时实现更为合理的宏单元布局,给后续环节提供了良好的开端,也助力设计在整体布局布线流程中得到更优的结果,最大限度地减少了整个布局布线流程的迭代次数,助力设计更快收敛,加速高质量的流片。

AmazeFP优客计划

当芯片的先进工艺制程不断进步,晶体管结构变得日益复杂,电路设计需要考虑的实现难点越来越多,EDA工具也因此迎来新的挑战,基于开发者的更先进需求,在原有的工具基础上保持不断更新,才能帮助开发者更加高效地实现芯片量产。

数字实现EDA工具是非常复杂的软件,需要综合考虑工艺、电路、算法、人工智能等技术,数字实现EDA领域的研发人员尤其匮乏,使得本土集成电路设计企业的难点解决需求很难在第一时间得到响应。芯行纪拥有一支强大的研发团队,在一年多的时间里完成了从第一行代码的编写到百万行代码的实现,从底层架构就开始考虑将机器学习、云计算技术如何适配到数据结构,芯行纪启动的“AmazeFP优客计划”,正是基于这样的研发实力,最主要的设想就是零距离贴近本土市场,聆听广大集成电路企业与时俱进的创意需求或者亟待解决的设计难点,在已有的自主研发的产品基础上进行快速定制化开发,将新功能及时呈现至后续的更新产品中。

合作伙伴可访问芯行纪官方网站(www.xtimes-da.com),在AmazeFP产品页面中提交创意或者难点解决需求,芯行纪会安排专业的筛选和及时的沟通,还将为最后成功入选确定需求的参与者提供丰厚的礼品。

关于芯行纪

芯行纪科技有限公司汇聚全球杰出EDA技术支持和研发精英,着力于自主研发符合3S理念(Smart、Speedy、Simple)的数字实现EDA平台,包含新一代布局布线技术,同时提供高端数字芯片设计解决方案,可大幅度提升芯片设计效率,并助力实现芯片一次性快速量产,在人工智能、智能汽车、5G、云计算等集成电路领域为众多合作伙伴的高速发展和产业腾飞保驾护航。

责编:Amy.wu
阅读全文,请先
您可能感兴趣
IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例,强调了服务于AI应用的芯片设计模型的重新调整。
频率梳是一种能够发射多条等间隔频谱线的特殊激光源,广泛应用于光学钟、激光雷达、光谱学和光神经网络等高精度测量领域……
通过收购宏晶微电子,康佳集团将能够进一步拓展其在半导体领域的业务版图,提升公司在芯片设计、开发、生产和销售等方面的实力。
紫荆半导体是一家专注于RISC-V车规级芯片设计开发的公司,公司的首颗明星产品——紫荆M100于今年9月成功点亮,并获得了功能安全认证,其采用模块化设计,内核可重构,具备更快的处理速度和更少的耗时……
据多家媒体报道,长鑫存储不仅成功推出了稳定良品率达到80%左右的DDR5内存,并预计在未来一年内将这一数字提升至90%,还实现了HBM2内存的客户送样测试,预计明年年中可以实现小规模量产。
芯片设计周期久,决定了AI芯片如果没有在设计之初就“压对宝”,上市时就可能已经过时。有没有什么工具能大幅加速AI芯片的设计流程?
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
2025年1月9日,美国 拉斯维加斯丨全球瞩目的国际消费电子产品展(CES 2025)盛大开幕,来自世界各地的科技巨头与创新企业齐聚一堂共同展示最新的科技成果。中国高性能微控制器产品及嵌入式解决方案提供商上海先楫半导体科技有限公司(先楫半导体,HPMicro)闪耀登场,发布了专注于机器人运动与控制的高性能MCU产品——HPM6E8Y系列,为火热的机器人市场注入新的活力。
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
大疆发布DJI Matrice 4T旗舰无人机,售价38888元。该无人机可用于电力巡检、应急抢险、公共安全、水利林业监测等众多应用场景。DJI Matrice 4T的镜头模组拥有“六个眼”,除了广角
01周价格表02周价格观察硅料环节本周硅料价格:N型复投料主流成交价格为40元/KG,N型致密料的主流成交价格为38元/KG;N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略,月
1月8日消息,奥康国际发布公告称,终止发行股份购买资产,公司股票将于1月8日开市起复牌。至此,奥康国际谋划的跨界收购芯片公司事项告一段落。奥康国际在公告中介绍,公司于2024年12月24日披露了《关于
CES 2025,黑芝麻智能携旗下华山系列、武当系列芯片参展,并带来与产业链伙伴的合作新进展。1月8日,黑芝麻智能与汽车嵌入式互联软件产品和解决方案供应商Elektrobit联合发布了基于武当系列C1
当地时间2025年1月7日,全球备受期待的技术盛宴——国际消费电子展(CES 2025)在美国拉斯维加斯盛大开幕。作为显示领域的领军企业,天马携一系列前沿创新技术和最新智能座舱解决方案惊艳登场,带来手
日前,微信安卓版迎来8.0.56正式版更新,这是2025年首次版本更新。关于更新内容,依然是那9个字:“修复了一些已知问题”。虽然官方没有公布具体更新内容,但体验后发现,新版增加了朋友圈视频倍速播放等
近日,闻泰科技在一场电话会议中阐述了其出售ODM(原始设计制造)业务的战略考量。           闻泰科技表示,基于地缘政治环境变化,考虑到 ODM 业务稳健发展和员工未来发展利益最大化,公司对战
近日,由工业和信息化部、国家广播电视总局、国家知识产权局联合评选的“2024年度视听系统典型案例”公示名单正式发布。聚飞光电自主研发的大尺寸 Micro LED 超高清显示屏系统经专家评审及公示程序,
点击蓝字 关注我们SUBSCRIBE to US如果你听说过深度伪造(deepfakes),即人们做着从未做过的事或者说着从未说过的话的高度逼真视频,你可能会认为这是一种可疑的技术发展成果。例如,它们
1月8日消息,据外媒报道,由于半导体行业需求衰退,日本瑞萨电子将在日本及海外裁员数百人,并且定期加薪也将被推迟!据报道,瑞萨电子在日本和海外有约21,000名员工,本次裁员比例近5%。这一裁员计划已于