在数字芯片后端设计流程中,布局规划的好坏直接影响整体设计的时序收敛以及布线质量,因此其过程需要经历反复迭代。随着先进工艺的不断发展,设计规模日趋庞大,后端设计的每个环节所需的时间也相应增长,有的单个环节需要花费数天甚至数周,这对于模块后端设计人员应对紧张的项目时间节点也提出了更大的考验......

在数字芯片后端设计流程中,布局规划的好坏直接影响整体设计的时序收敛以及布线质量,因此其过程需要经历反复迭代。随着先进工艺的不断发展,设计规模日趋庞大,后端设计的每个环节所需的时间也相应增长,有的单个环节需要花费数天甚至数周,这对于模块后端设计人员应对紧张的项目时间节点也提出了更大的考验,因此减少设计中的迭代次数就成为优化设计流程的关键。

      

图1 数字芯片后端布局布线流程

数字实现EDA先进解决方案供应商芯行纪科技有限公司(以下简称“芯行纪”)宣布推出的首款完全自主研发的数字实现EDA产品——AmazeFP智能布局规划工具,将机器学习技术应用于布局规划引擎,在兼顾性能、功耗和面积(PPA)的同时,提供了高度智能的拥塞感知、便捷的数据流分析和宏单元自动整理对齐功能,有效解决当前数字芯片在后端设计的布局规划节点面临的对经验依赖度高、手工耗时长、数据流分析手段单一、设计问题依赖后期定位导致的收敛性差等难题。

       

图2 融合机器学习和拥塞感知技术的布局规划引擎

AmazeFP采用的机器学习技术可快速获取高质量的宏单元布局思路,提供给用户初步布局规划;内置的数据流导向引擎,可智能规划宏单元摆放,加速宏单元关键路径的时序收敛;拥塞感知功能可准确预测拥塞度并调整宏单元位置,实现高效且有针对性的全局优化;宏单元自动整理对齐功能可以动态地根据所选的宏单元自动生成网格化窗口,极大地节省用户规整对齐宏单元的时间。

产品发布的同时,芯行纪也发起“AmazeFP优客计划”,用于听取广大集成电路设计企业对于软件功能的创意需求或者亟待解决的设计难点,在已有的自主研发的产品基础上进行快速定制化开发,将新功能及时呈现至后续的更新产品中。

本文将着重分享AmazeFP在应用中的具体表现,并详细介绍“AmazeFP优客计划”,鼓励开发者使用软件并随之共同创新,携手推动数字实现EDA的进步。

案例: 在GPGPU设计模块中的测试情况

案例一为GPGPU设计模块,工作频率1GHz,包含宏单元246,布局规划如图3所示。其中,左图为设计人员耗时5天通过手工调整和迭代摆放出的宏单元布局,右图为AmazeFP用时不到2小时自动摆放的宏单元布局。

       图3 GPGPU模块的宏单元布局对比

将图3中的两个布局规划结果应用于完全相同的布局布线流程,最终对比绕线之后的PPA质量,如图4所示。AmazeFP在时序、绕线以及功耗方面均取得了可观的进步。其中,对比设计人员的布局规划,AmazeFP的布局规划在时序方面,WNS(Worst Negative Slack,最差负时序裕量)由-266ps提升至-14ps, 提升了94.7%;TNS(Total Negative Slack,总负时序裕量)提升了99.93%;设计总绕线长度缩短12.6%;静态功耗降低18.3%。

        图4 GPGPU用户和工具布局规划的PPA对比

对比两个不同的布局布线结果的模块分布,如图5所示。

       图5 GPGPU用户和工具布局规划的模块分布以及路径对比

相对于用户的布局规划,应用AmazeFP布局规划的模块分布更加紧凑,而用户布局规划的模块分布相对分散,对比其中标识橙色的模块分布对比尤为明显。具体分析时序最差的一条路径,分别在两个不同布局规划中对比,即图5中标识为黄色的路径。在用户的布局规划中,这条路径由寄存器连接到宏单元,起点寄存器在整个设计的最底端,而终点寄存器在设计的最顶端,整条路径长度超过1600um。而在AmazeFP布局规划中对比同一条路径,可以看到路径终点的宏单元被放置在设计的最底端,起点寄存器仍然在靠近设计端口的位置,同一条路径的长度大幅度缩短,时序也得到了明显的提升。

案例二:在视频编解码设计模块中的测试情况

案例二为视频编解码设计模块,工作频率为1.5GHz,包含宏单元44个,其布局规划如图6所示。

       图6 视频编解码模块的宏单元布局对比

其中,左图为设计人员耗时3天通过手工调整和迭代摆放出的宏单元布局,右图为AmazeFP用时0.5小时得到的宏单元布局。将图6中的两个布局规划结果应用于完全相同的布局布线流程,最终对比绕线之后的PPA质量,如图7所示。

     图7 视频编解码模块基于用户和工具布局规划的PPA对比

对比设计人员的布局规划结果,AmazeFP的布局规划在时序上实现了54.1%的WNS提升和86.0%的TNS提升;绕线长度也得到了一定改善;静态功耗降低了5.7%。

进一步对比两个布局规划的模块分布,如图8所示。可以看到,用户设计的布局规划结果中,模块的分布相对分散,受制于模块之间的交互关联,一些模块被分割成了多个部分,并且分布在相对较远的位置,如左图中的模块A,模块B和C都被分割成多个部分。而对比右图中相应的模块分布,可以看到同一模块被分割的现象并不明显,模块的分布较为集中,这将更有利于推进该设计的PPA优化。

      图8 视频编解码设计基于用户和工具布局规划的模块分布对比

具体分析两个布局规划的时序结果,按照路径分组(Path Group)进行分类对比,如表1 所示。其中对于寄存器到时钟门(Reg_to_ICG)的时序路径分组,AmazeFP的布局规划获得了57.77%的WNS收益,66.67%的TNS收益,以及47.22%的NVP(Number of Violating Path, 违例路径条数)提升;而对于寄存器到宏单元的时序路径(Reg_to_Mem)分组,AmazeFP的布局规划则获得了87.32%的WNS收益,94.74%的TNS收益,以及23.91%的NVP收益。

   表1 视频编解码模块布局布线后的时序对比

图9中左图高亮出了用户布局规划中最差的一条Reg_to_ICG时序路径,其中红色五星标识了该路径的终点,即时钟门逻辑(ICG)的位置,黄色圆点标识了该时钟门逻辑的扇出(Fan-out)寄存器的分布,橘色圆点标识了该时钟门逻辑的扇入(Fan-in)寄存器的分布。右图则对应高亮出了同一个时钟门逻辑的位置以及其Fan-out和Fan-in的寄存器分布。对比图9的左右两幅图,可以看出在AmazeFP的布局规划中,ICG上一级寄存器分布范围相对左图更为集中,Reg_to_ICG的整体路径相对更短,路径时序也得到了更好的优化结果,WNS由-107ps提升至-33ps。

     图9 视频编解码模块的Reg_to_ICG路径对比

对于寄存器到宏单元的时序路径(Reg_to_Mem),AmazeFP的布局规划结果也表现优异。对比用户布局规划中最差的一条Reg_to_Mem路径,以及AmazeFP的布局规划中到同一个宏单元的路径,如图10所示。用户布局规划中,该宏单元放置在整个设计的右下角,其上一级寄存器则位于距离较远的绿色模块(模块A)的位置。而对比右图AmazeFP的布局规划结果,该宏单元被工具放置在设计的顶端,而模块A也分布在距离路径终点的宏单元不远的位置,因此Reg_to_Mem的路径相对更短,时序优化结果更佳,WNS由-71ps提升至0ps。

     图10 视频编解码模块的Reg_to_Mem路径对比

AmazeFP的数据流导向引擎以及高度智能的拥塞感知能力能够在兼顾性能、功耗、面积(PPA)的同时实现更为合理的宏单元布局,给后续环节提供了良好的开端,也助力设计在整体布局布线流程中得到更优的结果,最大限度地减少了整个布局布线流程的迭代次数,助力设计更快收敛,加速高质量的流片。

AmazeFP优客计划

当芯片的先进工艺制程不断进步,晶体管结构变得日益复杂,电路设计需要考虑的实现难点越来越多,EDA工具也因此迎来新的挑战,基于开发者的更先进需求,在原有的工具基础上保持不断更新,才能帮助开发者更加高效地实现芯片量产。

数字实现EDA工具是非常复杂的软件,需要综合考虑工艺、电路、算法、人工智能等技术,数字实现EDA领域的研发人员尤其匮乏,使得本土集成电路设计企业的难点解决需求很难在第一时间得到响应。芯行纪拥有一支强大的研发团队,在一年多的时间里完成了从第一行代码的编写到百万行代码的实现,从底层架构就开始考虑将机器学习、云计算技术如何适配到数据结构,芯行纪启动的“AmazeFP优客计划”,正是基于这样的研发实力,最主要的设想就是零距离贴近本土市场,聆听广大集成电路企业与时俱进的创意需求或者亟待解决的设计难点,在已有的自主研发的产品基础上进行快速定制化开发,将新功能及时呈现至后续的更新产品中。

合作伙伴可访问芯行纪官方网站(www.xtimes-da.com),在AmazeFP产品页面中提交创意或者难点解决需求,芯行纪会安排专业的筛选和及时的沟通,还将为最后成功入选确定需求的参与者提供丰厚的礼品。

关于芯行纪

芯行纪科技有限公司汇聚全球杰出EDA技术支持和研发精英,着力于自主研发符合3S理念(Smart、Speedy、Simple)的数字实现EDA平台,包含新一代布局布线技术,同时提供高端数字芯片设计解决方案,可大幅度提升芯片设计效率,并助力实现芯片一次性快速量产,在人工智能、智能汽车、5G、云计算等集成电路领域为众多合作伙伴的高速发展和产业腾飞保驾护航。

责编:Amy.wu
阅读全文,请先
您可能感兴趣
拍卖标的包括三项域名以及15项软件著作权和14项专利。其中,三项域名的起拍价为13879元,15项软件著作权和14项专利的起拍价为15550元……
Rambus的HBM4控制器IP还具备多种先进的特性集,旨在帮助设计人员应对下一代AI加速器及图形处理单元(GPU)等应用中的复杂需求。这些特性使得Rambus在HBMIP领域继续保持市场领导地位,并进一步扩展其生态系统支持。
对于股价波动的原因,寒武纪表示,除了公司经营层面的因素外,还可能受到其他因素的影响。寒武纪还提醒投资者,应甄别信息来源,具体情况以公司公告为准。
此次财报也从侧面反应了半导体行业在AI业务上的强劲增长势头,但同时也暴露出非AI业务增长乏力的困境。
今年的CadenceLIVE中国用户大会上,Cadence谈到在芯片领域之外,数据中心、生命科学、航空航天等系统设计领域的仿真技术应用相当有限,这对Cadence而言是重要的市场机会。与此同时AI技术的发展,也在推动着市场前行...
据知情人士透露,博通在测试中将硅晶片通过英特尔最先进的18A制造工艺进行处理,但经过工程师和高管的深入评估后认为,该制造工艺目前尚不具备大规模生产的条件……
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
在当今人工智能飞速发展的时代,AI Agent正以其独特的方式重塑着企业的生产运营方式。澜码科技作为AI Agent领域的先行者,其创始人兼CEO周健先生分享了对大模型与AI Agent发展现状的深刻
近日,又一国产SiC企业宣布实现了主驱突破,并将出口海外。据“行家说三代半”的追踪统计,自2022年起,国内主驱级SiC器件/模块开始在多款车型中得到应用,尤其是2024年,本土供应商的市场份额显著上
疫情后的劳动力囤积和强有力的员工保护规则掩盖了德国高薪制造业工作市场令人担忧的变化。根据联邦劳工办公室的数据,欧元区最大经济体德国的失业率在2019年春季曾达到历史最低点4.9%,现已上升至6%。虽然
今日碎碎念由于所租的共享办公空间政策的调整,上周我和我队友又搬到开放共享空间了。所以,也就有了新同桌。从我的观察来看,新同桌们应该基于AI应用的创业型公司。之所以想起来叨叨这个,是因为两位新同桌正在工
[关注“行家说动力总成”,快速掌握产业最新动态]9月6日,据“内江新区”消息,晶益通(四川)半导体科技有限公司旗下IGBT模块材料和封测模组产业园项目已完成建设总进度的40%,预计在明年5月建成。据了
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了长飞先进等众多企业,深入了解
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金