过去两年,我们一直在说EDA和AI共同促进的发展方式很有趣。AI芯片的设计本身要依托于EDA,而EDA工具自身、芯片设计流程也在寻求AI技术的帮助,就像荷兰艺术家M.C. Escher那幅名为《Drawing Hands》的名画,两只手的那种关系。
今年谈EDA工具融入AI已经不会再有人表达惊讶了,毕竟国际EDA巨头们都在持续做宣传。IIC Shanghai活动的不少EDA企业也在谈AI。而国内EDA与AI技术结合的佼佼者,在我们看来是这次再度获得中国IC设计成就奖“年度创新EDA公司”的芯行纪科技有限公司。
去年芯行纪在得到“年度技术突破EDA公司”奖项之际,主推的还是智能布局规划工具AmazeFP——这款工具对于AI技术的应用,及云原生特性都给我们留下了深刻的印象。其时芯行纪在接受我们的采访时就说,AmazeFP绝对不只是个floorplan工具,其中的技术预埋不仅是对外秀肌肉,也预示了产品规划。
今年IIC Shanghai再见芯行纪,涵盖AmazeFP, AmazeSys, AmazeECO, AmazeDRCLite,以及贯穿所有工具的Amaze*-ME机器学习平台果然就已经一字排开了。芯行纪在发布AmazeFP之时早就做好了规划,AmazeFP的技术预埋也在此间多有体现。丁渭滨(芯行纪资深研发副总裁)还在主题演讲中预告了更多工具的到来,可见覆盖数字后端EDA全流程是芯行纪志在必得的目标。
丁渭滨 芯行纪资深研发副总裁
而理解芯行纪过去1年发布的几款新品,不仅有利于我们认清芯行纪的技术能力、潜在目标,也能帮助我们观察国内EDA的发展情况——尤其是国内EDA对AI技术的应用,毕竟芯行纪在这方面是相对走在前列的。
智能工具上面,再加个AI平台
此前芯行纪就说内部团队曾是“全球第一个把机器学习技术成功应用到数字EDA且产品化的团队”。最初的AmazeFP作为一款floorplan智能布局规划工具,当时就强调“AI预测能力”,基于机器学习提前预测绕通性、时序、功耗,据此得到更好的PPA、更快的runtime。去年的采访中,芯行纪还特别提到拥塞感知(congestion aware)、宏单元自动整理对齐都基于AI。
今年2月,芯行纪的AmazeFP产品新增了后缀为ME的迭代:AmazeFP-ME。芯行纪定义这里的“ME”为Machine-Learning EDA,是个智能化机器学习平台。既然AmazeFP本身就应用了AI技术,新增个“ME”又是怎么回事?
“包括拥塞感知、宏单元自动整理的AI,其实还停留在工具自身的AI层面。简单来说就是用AI模型去取代工具里面的一些算法,让工具变得更聪明。这是一个层面。”丁渭滨在采访中说,“而ME是工具之外的东西,和用户如何使用工具有关,帮助用户更好地使用AmazeFP这个工具。”
从芯行纪的产品规划来看,Amaze*-ME是个机器学习平台。AmazeFP-ME显然是该平台下的首个产品实践。未来“每款工具都会搭载ME这样一个AI平台”。我们对于ME的理解:是基于AI技术,借助“解空间探索”(solution space exploration),帮助用户使用工具,自动在更大的空间里“探索”到更优的结果。
“EDA工具很复杂,整个flow、一堆命令、还有很多option选项要设置;不同工程师跑出来的结果都不一样。”为了适配、优化不同的设计,“国外领先的EDA公司3、4年前就在做‘解空间探索’。”所谓的解空间探索,大致流程“是用工具的design flow去跑出结果,基于这些结果进行反复学习,以寻找更好的参数设置”。
“我们的工具直接学习什么是好的layout,如此启发我们的工具,就有机会寻找到更好的结果。”
丁渭滨形容ME是突破“局部最优解”,考量“更远处”的可能性。“让工具知道在稍远一点的地方有更好的解,那么工具就会启动扩散,在那个更远的地方再做尝试,也就能更加逼近全局最优解。”前两个月芯行纪刊文《AmazeFP-ME开启智能EDA之旅》,借助实践案例探讨了AmazeFP-ME,相比于没有借助解空间探索的AmazeFP,以及手工摆放,在floorplan流程里的效率和结果差异。
在刊文中提及的案例中,AmazeFP本身能够在不到2小时的时间里,得到PPA优于工程师手工摆放数周的floorplan方案;而ME则找到多个比默认AmazeFP跑出来结果更好的floorplan,更重要的是在P&R布局布线流程的最终结果上,AmazeFP-ME最佳结果的floorplan后续仍然表现出最好的PPA——表明AmazeFP-ME与P&R工具(这里选的是后续会谈到的AmazeSys),有着较高的PPA结果一致性。
这称得上是相当出色的成果展示了。
AI与云原生技术预埋
“ME是我们的机器学习平台,未来我们会花更多精力把ME打造成能够适配芯行纪所有产品的方案。”换句话说,不只是AmazeFP,后续AmazeSys等产品也会加上ME的后缀。不过如前文提及的,ME并不是单纯以“插拔”的方式,后接到AmazeFP等工具上的;芯行纪应该很早就规划了ME平台,及将其应用到各个Amaze*系列产品的目标。凭什么这么说?
这一点丁渭滨虽然在主题演讲中没有提,但在采访中告诉我们,“跑解空间探索所需时间长”——应该是指算力要求高;如此,我们之前强调的AmazeFP的云原生技术就派上了用场,“这就要求AmazeFP-ME能在大量机器上并行地跑起来,充分利用好多机支持的能力,也让ME计算时间大幅缩短。”
去年我们就在采访中得知,芯行纪是在EDA工具的“最初规划”阶段,从“底层架构设计”考虑云上EDA的适配和优化。当时我们得知的关键信息之一是芯行纪为此开发了融合多项新型技术的全新数据结构,实现通信量的缩减;另外配合scheduling优化、并行算法测试验证、跨操作系统兼容性测试优化等,达成云上跨系统和节点的通信带宽与数据量吞吐平衡。
“ME所指的解空间探索,意味着用户要在AmazeFP中跑多组design。一般我们大概是跑40-60组,最终找到一个最优解。这40-60组放在同一台机器上跑当然也行,但时间会很久。如果要实现6-8台机器并行跑,这是需要云原生技术支撑的。”芯行纪自诞生之日起强调的AI和云,此时又发生了完美交汇;如果没有前期规划和技术预埋,ME的实现就不会这么快了。
另外有关AI,以及ME平台技术推进值得一提的是,芯行纪在最初构建技术团队时,就尝试将EDA与AI专业人才融合到一起,“每个子团队都有自己的AI专家”。随着更多产品问世,尤其ME平台的发布,芯行纪对于AI人才的需求理应也在提升。
所以丁渭滨这次介绍说,此前研发AmazeFP产品时主要是团队或小组配备AI专业人才,“现在我们工具变多了,像ME就是个整体,我们需要专门的AI团队,从更广的角度应用到不同的工具中去,所以渐渐就整合了专门的AI团队来做这样一件事。”
据此,我们总结EDA搭配AI的时代下,芯行纪的优势一方面在技术与产品规划的前瞻性——尤其在AI和云的部分;另一方面在AI人才的着力、研发经验的积累上;丁渭滨另外补充说,“我们一直在关注AI技术能不能给客户、EDA和产业界带来提升,不管是生产力还是PPA的提升。AI其实只是解决痛点的其中一个技术选项,始终带着解决痛点的思路来看这件事很重要”——这部分我们总结为“以需求和客户为先”。这三点恰好也契合了芯行纪的研发理念。
持续建立数字实现全流程EDA
除了AmazeFP加入ME平台能力,如前所述,这一年内芯行纪还更新了包括AmazeSys、AmazeECO、AmazeDRCLite、Industriallm等产品。除了Industriallm是芯行纪自研的license许可文件管理系统,其他几个是值得深究的,这里简单谈一谈。
去年芯行纪就对我们说,AmazeFP不单是个floorplan工具,其中集合了“布局布线所有的关键点”。丁渭滨也在这次采访中给出了肯定:“虽然AmazeFP处理的是macro单元,但macro和标准单元之间一定是互相关联的。”“观察拥塞问题,也不可能只看macro单元的拥塞,而是已经看到了标准单元的拥塞。”
“所以在确定macro单元位置的时候,标准单元的位置也已经算出来了。这其实就是AmazeSys要做的事。”
在设计流程上,AmazeSys作为AmazeFP的后一步的工具,是芯行纪真正的P&R布局布线平台。其发布自然让我们联想到AmazeFP的技术预备——所以AmazeSys去年11月的发布并不会让任何人感到意外。除了沿袭自AmazeFP的云原生及AI特性,丁渭滨另外强调了AmazeSys的3个技术成就,据说是最初就设定的目标。
其一是适配国产先进工艺。目前环境下,国产工艺线尤其需要追求产业链的自主可控。所以芯行纪作为国内EDA厂商,“花了大量时间去适配国产先进工艺”。很自然地,芯行纪特别推出了AmazeDRCLite工具,基于国产先进工艺做芯片设计时,碰到DRC(design rule checking)问题及设计规则不适配,“这款工具几乎能全部修掉”。
丁渭滨说AmazeDRCLite的“市场受欢迎程度超出我的想象”。“这表明我们做对了一件事,我们填补了国内先进制造工艺在这方面需求的空缺。”
其二是“全功能模块”实现,“我们当时设定的目标一定要是全功能,不能缺失任何一个模块。”“可以说AmazeSys是历史上第一个由国人在本土,完全从零开始,自主研发的全功能的布局布线工具,而且实现了商用。”“这也意味着我们可以对产品做快速迭代,未来也会以肉眼可见的速度变得更好。因为自主框架都是我们从头开始做的,没有任何外部依赖。”
其三在于与signoff签核工具保持结果一致性,“坦白说这项工作很不容易,先进制造工艺的各方面因素都对结果产生影响,AmazeSys与后续工具的匹配确保了数据输出时的准确性和一致性。”
另外一款来自芯行纪的是ECO(Engineering Change Order)工具AmazeECO。芯行纪称其为“一站式”优化修复工具。ECO本身是相当耗费时间和精力的工作,“业界目前没有一个专门的工具来做这件事。通常总要牵扯到4-5种不同的工具,这些工具可能还是来自不同的供应商。”
“我们期望AmazeECO这样一个工具,能够将timing、power、DRC等的问题,一站式解决。”丁渭滨特别谈到了芯行纪实现ECO“一站式”的关键,“要去(对设计)做改动的时候,离不开布局布线工具在后面做支撑。如果没有布局布线技术支撑,也就做不了完整的ECO,而只能做分析。”这其实又是个体现芯行纪前期做产品与技术规划长远布局的例子。
“我们把布局布线、ECO优化,加上先进工艺适配的DRC技术合在一起,同时能够全盘分析多种场景。所以我们率先做出了这样创新的一站式ECO修复工具。”与此同时,鉴于覆盖数据量庞大的需求,AmazeECO支持“多机加速”——这是本文再次提到多机加速,它和云原生的底层技术支撑仍然是密不可分的。
基于对芯行纪这几个新产品的观察,多少就能发现去年芯行纪借助AmazeFP宣传自家在云和AI技术两方面的独特优势,其实是贯穿到了全部产品的基因中去的。在我们看来,芯行纪是国内相当少见的,能够如此优雅地给出产品与技术间内在条理、逻辑完全自洽的一家EDA企业——这在国际大厂中可能并不罕见,但在国内是凤毛麟角。
丁渭滨告诉我们芯行纪的目标会聚焦数字后端全流程。从相关工具的逐步放出也是可以看出端倪的。“现在我们还是聚焦到了我们擅长做的事情上,在维持产品质量和稳定性的前提下快速开发符合市场需求的工具。”“我们希望从布局布线开始,一步步和合作伙伴一起,解决更多数字后端的问题,缩小数字后端EDA软件国内和国外的差距,我相信在不久的将来就能看到。”
- 另一个伟大山寨。