今年的中国IC设计成就奖,芯行纪科技有限公司获得了“年度技术突破EDA公司”奖项——这个结果应该并不让人感到意外。芯行纪在国产EDA领域已经小有名气,主要就是源自其产品对于AI和云技术的利用及创新性融合。
Aspencore分析师团队在2023年度中国IC设计成就奖,芯行纪申报的技术特色中,就看到了产品之一智能布局规划工具AmazeFP“采用机器学习技术在考虑了时序、面积、功耗因素的基础上快速获取高质量的宏单元布局思路,提供初步布局规划”;同时,芯行纪科技有限公司资深业务总监陶然,也在最近的EDA/IP与IC设计论坛上,特别提到了打造EDA云端方案。
其实就产品和技术层面来看,芯行纪获得“年度技术突破EDA公司”奖项的关键就在对AI和云技术的利用上。针对芯行纪的技术和产品实践,我们也特别采访了芯行纪资深技术副总裁邵振。芯行纪自身对于“突破”的定义,一方面当然在于EDA工具本身,以AmazeFP为例,除了AI和云计算的实践,产品的核心实际上已经包含了placement、routing、timer等核心引擎,为了完全融合上述各项,芯行纪自主研发了一整套软件的基础数据结构,效率得到很大提升。邵振说,“这是巨大的突破。”
“我觉得这也是数字EDA的创新和突破。我们将很多新技术,与数字实现(digital implementation)EDA做有效融合。融合要考虑底层数据结构、上层算法,这是个需要同时自下而上且又需要顶层设计和决策的过程。”基于我们对于芯行纪,及其产品、技术及企业团队的了解,本文尝试谈谈这家“年度技术突破EDA公司”的“突破点”究竟在哪儿。
在最初规划中布局未来
芯片设计的后端设计流程包含了布局规划、布局、时钟树生成、布线、优化等阶段,芯行纪目前主攻的方向则是围绕这些环节,之前率先推出的产品AmazeFP首先瞄准了布局规划部分,凭借其高度智能化的特点,解决这一阶段的问题。
芯行纪自己对这款产品的总结包括“融合机器学习技术、拥有智能拥塞感知模型、内嵌数据流导向引擎、自动整理对齐宏单元等新一代数字实现EDA软件特征,使其在布局规划过程中表现优越”。
陶然在主题演讲中也列举了多个客户使用AmazeFP相较手动布局规划宏单元的实例,在此不再过多赘述这款产品,感兴趣的读者也可前往芯行纪微信公众号做了解:这些实例在我们看来还是挺有趣的,从中可见,该产品已经应用到了包括Arm/RISC-V指令集的CPU(包括CPU topology),以及GPU、GPGPU、视频编解码模块等芯片上;应用领域也已经扩展到了车规级芯片。
“虽然floorplan听起来是个点工具,但深潜至产品核心,底层database用到了我们新一代的整合了云原生架构的数据结构,有floorplan的布局引擎,有place引擎,有时序驱动(timing driven)及我们自己的时序分析器(timer),还有拥塞感知(congestion aware)和自有的global router……”邵振告诉我们,“里面有很多东西,AmazeFP实际是集大成的缩影。用过我们产品的客户都知道,这并不单纯是个floorplan工具。”
“它基本上集中了布局布线所有的关键点。”换句话说,芯行纪发布AmazeFP及其内部融合的技术,实则是对外传递了产品路线规划的信号,顺带秀了一波肌肉。“我们布局布线平台的核心引擎里,不止是一个placer加router,里面还有很多东西,包括timer、RC抽取,还包括时钟树等技术。”
“其实布局布线平台的各个步骤都已经在紧锣密鼓的开发中,目前处在alpha阶段,已经在和客户做迭代。未来走向beta阶段之后,我们就会在合适的时间正式发布这些工具。”邵振表示。单纯从技术预埋以及产品规划的角度来看,“突破”在此都有相当的表现力;也为未来由点及线做好预先布局。
具备前瞻和计划性,应该是芯行纪当前产品与技术的真实写照。不过上面这些实则是我们走访过程里的意外收获——原本我们预期的“突破点”在于芯行纪EDA产品中应用了AI和云技术,但没预料到他们为此铺陈的工作开始得如此之早。陶然在这次的主题演讲中也提到:“我们从最初规划工具,在做最底层的架构设计的时候,就开始考虑了这些方向。从第一行代码开始,我们就在执行这些想法,现在我们看到了很好的结果。”
这里“考虑了这些方向”指的主要就是云和AI。那么最初就考虑AI和云技术接入的EDA,究竟有着什么样的事先规划?
EDA上云没那么简单
针对这个问题,我们先从云说起。和大部分EDA上云类似,芯行纪在此前发布的新闻稿中说,芯片设计布局规划的云端方案能够帮助产品设计企业以“云端部署,按需使用”的方式提高其使用工业软件的灵活性和便捷性,优化成本效率。
EDA或芯片设计上云的好处自不必多说:动态调用云端算力和存储,更为灵活、弹性地执行并行运算和并行优化任务。在很多场景下,芯片设计企业能够以更短的时间、更低的成本来获取芯行纪的技术和方案。“Fabless客户能够在更短的时间内,得到相当的结果;或者在以往相当的项目周期内,进行更多的尝试。”邵振说,“算力提升之后,客户可以有更多的选择。”
不过在这里,我们更关注的其实是如何“从最初规划工具”,就在“底层架构设计”时考虑云上EDA的适配和优化。芯行纪作为一家初创企业,相较老牌市场参与者的优势更多在于没有历史包袱。所以在实践产品的想法时,桎梏相对更少,无论是流程方法学,还是先进的算法技术。
我们知道,芯片设计的规模很大,数据量也大。当涉及跨系统、跨节点的计算时,数据搬运效率极有可能成为整个系统的瓶颈。“要让数字实现EDA工具与云计算完全融合,技术上的难点在于:云上有很多节点,这些节点需要有效合理的分配,才能做到高效、可靠的数据传输。它和数据传输量的权衡是个难题。”对于邵振提到的这一难题,一般我们首先能想到的解决方案,自然就是在云的IT基础设施上做文章。
“如果只是IT或者network相关的问题,那就和EDA公司没什么关系了。一个EDA工具在研发过程中,若没有考虑上云的问题——一行代码也不改,不利用算力的巨大弹性优势,只考虑云的IT基础设施部分,那么就无法完全发挥云的优势。”邵振说,“EDA本身不优化,那么网络再快、资源再多、IT基础设施调度再好,也无法做到最优。”
而芯行纪的答卷是“从底层数据结构、数据模型入手”。邵振在采访中多次谈到了芯行纪开发的一种融合了多项新型技术的全新数据结构,在EDA领域的应用中,能够有效达成通信带宽和数据量吞吐的平衡,尤其是缩减通信量。“效果是数据模型在传输过程中,数据量天然地更少。这是我们最初规划就开始做的。”
就这种专门开发的数据结构,邵振做了一些简单的解释:“对于芯片设计来说,单次数据传输宽度很大,理论上这是可以做到的。但做到之后,你会发现数据传输来来回回花了那么多时间,也就失去了云本身的算力优势。”所以相应地需要考虑减少数据通信量,但“这对底层数据结构是巨大考验;相应的算法也需要跟着变化”。
这是芯行纪着手从数据结构和算法上,与云做“最深度融合”的原因。或许我们可以说,这是个釜底抽薪式的解决方案——如果同类竞品方案算是扬汤止沸的话。
新型数据结构当然只是芯行纪为其EDA上云所做的一部分工作,实际还有不少问题要解决。“比如不同操作系统兼容性测试;工具的并行计算要为云上资源调度做分配机制——也就是scheduling的优化;针对并行算法在云上的表现,还需要进行大量测试和验证……在这样的数据信息传递过程中,从算法设计到实现,我们都有自己的研究。现在也还在不断改进。”
这些应该是芯行纪在此前公开宣传中提到自研产品在上云时“使用全新分布式计算架构”的组成部分。凭借包含专有数据结构在内的基础架构,相较其他EDA工具的上云也就有了更为天然和底层的优势。这也是芯行纪得到“年度技术突破EDA公司”奖项的关键之一。
当人工智能用于数字实现
说回“最初规划”的另一个出发点:AI。其实EDA应用AI技术这两年也很热门。这一领域的诸多参与者都在宣传AI对EDA工具的价值。陶然在介绍中说,AmazeFP是个机器学习驱动的工具,“具备AI预测功能”。机器学习在芯行纪的这一工具中,是用于提前预测绕通性、时序、功耗的,并据此得到更好的PPA和更快的runtime。
EDA用AI来预测性能,是基于设计流程较长的前提下当前设计阶段很难去评估后续环节这一事实。EDA大厂实际上都有在更早的阶段就预测后续时序、功耗变化的方案。芯行纪于AI方向的亮点在于拥塞感知(congestion aware)也通过机器学习的方式来实现——也就能够更好地确保后期芯片的可绕通性。
去年芯行纪资深研发副总裁丁渭滨在GTIC峰会上提到:“当算法学习过大量制程上的版图模型后,就能判断哪些位置会有影响。”当时他提到,大部分EDA厂商之所以没有将拥塞预测模型放入布局,在于“机器学习模型会发生一些随机事件,结果不够稳定,也很难去控制”。
邵振也说其中难点甚多,“要知道一条路堵不堵,首先要知道这条路有多宽,其次是在某一时间段内,有多少辆车通过这条路。”他打比方说,“拥塞预测的关键在于预测时间窗口和准确度,要做到又快又准很难,这是一个艰难且复杂的过程。”丁渭滨说,“芯行纪藉由一些独特技术控制模型在某种范围内的稳定性,牺牲的准度也在可接受范围内。”
“我们是靠三个方面实现了创新和突破,第一是融合更先进的算法,第二是使用更优化的模型,第三是全面更新了布局布线的核心引擎。”邵振说。于是至少在国内,芯行纪成为最早将机器学习技术用于拥塞预测的EDA企业。
另外宏单元自动整理对齐在此也用上了AI,从陶然在会上分享的结果来看也相当理想,不仅“摆放结果整齐”,而且保持较好的PPA,也就减少了设计工作量。所以布局规划工作从原本以周为单位,缩减至以小时为单位,AI在其中是有相当大的参与度的。
邵振告诉我们,AmazeFP本身就能自动生成大量floorplan,可以作为预训练模型的数据。自动化的floorplan“慢的话1-2小时,快的话几分钟就生成一个”。“通过这样的方式,得到我们自己的数据源。所以我们的工具是一边开发,一边在学习的。”
这其中的“最初规划”体现在技术团队上。“我们的团队曾在全球范围内最早成功地将人工智能机器学习技术应用到数字实现EDA产品。”邵振谈到:“我们把EDA专业人才和AI专业人才融合到一起,每个子团队都有自己的AI专家。”
“从最初计划,到执行层面,整个研发过程都有机器学习的影子,而不是在做完了产品之后,才去考虑附加包括AI在内的技术方案。”这是体现“突破”的第二个要素。
“立志于做下一代EDA产品”
从上述两点,我们大致可以窥见芯行纪的产品规划和技术布局是具备了长远和全局性特点的。在芯行纪看来,数字实现EDA基础架构已经20多年没有本质变化,如果要在引擎层面考虑融合新技术,需要做根本性的变动,这种变动对于企业来说是非常艰难的。所以芯行纪的研发理念是“创新”,实现革命性的变革,这才有了从最初规划就考虑云和AI的可行性。
这种长远和全局性,除了前文就提到AmazeFP能够体现的未来布局,和已经处在alpha阶段待问世的新工具,“在布局布线做好以后,更长远来看我们会利用我们的长处,对数字实现的其他部分进行研发,形成更大的平台组合。”
“其实其他点工具的引擎在我们P&R软件里,已经有所体现了。我们以后要做的是把它们提炼出来,做成功能更完备、精度更高的完整产品。这是我们中长期的计划。”
所以在采访之初,邵振就说芯行纪在最初规划产品时就“专注于做下一代EDA产品”。为达成“下一代”这个目标,芯行纪从两方面入手,“一方面我们会和合作伙伴一起,分析未来几年半导体产业对于芯片、进而对于EDA的进一步需求,从中体现出我们的产品应有的特征和方向。”
“另一方面,是以客户为主。我们从目前的EDA用户——芯片设计者的痛点、难点入手,提炼出我们的产品应当着重解决的问题。”于此芯行纪也就形成了自家产品的3S理念:Smart、Speedy、Simple。
芯行纪代表的是目前数字实现EDA最高研发水平,“我们团队是国内唯一可以全部自主地把布局布线这一数字实现平台做到产品化的团队;也曾是全球第一个把机器学习技术成功应用到数字EDA且产品化的团队”。这些都基于芯行纪“确实在规划方面花了很多时间”,最终才得以让效率提升几倍甚至几十倍。
在邵振看来,芯行纪无论在技术还是运营方面,都是很出色的企业,作为这样一家专注自主研发的技术公司的一员,“我觉得我挺自豪的”,“可能对我来说最难得可贵的一点,是芯行纪几乎所有人都有‘EDA情怀’。对我们而言,这不只是一家企业、一份工作,而是一项事业。”
芯行纪创立至今也不过2年多,邵振说芯行纪还是一家很年轻的企业,“虽然有突破,但也还需要努力。”“我们还在不断学习新的技术、发明新的技术、融入新的技术。”芯行纪对于自己的预期是成为数字实现EDA领域的佼佼者,“造福于IC设计”。大概这就是实现“突破”的源动力。