对整个验证过程生成的大量数据进行彻底的人工分析实际上是不可行的,团队通常需要对芯片设计错误的根本原因有更多的了解。而在验证开发者人工的经验成为芯片验证的明显瓶颈时,产业发现人工智能(AI),特别是机器学习(ML)可以发挥关键作用。

近五年来,系统和芯片设计厂商不但面临着Time-to-market的压力,还要承受异构多核、高算力、差异化创新、系统与软件堆栈所带来的技术挑战,由此带来的软硬件协同设计和超过80%的IP复用问题,直接导致验证工作日趋复杂。因此,在芯片正式流片之前,越早通过完整的系统级验证与仿真对芯片性能、功耗、软硬件协同进行测试越好,这也符合当前主流设计流程中所体现的“Shift Left”趋势。

提升芯片验证覆盖率有多难?

在数字化、智能化等多重因素的推动下,无论是芯片的性能还是设计复杂性都得到了突飞猛进的发展。以英伟达在GTC 2024发布的Blackwell GPU为例,作为当前面积最大的GPU,它由两颗Blackwell裸片拼接而成,采用台积电4nm工艺制造,拥有2080亿颗晶体管,AI性能达到20 petaflops。相比于上一代产品Hopper GPU,Blackwell GPU的AI性能提升了5倍,片上存储提升了4倍。

然而,如果事先没有对功能模块和IP进行充分验证,就寄希望于数千亿颗晶体管像人体细胞一样组成器官,然后再正常工作,是一件既不可能也不容易的事情。众所周知,高效的验证工具能够从两个维度帮助芯片设计公司:一是降低成本,实现一次性流片成功,避免无休止的验证和调试循环;二是缩短研发周期,加速产品上市时间。根据行业经验,验证成本目前已经占到整个SoC前端设计的70%。 

对芯片验证工程师来说,一旦完成了芯片设计的RTL并配置了设计状态空间,验证过程就开始了。他们需要检查每个空间,以确保最终的SoC设计能够正常工作。而作为验证时程中耗时最久的一部分,覆盖率收敛(coverage closure),包括功能覆盖率和代码覆盖率,其目标是确保整个设计能够按照预期的功能正常工作。

但就目前的实际应用情况来看,覆盖率面临来自三方面的挑战:

1. 规划覆盖范围。因为很难知道在测试平台的覆盖定义中写些什么(需要什么类型的覆盖组别?差距在哪里?还需要写些什么?…等等),但这对于确保100%的覆盖率又是至关重要的。

2. 覆盖率。我们很难知道哪些测试对覆盖率贡献最大。例如,工程师可能运行相同的测试1000次,只能达到50%的覆盖率。当接近100%的覆盖率时,会发现如果要达到最后几个百分点的覆盖率可能还需要几周的时间。所以,有针对性的测试是关键,但开发这些测试有需要耗费大量的人力。

3. 激励开发(Stimulus development)和根本原因分析。因为您可能会遇到激励不应该执行特定配置或bug的情况,更有甚者,这种激励完全有可能是以一种根本不会达到覆盖目标的方式编写的。

在传统的芯片验证周期中,验证工程师会设定目标并运行回归环境。作为流程的一部分,工程师会配置测试平台来生成随机激励,以观察设计如何响应。对于给定的设计,进行10,000到15,000次测试并不罕见,但验证团队通常对每次测试的投资回报率没有概念,导致回归测试可能会持续数天,占用宝贵的计算资源。

仔细分析之后会发现,在SoC验证周期中,有两个迭代循环占据了大量时间:定位错误运行回归与覆盖率结束后的错误修复。这两个循环都包含耗时的迭代工作,涉及覆盖率分析、在发现覆盖率漏洞后进行调整、以及一次又一次地重复……然后,当团队发现用例错误时,他们需要分析错误,在RTL或测试平台上进行更改,并重新运行回归以确保错误得到实际修复。这部分其实也是一个迭代循环。

实际上,上述这些内容主要是从测试质量(QOR)和测试时间(TTR)角度来考虑。作为验证开发者,还需要关注达成结果所需的成本(COR),随着芯片复杂度提升,增加验证开发者和运算服务器都会增加额外的成本。并且,每次芯片改版(re-spin)都会带来不小的成本增加。

学习如何更快地完成验证覆盖率

通过前文的分析,我们可以很明确的得知,对整个验证过程生成的大量数据进行彻底的人工分析实际上是不可行的,团队通常需要对芯片设计错误的根本原因有更多的了解。而在验证开发者人工的经验成为芯片验证的明显瓶颈时,产业发现人工智能(AI),特别是机器学习(ML)可以发挥关键作用。

原理不难理解,因为ML最大的魅力就在于能够在迭代循环中不断成长,并基于大数据发现代码中难以察觉的错误,进而实现更快速、更高质量的覆盖率收敛。也就是说,如果ML引擎可以从某些模式中学习,例如,它能够识别测试台中一行代码中的错误,那么它就可以将这种洞察力应用于未来的回归,从而加快覆盖范围,特别是随着系统的训练,可能达到更高的覆盖率。

Synopsys已经开发了相当长一段时间的AI辅助设计能力。2020年发布的设计空间优化(Design Space Optimization)工具DSO.ai就大大扩展了AI辅助的足迹,通过在芯片设计的大解决方案空间中自动搜索优化目标,DSO.ai有助于提高工程生产力以及芯片的功耗、性能和面积(PPA)。而今天的主角,将是侧重于验证空间优化(Verification Space Optimization)的工具VSO.ai。

如前所述,测试覆盖率是半导体设计验证环节的核心问题。而激励向量(Stimulus vectors)是通过各种技术生成的,其中约束随机(constrained random)是一种流行的方法。然后,这些向量被用于对设计进行仿真运行,寻找与预期结果不匹配的测试结果。

验证团队选择感兴趣的结构代码覆盖率指标:行(line)、表达式(expression)、块(block)等,并自动将其添加到仿真运行中。由于每次测试迭代都会生成符合规则的约束随机激励,仿真器会收集所有形式的覆盖率指标。而对结果进行监控,目的是调整约束,以提高覆盖率。在某些时候,团队可以在项目时间表和资源限制范围内,自行判断和决定是否已经做到最好,并最终完成流片。

一个典型的芯片项目会运行数千个约束随机仿真测试,其中带有设计中大量重复性工作。因此,新覆盖率的增长速度会减慢,并且随着时间的推移,每次新测试的收益也会降低。这意味着,在目标实现之前,团队必须设法弄清楚发生了什么,并在时间和资源限制范围内尽可能提高覆盖率,以确定最佳前进路径。而且,这个过程中的“最后一公里”非常具有挑战性。

那么,对于覆盖率定义(coverage definition),Synopsys VSO.ai能够推断出一些超出传统代码覆盖率的覆盖率类型,以补充用户指定的覆盖率。机器学习可以从经验中学习,并在适当的时候智能地重用覆盖率。即使在单个项目中,从早期覆盖率结果中学习也可以帮助改进覆盖率模型。

对于验证开发者而言,覆盖率并没有具体的指标,并存在大量的重复性工作,因此手动进行回归优化的效率非常低,对给定设计进行上万次测试是很常见的。VSO.ai可执行粗粒度基准测试,提供自动化的、自适应的测试优化。在运行过程中,VSO.ai会率先运行具有最高ROI的测试,同时消除冗余测试,从而加速覆盖收敛并节省计算资源。

由于传统工作流中功能覆盖率主要依赖验证开发者的经验,导致很多时候覆盖率收敛的效果很差。VSO.ai也可执行细粒度的基准测试,通过调整随机约束激励来针对未被验证的覆盖点,自动发现测试覆盖率中难以捉摸的错误,进而提升测试质量。

在验证的最后阶段,过往验证工程师的手动调整到这个时候覆盖率收敛和ROI都会显著降低,原因在于此时验证工程师对已获取的验证大数据所具有的洞察力和分析能力已经很低。VSO.ai可执行根本原因分析(RCA),以确定为什么没有达到特定的覆盖点,通过AI解决最后的难题。

当然,AI辅助设计要在EDA领域发挥作用,依然需要融入到传统工具中,VSO.ai也不例外,因此工具的可集成特性是非常重要的。目前,VSO.ai可以轻松集成到现有的新思科技VCS(R)回归环境中,而无需对设计或测试平台进行任何代码更改。

下图总结了VSO.ai可以提供的优势。总结而言,就是设计人员可以在更短的时间内实现更快的覆盖率收敛、更高的测试质量、并攻克“最后一公里”的验证难题。

 

VSO.ai的典型应用

AMD通过在几个设计上使用VSO.ai而受益匪浅。数据显示,通过小规模的RTL更改和设计变动,AMD方面以优化的自动化方式实现了100%的覆盖率。下图总结了AMD使用VSO.ai在四种不同设计的回归样本中应用同一种方法学时获得的测试数据。

 四种设计的回归特征

如果与没有使用VSO.ai的原始设计进行比较,AMD发现:

  • 在四个设计中运行测试的数量减少了1.5-16倍,以实现相同的覆盖率
  • 快速、按需回归,如果用户不确定所需的迭代次数,则可用于衡量回归测试分布的效果
  • 在相同预算下,可能打到更多的覆盖率分仓。如果默认回归不能达到100%的覆盖率,VSO.ai可能会超过这个目标(即实验1)
  • 如果测试用例没有贡献,则将其从覆盖率回归中删除
  • 对受约束的随机测试进行更可靠的测试评分
  • 调试,发现比预期更低概率的覆盖项目

日本芯片厂商瑞萨科技则展示了VSO.ai的一个典型场景——验证IP功能。目前,在汽车市场,上市时间的压力非常大,工程师们面临着一系列不同的挑战,包括手动分析和分类以确定未被覆盖到的验证领域,并彻底验证是否存在任何逻辑或功能问题,而所有这些都必须在每个IP或项目的特定计算预算内完成。

结果显示,通过使用VSO.ai的人工智能驱动验证,瑞萨在减少功能覆盖率缺陷方面取得了高达10倍的改进,IP验证生产率也提高了30%,并实现了99%的IP覆盖率,表明人工智能有能力帮助芯片厂商应对日益复杂的设计带来的挑战。

结语

新思科技VSO.ai是一套自主工作系统,用以替代验证开发者负责的编译设计和编排测试用例等工作,以尽可能快、尽可能低开销地达到覆盖率目标,并获得最高质量的验证结果。这样,芯片设计开发者和验证开发者就能够从反复循环的工作中解脱出来,更专注于创建差异化和创新化的IP与SoC系统。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
尽管思瑞浦在模拟混合信号设计方面拥有丰富经验,其MCU产品在市场上的表现并不理想。究其原因,是因为国内MCU领域竞争已经非常激烈,产品同质化严重,企业之间的竞争主要集中在性价比上,导致利润空间被严重压缩。
随着工艺技术的发展放缓而晶体管数量增加,芯片开发变得越来越困难。Synopsys选择了收购设计分析和仿真巨头Ansys,此后,拥有管理和优化 EDA 计算环境所需所有工具的Altair,成为了最后一个可以挑战 Ansys 而不受约束的玩家。如今,花落西门子……
具体来说,对于涉及某些先进集成电路设计或制造、超级计算机、量子计算机及其关键部件、以及特定用途的AI系统的交易,美国将采取禁止或要求通报的措施。
据悉,商汤科技的芯片业务最早在今年5月份就传出了独立的消息。当时,有知情人士表示,商汤科技正在积极引入外部投资者,以推动芯片业务的独立发展。如今,这一计划已经取得了实质性的进展,芯片业务不仅成功引入了外部投资者,还完成了数额庞大的融资。
据悉,该芯片具有卓越的性能指标和广泛的应用前景。其对X/γ射线剂量率的量程覆盖广泛,从100nSv/h(纳西弗/每小时)到10mSv/h(毫西弗/每小时),可探测的能量范围则在……
随着AI和HPC芯片需求的不断增加,半导体产业在不断挑战性能极限的同时,也面对着传统封装技术的限制。为了延续摩尔定律,先进封装成为满足这些新兴应用需求的核心策略。
微电子和软件技术的快速发展正在深刻地改变车载娱乐中控和安全系统设计,重新定义驾驶体验。
本系列文章从数字芯片设计项目技术总监的角度出发,介绍了如何将芯片的产品定义与设计和验证规划进行结合,详细讲述了在FPGA上使用硅知识产权(IP)内核来开发ASIC原型项目时,必须认真考虑的一些问题。
在即将到来的慕尼黑国际电子元器件博览会(electronica 2024)上,英飞凌科技股份公司将展示其创新的解决方案如何推动全球低碳化和数字化进程,充分展现半导体产品如何为实现净零经济铺平道路,并释放人工智能的全部潜力。
vivo旗下品牌iQOO正式发布了年度性能旗舰iQOO 13,除了高通骁龙8芯片、vivo自研的电竞芯片Q2外,最值得一提的是还采用了汇顶科技提供的多项创新技术,包括超声波指纹识别、新一代屏下光线传感器以及智能音频放大器与软件方案。
本文来源:智能通信定位圈10月24日,全球领先的物联网(IoT)解决方案提供商Silicon Labs(下称“芯科科技“)在上海成功举办2024年“Works With开发者大会”。本届大会以“创新结
01周价格表02周价格观察硅料环节本周硅料价格:单晶复投料主流成交价格为37元/KG,单晶致密料的主流成交价格为35元/KG;N型料报价为41元/KG。交易情况上下游交易延续低迷情绪,拉晶端尚处艰难去
10月30日,上汽集团发布第三季度财报。财报显示,第三季度上汽集团营业收入1425.60亿元,同比下滑25.58%;净利润仅2.80亿元,同比下降93.53%。归属于上市公司股东的扣除非经常性损益的净
论坛信息名称:2024先进封装技术与材料论坛时间:2024年12月26日地点:江苏苏州联合主办:亚化咨询日程安排12月25日16:00~20:00   会议注册12月26日09:00~12:00   
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓10月31日消息,荣耀引入了中国电信、中金资本旗下基金、基石旗下基金、特发基金,以及新一轮代理商投资
10月29日,诺基亚与惠普宣布签署了一项多年专利授权协议,允许惠普公司在其设备中使用诺基亚的视频技术。诺基亚一年前曾表示,已在美国对惠普提起法律诉讼,指控惠普未经授权使用诺基亚专利的视频相关技术,但本
互联网与科技企业每日重点资讯文 | 苏丁巨头动向荣耀股改引入新一轮投资者荣耀股改引入新一轮投资者,中国电信、中金资本旗下基金、基石旗下基金、特发基金,以及新一轮代理商投资平台(金石星耀)等机构加入,对
10月31日,国家能源局举行新闻发布会,发布前三季度能源形势和可再生能源并网运行情况,解读《关于大力实施可再生能源替代行动的指导意见》,介绍新型储能发展和第三届“一带一路”能源部长会议有关情况,并回答
市场传出消息称,荣耀公司近期引入了包括中国电信、中金资本旗下基金、基石旗下基金、特发基金及新一轮代理商投资平台(金石星耀)等在内的多个投资者。           对于本轮融资,荣耀表示始终坚持公开透
本文来源:智能通信定位圈01蜂窝物联网行业寡头效应正加剧表:历年蜂窝物联网模组Top5企业在全球范围内的市场份额(按出货量)数据来源:Counterpoint Research在总的出货量上,2022