五大半导体垂直市场正合力推动几大行业趋势:设计复杂度和尺寸无止尽地增长、外围设备激增、计算能力不断提高、I/O流量传输剧增,随之而来的是不断攀升的能源消耗,以及遏制其增加的迫切需求。这些趋势的累积效应极大地影响了设计验证领域,并促进了硬件仿真平台的广泛采用。
影响这些趋势的五大垂直领域分别为:数据中心网络、通信/5G、自动驾驶 (AD)、存储,以及人工智能 (AI)和机器学习(ML)。
硬件辅助验证(hardware-assisted verification)简史
根据SEMI技术社区ESD联盟的说法,硬件辅助验证 (HAV) 市场自1995年以来一直停滞不前,远远落后于硬件描述语言 (HDL) 仿真。在2000至2010的十年间,二者的差距超过了2亿美元。从2011年开始,HAV快速增长,缩小了与HDL之间的差距;但从2014年开始,差距再次重新拉大。
到2018年,事实证明,这种局面又出现扭转,而且有利于HAV工具。据ESD联盟报告称,2020年HAV工具的收入达到创纪录的7.18亿美元(见表1)。
表 1:硬件辅助验证的收入显示出增长的趋势。(图片来源:SEMI技术社区ESD 联盟)
可以想见,在可预见的未来,五大关键市场将继续并加快采用硬件辅助验证。
数据中心网络、通信/5G、AD、AI/ML和存储市场的发展趋势和面临的验证挑战表明了尖端的硬件仿真器(HAV市场的最大贡献者)具备解决这些问题的能力。我们将在文章的最后一部分简单讨论功率趋势和功率分析。
数据中心网络
图1:数据中心网络面临一系列验证挑战
数据中心网络享受软件定义网络 (SDN) 等新应用带来的红利,实现了爆炸式增长。包括5G、时间敏感网络 (TSN) 和汽车互联网在内的新兴协议也发挥了一定作用。它们助力扩充端口数(端口数现已超过256个,端口速度增加到接近800Gb/s),还帮助增大了带宽,降低了延迟。从而最终将设计尺寸扩展到数十亿个等效门,由于缩短了时间分配以确保满足性能和功率预算,硅前设计验证工作变得异常艰巨。
网络的硬件仿真
为了应对这些挑战,尖端的硬件仿真器必须具备三个特征:平台、应用和生态系统。
从平台角度来说,其容量必须达到150亿门,并具备以10亿门为单位的可扩展性,同时仍能在所有配置中保持一致的执行速度。它应本地支持三元内容可寻址存储器 (TCAM),以避免繁琐和低效的建模。同样重要的是,测试环境和仿真器中运行的被测设备 (DUT) 之间的通信通道必须具有高带宽和低延迟,以适应不断增加的端口数量。
对应用来说,在线仿真 (ICE) 和虚拟部署都十分必要。确定性调试对ICE来说是必须的,而一套丰富的速度适配器更是必不可少。虚拟模式必须使用经过验证的虚拟解决方案扩展库(例如西门子的VirtuaLAB以太网和VirtuaLAB PCIe)。
通信和5G
通信市场,尤其是5G应用,有两个特征非常突出。首先,2018年约有50,000项5G专利涌现,证明了其部署不断加速。其次,需要专门的半导体器件才能满足智能设备和智慧城市、物联网边缘产品、虚拟现实、数字行业应用和自动驾驶汽车等一系列应用对功耗、性能、尺寸和延迟的要求。
5G的硬件仿真
为了解决5G设计验证问题,从硅前知识产权 (IP) 级别开始,直到进入硅后测试实验室,在整个流程中集成一套全面的、端到端工具十分必要。
图 2:5G端到端、硅前和硅后开发与验证流程包含模拟、仿真、原型设计、单元测试、系统集成和硅后测试
在一个完整的验证/确认(verification/validation)周期中,整个流程包括了模拟、仿真、原型设计、单元测试、系统集成和硅后测试。仿真用于IP/模块级验证。硬件仿真则取代模拟以完成子系统的验证,它结合FPGA原型设计,通过流片验证和确认整个系统,包括软件在内。一套集成良好的仿真和原型设计平台可以端到端共享相同的激励和验证设置。
自动驾驶
AD设计涉及功能性安全和信息安全方面的几个关键问题,需要车辆和云计算之间进行大规模通信和海量数据处理。
其验证的难点在于传感器数量不断增加(可能超过50种不同类型)、软件数量不断增加(现在已达到 1亿行代码),以及必须一起确认的软件和硬件带来的复杂性。它需要大量的验证周期来证明自动驾驶汽车的安全与可靠。
自动驾驶的硬件仿真
AD控制器的验证/确认需要处理感知(sense)、计算(compute)和致动(actuate)。感知用于收集感官信息以捕捉驾驶场景;计算对这些场景执行算法处理以制定决策;而致动则根据这些决策向引擎、变速箱、转向和制动系统发送命令,以采取行动。这些都需要多种技术的集成。硬件仿真用来计算处理由VECTOR CANoe、dSPACE或西门子Pre-Scan等虚拟环境生成的传感器数据,并决定要采取的行动,并通过引擎和方向盘的功能模型(例如西门子AMESim等)来驱动执行。
图 3:自动驾驶汽车的验证和确认环境需要考虑感知、计算和驱动
人工智能/机器学习(AI/ML)
AI/ML设计记录了新型架构驱动的最大晶体管数量,用于计算、存储和内存访问。新型架构针对特定应用,例如张量处理单元 (TPU)、神经网络处理器 (NNP)、神经处理引擎 (NPE) 以及实现类型,例如 2D、3D 堆叠、小芯片(Chiplets)、FPGA结构和定制人工智能逻辑。从验证的角度来看,设计能力、设计结构、功率分析和软件堆栈验证是必须处理的四种能力。
AI/ML 的硬件仿真
基于这些设计特征,仿真平台必须能够处理多达150亿个门,并以每小时数亿个门的速度编译设计,以实现快速周转时间 (TAT),以找到并修复错误、重新编译并重新运行仿真。它必须支持主机和仿真器之间的高通信带宽,以管理虚拟测试环境和DUT之间的密集流量。它应该执行精确的功率分析,并能够根据应用执行客户软件堆栈。
存储(SSD 与 CSD)
图 4:采用计算存储设备(CSD)可以消除一些瓶颈,提高性能、降低功耗并释放PCIe带宽。
固态硬盘 (SSD) 的普及受三个瓶颈的制约。首先,由NAND闪存结构组成的存储介质具有有限的预期寿命、耗损均衡并需要垃圾收集,其性能会随时间而下降,可靠性要求高且有随机延迟。其次,主机接口的带宽和延迟不符合SSD要求,因此无法发挥其全部潜力。第三,尽管通过计算存储设备 (CSD) 已经消除了一些瓶颈,但数据移动的物理特性降低了性能和功耗目标。
在SSD中,主机向存储驱动器发出数据请求。存储器将数据发送到计算机,计算机再将处理后的数据写回存储器。而在CSD中,主机向安装在CSD本地的轻量型计算机发送请求,本地计算机并不是将数据发送回主机,而是“就地”处理数据并将结果发送回主机。
CSD设计人员可以将部分计算从主机拆分并转移到CSD中,从而提高性能、降低功耗并为系统的其余部分释放PCIe带宽。
有很多应用得益于CSD,包括超大规模数据中心、图像识别、边缘计算、AI/ML、实时分析、数据库查询等。
存储器的硬件仿真
SSD和CSD的传统验证方法因存储器的不确定性本质而备受挫折。而基于仿真的虚拟验证则提供了新的验证方法。通过虚拟化,可以高速执行完整的系统验证,包括完整的固件确认,这不但加快了上市时间,还可以进一步探索架构,为特定任务创建最佳的解决方案。SSD虚拟化可以实现硅前性能和延迟测试,其准确性与实际硅相比误差不超过5%。
图5:通过仿真进行详尽的CSD验证
功率趋势与功率分析
28纳米以下工艺节点的芯片设计会放大很多细分市场应用的动态功耗缺点,包括手机、CPU/GPU、数据中心、汽车和AI/ML等应用。
在硅前设计中准确识别峰值、谷值和热点是进行快速高效功率分析的难点。此外,还要解决周转时间长、磁盘消耗高、波形生成格式庞大(如快速信号数据库FSDB和值变化转储VCD)等问题。只有运行真实环境的操作系统和行业基准测试才能获得准确和实际的结果,例如3DMark、GFXBench、Geekbench、AnTuTu,它们均要求高性能的引擎和集成确认(validation)流程。
用硬件仿真实现功率分析
通过在寄存器传输级 (RTL) 代码可用之前运行实际的应用,现代硬件仿真器可以在设计验证周期早期即生成活动图,从而快速找到热点和谷值发生的位置和时间。它可以确定是什么导致了硬件层次结构中的峰值,并生成一个热点图,显示哪些IP或模块耗电大。
一旦硬件仿真平台识别出设计层次结构中的时间窗口,它就可以在这些窗口内生成详细的切换信息,提供给功率分析工具。这通常通过创建平面文件流数据库 (FSDB) 或切换活动交换格式 (SAIF) 文件来完成。 更好的方法是通过API直接从仿真器访问功率工具,绕过文件生成,以实现更快、更高效的过程。
一旦功率工具获得信息,它就可以生成准确的功率数据,从而帮助修改RTL设计以降低功耗。进行适当的更改后,新的验证周期可以确认这些更改的有效性。
图 6:完整的功率解决方案
结语
数据中心网络、通信和5G、自动驾驶、人工智能和机器学习,以及存储器的市场趋势对硬件辅助验证的前景产生了积极的影响。随着芯片性能越来越强大,并由于接口的增加变得愈加复杂,硬件辅助验证已成为一项必要的硬性投资,硬件和软件代码集成在设计早期阶段变得至关重要。没有任何其他验证工具可以应对这些挑战。
(参考原文:Market-Driven Trends in Hardware Emulation)
责编:Amy Guan
本文为《电子工程专辑》2021年9月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅