支持大语言模型的下一代AIoT系统该怎么做设计验证?

路科验证 2023-07-28 12:10



武林至尊,宝刀屠龙,号令天下,莫敢不从。江湖上的人往往都知道屠龙刀锋利无比,但却鲜有人知道里面暗藏的武林秘籍和兵法绝学,才是真正让人可以依仗的宝物。

ChatGPT成为今年现象级的热门应用后,一个说法也在行业里悄然流传开——1万枚英伟达A100芯片,是做好大模型训练的入门级装备。一时之间“洛阳纸贵”,AI芯片成为了大家眼中的“屠龙宝刀”。我们看到,大量抓住机遇的人,不仅投身大模型产品,还有一部分负责给“掘金人”卖铲子。

 

那么问题来了:

支持大语言模型的AIoT系统,

设计难度在哪?

该怎么做设计验证?

藏在“屠龙刀”里面的秘籍究竟是什么?


过去的AIoT,通常指的都是带低算力的端侧小芯片,但是随着类似ChatGPT的大语言模型全面得到应用,在端侧AIoT芯片上部署需要几十到几百TOPS算力的LLM大模型也成为新的需求。但是新一代AIoT芯片要提高十倍到百倍算力,这不仅仅是堆砌算力那么简单,需要从性能、互连、带宽、接口进行全面的系统级规划和设计。

新一代的AIoT芯片已经不是一个独立的芯片个体,目前市场上的AIoT芯片几乎都结合了CPU、GPU、FPGA和DSP等核心零部件。这就必然需要支持系统级芯片开发的EDA流程。

实际上,芯片设计厂商也意识到了这个问题。当制程工艺逼近极限,但人们对电子产品性能的追求还在不断攀升时,压力很快就传导到了上游的芯片厂商。借助面向系统级的创新,提升芯片的终极性能表现,也成为大家的共识。


所以没有任何分歧,无论从哪个维度看,大规模的系统级芯片设计由于场景丰富、系统规模不断扩张,这一需求正在快速形成市场主流的大浪,涌向EDA工具并推动其不断革新。

如何做好大系统芯片设计?


2023年7月13日至14日,备受期待的第三届中国集成电路设计创新大会(ICDIA 2023)在无锡召开。作为国内领先的系统级验证EDA解决方案提供商,芯华章受邀参加此次盛会,在“AIoT与ChatGPT”分论坛上针对大系统芯片设计挑战,分享了自己的解决方案。


大系统芯片设计,首先要理解什么叫“系统”?对高性能AIoT、自动驾驶、高性能CPU和GPU等等复杂应用来说,系统意味着多节点互联,每个节点都有自己的控制单元(如CPU)和计算单元(如AI、NPU),每个节点都有自己的操作系统和应用软件。毫无疑问,大系统是一个软硬件一体化、多节点一体化的复杂平台,但也只有把这整个平台都在芯片流片前验证通过,才能真正保证高性能复杂芯片设计的正确性。

因此,大系统芯片验证,最直接的挑战来自于规模庞大的系统级仿真。但困难远不止于此,由“大”带来的结构性挑战,涵盖了从验证到调试的方方面面。而更大的设计本身往往意味着更长的时间、更高昂的成本、更慢的仿真性能,本质上也就意味着更困难的验证。

在当下的技术和市场环境下,大系统芯片设计的验证面临三大共性难题,这些难题正是传统的EDA工具所难以解决的痛点:

设计大,很大,大到放不下

从多核、Chiplet封装、多节点到完整系统,复杂的验证规模可以轻易达到百亿甚至千亿门,对验证工具的容量提出了更高的要求,试想如果验证平台根本无法仿真完整的应用系统,又怎么能证明设计是完整正确的?但供数十亿至数百亿规模容量的验证平台,其性能、规模、可调试性又往往成为难以平衡的选择。

验证慢,很慢,难以收敛的慢

系统级规模不断增大,系统级仿真在整个验证的仿真流程中比例不断增大,导致验证团队特别依赖性能和数量有限的硬件仿真系统,导致验证慢的不仅仅是仿真速度,更是整个验证工作的收敛速度和效率。

Debug难,很难,越往后越难

在如此复杂和大规模的系统级仿真上,调试就变成一个更加困难的问题。仿真平台上观察到的问题,到底来自软件、芯片逻辑设计还是多节点互连?问题能否稳定复现?如何在多种仿真平台的数据之间进行综合分析?不解决这些问题,大系统的调试就会越往后期越难,最终影响整个项目周期。


我们似乎开始找到“屠龙刀里秘籍”的线索。作为最上游的辅助设计工具,EDA创新确实是提升系统级设计效率,降低创新成本的关键“钥匙”。


芯华章资深产品与业务规划总监杨晔表示,“单个IP的验证需求在降低,SoC或单个chiplet级的验证需求在不断上升,因为这部分是客户系统级创新的核心。然而在新场景的应用中,传统的EDA工具在应对大容量、深度调试、多种验证场景混合使用的时候,遇到各种效率挑战。芯华章致力提供从软件、硬件到调试的整体解决方案,特别是在大规模设计的系统级验证、硬件验证、架构验证等方面,将为用户提供全流程大系统芯片验证解决方案。”



芯华章大系统芯片设计验证解决方案的核心,是基于敏捷验证理念,建立统一的EDA数据库,打造从IP到子系统再到系统级的统一测试场景,提早开始系统级验证,实现验证与测试目标的高速收敛,进行高效率、高效益的快速迭代,从而助力芯片及系统公司提高验证效率,降低研发成本。



芯华章针对大规模系统级芯片“量身打造”的敏捷验证方案,已经在多个领域获得具体项目部署。

针对自动驾驶应用芯片,芯华章高性能硬件仿真系统HuaEmu E1不仅有高性能仿真和深度调试,还提供了LPDDR5模型用于客户内存仿真,提供CSI和DSI模型用于仿真自动驾驶系统的输入和输出,这些都超出了单颗芯片的范畴,是针对软硬件一体化的系统方案进行仿真验证。


为了解决原型系统和硬件仿真之间切换版本成本高,延长验证周期的问题,芯华章发布的双模硬件验证系统HuaPro P2E则基于统一的软件平台和硬件平台,可以在综合、编译、验证方案构建、用户脚本、调试等阶段,能最大程度的复用技术模块和中间结果,并使用统一用户界面,从而实现原型验证和硬件仿真丝滑的无缝集成,在节约用户成本的同时,还能大大提高验证效率。


传统的软件仿真工具以调试功能强大著名,但却受限于仿真速度,不擅长处理系统级的大规模仿真验证。基于芯华章自主研发的逻辑仿真器GalaxSim,芯华章GalalxSim Turbo实现多核、多服务器并行运算,可以实现1K-10KHz的复杂系统软件仿真,从而可以在RTL阶段提前进行系统级仿真。


拿到屠龙刀并不一定能号令天下,只有学会了刀里面的绝学才能真正成为“武林至尊”。


当“大模型”的路上人越来越多时,产业同样也需要向上游追溯,进一步提升创新效率,在激烈的竞争中快人一步。作为芯片产品定义和创新的核心环节,随着以系统级场景为代表的产业数字化需求迸发,EDA正从方法学、从底层架构开始这场自我革新。



*免责声明:文章内容系作者个人观点,路科验证转载仅为了传达一种不同的观点,不代表路科验证对该观点赞同或支持,欢迎评论区留言交流。


路科验证 专注于数字芯片验证的系统思想和前沿工程领域。路桑是Intel资深验证专家,主持验证架构规划和方法学研究,担任过亿门级通信芯片的验证经理角色。在工程领域之外,他在西安电子科技大学和西安交通大学客座讲授芯片验证课程。著有书籍《芯片验证漫游指南》。
评论
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 32浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 34浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 92浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 81浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 47浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 145浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 44浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 60浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 47浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 33浏览
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 40浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 41浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦