支持大语言模型的下一代AIoT系统该怎么做设计验证?

路科验证 2023-07-28 12:10



武林至尊,宝刀屠龙,号令天下,莫敢不从。江湖上的人往往都知道屠龙刀锋利无比,但却鲜有人知道里面暗藏的武林秘籍和兵法绝学,才是真正让人可以依仗的宝物。

ChatGPT成为今年现象级的热门应用后,一个说法也在行业里悄然流传开——1万枚英伟达A100芯片,是做好大模型训练的入门级装备。一时之间“洛阳纸贵”,AI芯片成为了大家眼中的“屠龙宝刀”。我们看到,大量抓住机遇的人,不仅投身大模型产品,还有一部分负责给“掘金人”卖铲子。

 

那么问题来了:

支持大语言模型的AIoT系统,

设计难度在哪?

该怎么做设计验证?

藏在“屠龙刀”里面的秘籍究竟是什么?


过去的AIoT,通常指的都是带低算力的端侧小芯片,但是随着类似ChatGPT的大语言模型全面得到应用,在端侧AIoT芯片上部署需要几十到几百TOPS算力的LLM大模型也成为新的需求。但是新一代AIoT芯片要提高十倍到百倍算力,这不仅仅是堆砌算力那么简单,需要从性能、互连、带宽、接口进行全面的系统级规划和设计。

新一代的AIoT芯片已经不是一个独立的芯片个体,目前市场上的AIoT芯片几乎都结合了CPU、GPU、FPGA和DSP等核心零部件。这就必然需要支持系统级芯片开发的EDA流程。

实际上,芯片设计厂商也意识到了这个问题。当制程工艺逼近极限,但人们对电子产品性能的追求还在不断攀升时,压力很快就传导到了上游的芯片厂商。借助面向系统级的创新,提升芯片的终极性能表现,也成为大家的共识。


所以没有任何分歧,无论从哪个维度看,大规模的系统级芯片设计由于场景丰富、系统规模不断扩张,这一需求正在快速形成市场主流的大浪,涌向EDA工具并推动其不断革新。

如何做好大系统芯片设计?


2023年7月13日至14日,备受期待的第三届中国集成电路设计创新大会(ICDIA 2023)在无锡召开。作为国内领先的系统级验证EDA解决方案提供商,芯华章受邀参加此次盛会,在“AIoT与ChatGPT”分论坛上针对大系统芯片设计挑战,分享了自己的解决方案。


大系统芯片设计,首先要理解什么叫“系统”?对高性能AIoT、自动驾驶、高性能CPU和GPU等等复杂应用来说,系统意味着多节点互联,每个节点都有自己的控制单元(如CPU)和计算单元(如AI、NPU),每个节点都有自己的操作系统和应用软件。毫无疑问,大系统是一个软硬件一体化、多节点一体化的复杂平台,但也只有把这整个平台都在芯片流片前验证通过,才能真正保证高性能复杂芯片设计的正确性。

因此,大系统芯片验证,最直接的挑战来自于规模庞大的系统级仿真。但困难远不止于此,由“大”带来的结构性挑战,涵盖了从验证到调试的方方面面。而更大的设计本身往往意味着更长的时间、更高昂的成本、更慢的仿真性能,本质上也就意味着更困难的验证。

在当下的技术和市场环境下,大系统芯片设计的验证面临三大共性难题,这些难题正是传统的EDA工具所难以解决的痛点:

设计大,很大,大到放不下

从多核、Chiplet封装、多节点到完整系统,复杂的验证规模可以轻易达到百亿甚至千亿门,对验证工具的容量提出了更高的要求,试想如果验证平台根本无法仿真完整的应用系统,又怎么能证明设计是完整正确的?但供数十亿至数百亿规模容量的验证平台,其性能、规模、可调试性又往往成为难以平衡的选择。

验证慢,很慢,难以收敛的慢

系统级规模不断增大,系统级仿真在整个验证的仿真流程中比例不断增大,导致验证团队特别依赖性能和数量有限的硬件仿真系统,导致验证慢的不仅仅是仿真速度,更是整个验证工作的收敛速度和效率。

Debug难,很难,越往后越难

在如此复杂和大规模的系统级仿真上,调试就变成一个更加困难的问题。仿真平台上观察到的问题,到底来自软件、芯片逻辑设计还是多节点互连?问题能否稳定复现?如何在多种仿真平台的数据之间进行综合分析?不解决这些问题,大系统的调试就会越往后期越难,最终影响整个项目周期。


我们似乎开始找到“屠龙刀里秘籍”的线索。作为最上游的辅助设计工具,EDA创新确实是提升系统级设计效率,降低创新成本的关键“钥匙”。


芯华章资深产品与业务规划总监杨晔表示,“单个IP的验证需求在降低,SoC或单个chiplet级的验证需求在不断上升,因为这部分是客户系统级创新的核心。然而在新场景的应用中,传统的EDA工具在应对大容量、深度调试、多种验证场景混合使用的时候,遇到各种效率挑战。芯华章致力提供从软件、硬件到调试的整体解决方案,特别是在大规模设计的系统级验证、硬件验证、架构验证等方面,将为用户提供全流程大系统芯片验证解决方案。”



芯华章大系统芯片设计验证解决方案的核心,是基于敏捷验证理念,建立统一的EDA数据库,打造从IP到子系统再到系统级的统一测试场景,提早开始系统级验证,实现验证与测试目标的高速收敛,进行高效率、高效益的快速迭代,从而助力芯片及系统公司提高验证效率,降低研发成本。



芯华章针对大规模系统级芯片“量身打造”的敏捷验证方案,已经在多个领域获得具体项目部署。

针对自动驾驶应用芯片,芯华章高性能硬件仿真系统HuaEmu E1不仅有高性能仿真和深度调试,还提供了LPDDR5模型用于客户内存仿真,提供CSI和DSI模型用于仿真自动驾驶系统的输入和输出,这些都超出了单颗芯片的范畴,是针对软硬件一体化的系统方案进行仿真验证。


为了解决原型系统和硬件仿真之间切换版本成本高,延长验证周期的问题,芯华章发布的双模硬件验证系统HuaPro P2E则基于统一的软件平台和硬件平台,可以在综合、编译、验证方案构建、用户脚本、调试等阶段,能最大程度的复用技术模块和中间结果,并使用统一用户界面,从而实现原型验证和硬件仿真丝滑的无缝集成,在节约用户成本的同时,还能大大提高验证效率。


传统的软件仿真工具以调试功能强大著名,但却受限于仿真速度,不擅长处理系统级的大规模仿真验证。基于芯华章自主研发的逻辑仿真器GalaxSim,芯华章GalalxSim Turbo实现多核、多服务器并行运算,可以实现1K-10KHz的复杂系统软件仿真,从而可以在RTL阶段提前进行系统级仿真。


拿到屠龙刀并不一定能号令天下,只有学会了刀里面的绝学才能真正成为“武林至尊”。


当“大模型”的路上人越来越多时,产业同样也需要向上游追溯,进一步提升创新效率,在激烈的竞争中快人一步。作为芯片产品定义和创新的核心环节,随着以系统级场景为代表的产业数字化需求迸发,EDA正从方法学、从底层架构开始这场自我革新。



*免责声明:文章内容系作者个人观点,路科验证转载仅为了传达一种不同的观点,不代表路科验证对该观点赞同或支持,欢迎评论区留言交流。


路科验证 专注于数字芯片验证的系统思想和前沿工程领域。路桑是Intel资深验证专家,主持验证架构规划和方法学研究,担任过亿门级通信芯片的验证经理角色。在工程领域之外,他在西安电子科技大学和西安交通大学客座讲授芯片验证课程。著有书籍《芯片验证漫游指南》。
评论 (0)
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 437浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 625浏览
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 446浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 219浏览
  • 硅二极管温度传感器是一种基于硅半导体材料特性的测温装置,其核心原理是利用硅二极管的电学参数(如正向压降或电阻)随温度变化的特性实现温度检测。以下是其工作原理、技术特点及典型应用:一、工作原理1、‌PN结温度特性‌硅二极管由PN结构成,当温度变化时,其正向电压 VF与温度呈线性负相关关系。例如,温度每升高1℃,VF约下降2 mV。2、‌电压—温度关系‌通过jing确测量正向电压的微小变化,可推算出环境温度值。部分型号(如SI410)在宽温域内(如1.4 K至475 K)仍能保持高线性度。
    锦正茂科技 2025-05-09 13:52 243浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 333浏览
  • 温度传感器的工作原理依据其类型可分为以下几种主要形式:一、热电阻温度传感器利用金属或半导体材料的电阻值随温度变化的特性实现测温:l ‌金属热电阻‌(如铂电阻 Pt100、Pt1000):高温下电阻值呈线性增长,稳定性高,适用于工业精密测温。l ‌热敏电阻‌(NTC/PTC):NTC 热敏电阻阻值随温度升高而下降,PTC 则相反;灵敏度高但线性范围较窄,常用于电子设备温控。二、热电偶传感器基于‌塞贝克效应‌(Seebeck effect):两种不同
    锦正茂科技 2025-05-09 13:31 233浏览
  • 飞凌嵌入式作为龙芯合作伙伴,隆重推出FET-2K0300i-S全国产自主可控工业级核心板!FET-2K0300i-S核心板基于龙芯2K0300i工业级处理器开发设计,集成1个64位LA264处理器,主频1GHz,提供高效的计算能力;支持硬件ECC;2K0300i还具备丰富的连接接口USB、SDIO、UART、SPI、CAN-FD、Ethernet、ADC等一应俱全,龙芯2K0300i支持四路CAN-FD接口,具备良好的可靠性、实时性和灵活性,可满足用户多路CAN需求。除性价比超高的国产处理器外,
    飞凌嵌入式 2025-05-07 11:54 92浏览
  • 在过去的很长一段时间里,外卖市场呈现出美团和饿了么双寡头垄断的局面。美团凭借先发优势、强大的地推团队以及精细化的运营策略,在市场份额上长期占据领先地位。数据显示,截至2024年上半年,美团外卖以68.2%的市场份额领跑外卖行业,成为当之无愧的行业老大。其业务广泛覆盖,从一线城市的繁华商圈到二三线城市的大街小巷,几乎无处不在,为无数消费者提供便捷的外卖服务。饿了么作为阿里本地生活服务的重要一环,依托阿里强大的资金和技术支持,也在市场中站稳脚跟,以25.4%的份额位居第二。尽管市场份额上与美团有一定
    用户1742991715177 2025-05-06 19:43 111浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 547浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 385浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦