首个国内《芯粒互联接口标准》Chiplet接口测试成功,北极雄芯公布新进展

路科验证 2023-09-07 12:05

近日,北极雄芯宣布自主研发的首个基于国内《芯粒互联接口标准》的Chiplet互联接口PBLink回片测试成功。PBLink接口具备低成本、低延时、高带宽、高可靠、符合国产接口标准、兼容封装内外互连、注重国产自主可控等特点。


接口采用12nm工艺制造,每个D2D单元为8通道设计,合计提供高达256Gb/s的传输带宽,可采用更少的封装互连线以降低对封装的要求,最少仅需要3层基板进行2D互连;基于专门优化的精简协议层和物理层,可实现ns级别的端到端延迟,各项指标符合《芯粒互联接口标准》要求及设计预期;此外,PB Link可灵活支持封装内Chiplet – Chiplet互联以及10-15cm的封装外板级Chip – Chip互联,灵活适配各类下游应用场景需求。公司率先推出的是基于传统封装(153μm Standard Package)的芯粒解决方案,并预计在2024~2025年推出针对超高性能场景的高密度互连版本(55μm InFO Package)。


图1  北极雄芯256Gb/s带宽的

D2D测试片回片测试成功


北极雄芯专注于为客户提供基于Chiplet的定制化高性能计算解决方案,公司于2023年初发布了国内首款基于Chiplet异构集成的人工智能计算芯片“启明930”,并持续投入各类通用型HUB Chiplet,功能型Chiplet以及高速芯粒互联接口的研发。本次回片测试成功的PBLink将用于公司下一代核心HUB Chiplet以及部分功能型Chiplet上,预计于2024年内实现整体量产。


Chiplet(芯粒技术) – 后摩尔时代的行业演进方向


过去半个世纪,摩尔定律下的工艺进步在不断推动半导体产业的发展,促使电路频率以及晶体管密度不断提升,芯片的性能密度不断增加。而近年来,随着工艺迭代逐渐进入瓶颈期,集成电路的发展进入“后摩尔时代”,单位面积硅片下晶体管集成密度无法进一步压缩,而通过增加单芯片面积来提升性能又面临显著的“面积墙”以及一系列的良率、成本等问题。从全球半导体产业发展趋势来看,5nm及以下更先进工艺的投入产出比在商业可行性上面临诸多挑战,而在当前国际形势和自主可控的供应链边界能力下,国内半导体产业甚至在12nm工艺节点即须直面芯片性能如何进一步提升的问题。


在摩尔定律逐步失效的背景下下,Chiplet(芯粒技术)逐步成为行业共识的演进方向。通过将多芯片在封装内互联的方式实现性能扩展或系统级的功能的集成,不但可有效解决大面积芯片面临的良率低、量产成本高等问题,亦可面向不同场景需求提供灵活的组合。近年来,海内外知名半导体企业均基于自身产品场景需求,采用不同的Chiplet集成方式推出了新一代芯片,例如基于2块或多块相同芯片进行高性能合封的AMD Zen1、Apple M1/2 Ultra、Intel Sapphire Rapids,或基于异构模块集成的AMD Zen4、AMD MI300、Intel Ponte Vecchio、华为昇腾等。



图2  行业领先企业最新产品上的

Chiplet架构应用


芯粒互联接口(D2D) – Chiplet集成的关键技术


Chiplet集成能够极大程度上优化高性能计算芯片的商业落地可行性,但从技术层面而言,每颗被集成的小芯粒在互联后依然能够达到系统级整体性能要求至关重要,因此在不同场景需求下采用的芯粒互联接口技术(D2D)与Chiplet集成后整体性能密切相关,最终旨在通过封装内的芯粒互联实现“像片上互连一样”的效果,并同时兼顾低成本、低延时、高带宽、高可靠性的需求。


在实际应用领域中,不同场景的数据传输特点带来对所采用接口技术及封装技术的较大需求差异。例如CPU等通用计算场景中,数据传输具有随机性高、数据流结构差异大、缓存一致性要求高等特点,因此在CPU Chiplet集成中往往极为重视对延迟等指标的优化,采用并口传输方案,大规模走线较为依赖先进封装技术的配套支持。在GPGPU等面向服务器领域的通用并行计算场景中,数据传输具有单次量大、数据流结构可预知性高、可提前搬运预载等特点,因此在Chiplet集成中需要重点对带宽等指标进行优化,可采用并口或串口方案,对先进封装亦有较高的依赖。而在特定AI加速场景中,又需综合考虑成本敏感度、作业环境等各方面要求,采用不同的接口技术及封装方案以满足终端用户的差异化的需求:如以智能驾驶领域为例,先进封装方案往往并不满足车规要求,而且量产成本也较高,在采用Chiplet异构集成时往往需考虑在成熟封装方案基础上反过来优化相应的D2D技术。


综上而言,芯粒互联接口的技术路线与其所应用的场景技术需求、成本敏感度、封装供应链完备程度等密切相关,短期内在高性能计算领域很难有统一的接口标准满足各类产品在技术及商业上的需求,设计公司往往需要根据不同场景的差异化需求开发不同的D2D接口方案,例如Apple用于M1/M2 Ultra的UltraFusion技术、NVIDIA的NVLink技术等均为根据自身产品使用场景优化的D2D接口方案。


《芯粒互联接口标准》(ACC) – 基于国产供应链优化的互联标准


在当前国际形势下,国内半导体产业在高性能计算领域的产业化落地除了考虑不同场景技术层面的需求外,量产供应链的稳定保障亦至关重要。海外高端高性能计算芯片往往能够得到先进封装产业链的支持(如Intel EMIB技术、TSMC CoWoS技术等),国内封装产业在2.5D先进封装技术等方面亦取得了一定成果,但作为关键材料的ABF基板尚需依赖海外供应链,国内基板层数方面相对落后,在系统级较为重视的连接密度、线宽线距、通孔过孔盲孔工艺和毛刺控制方面与一线国际水平相比还有差距。


如何在现有相对落后的制造工艺、尚在发展中的先进封装技术以及相关核心材料供应链的基础上,做出满足性能预期且成本可控的产品,使得Chiplet真正具有商业可行性?


基于上述目标,并立足于国内供应链成熟程度的现状,2023年2月,中国Chiplet产业联盟联合国内系统、IP、封装厂商一起,制定了《芯粒互联接口标准》ACC1.0及《车规级芯粒互联接口标准》ACC_RV 1.0。


图3  《芯粒互联接口标准》与《车规级芯粒互联接口标准》的起草、审阅单位


该接口标准已经走上国际舞台进行推广。北极雄芯创始人马恺声教授在2023年6月的第50届计算机架构顶级会议ISCA中,受邀参加第三届“高性能芯粒和互连架构国际研讨会HiPChips”,对Chiplet ACC接口进行宣讲。北极雄芯D2D接口对ACC的适配,促进了Chiplet生态共建,为日后生态伙伴的Chiplet单元互连奠定关键基础,并可广泛用于诸如服务器、汽车计算等关键领域。


图4  《芯粒互联接口标准》发布会,以及马恺声教授在ISCA HipChips Workshop对ACC标准进行介绍


该标准为高速串口标准,着重基于国内封装及基板供应链进行优化,以成本可控及商业合理性为核心导向。由于总带宽 = 数据线数 × 线速率,在一定带宽下,通过提高线速率即可降低线数,从而降低对封装的需求,实现对国产封装供应链的兼容,为提升国产高性能计算芯片的自主可控度奠定了坚实的基础。


图5  《芯粒互联接口标准》(ACC)的特点


从技术层面,ACC标准作为高速串口标准,适用于固定的、可提前预知的数据流结构多Die封装。若可提前预知数据流结构,便可以提前进行数据搬运。数据对带宽敏感,对延迟敏感的要求,可通过数据预读取、编译进行优化。从应用领域来看,ACC标准更加适用于各类异构计算场景,如各类AI加速产品、GPU、FPGA、多核CPU Die内已经互联后与其他异构模块交互等。


北极雄芯 – 基于Chiplet的定制化高性能计算解决方案提供商


北极雄芯旨在为广大高性能计算场景提供基于Chiplet集成的定制化高性能计算解决方案。在当前国际形势及行业发展趋势下,基于国内具备商业化落地的可行性出发,兼顾场景需求、成本敏感度、国产供应链等各方面的因素,专注于面向自主可控性高的Chiplet技术及产品,关注在14/12nm工艺节点以及国产封装供应链下的可实现性。


公司在Chiplet领域深耕多年,已经率先发布了“启明930”— 国内首个基于Chiplet异构集成人工智能芯片的验证,并向若干下游客户交付了首个隐私安全计算芯粒产品。本次PBLink回片测试成功标志着公司基于国产供应链自主研发的芯粒高速互联接口已经在业内率先实现工艺验证,目前公司正投入研发下一代核心通用型HUB Chiplet以及适用于若干下游场景的功能型芯粒,搭载PBLink的首套量产级别Chiplet方案即将在2024年正式推向市场。



文章来源于半导体行业观察



*免责声明:本文由作者原创。文章内容系作者个人观点,路科验证转载仅为了传达一种不同的观点,不代表路科验证对该观点赞同或支持,如果有任何异议,欢迎联系路科验证。


路科验证 专注于数字芯片验证的系统思想和前沿工程领域。路桑是Intel资深验证专家,主持验证架构规划和方法学研究,担任过亿门级通信芯片的验证经理角色。在工程领域之外,他在西安电子科技大学和西安交通大学客座讲授芯片验证课程。著有书籍《芯片验证漫游指南》。
评论
  • 开发板在默认情况下,OpenHarmony系统开机后 30 秒会自动息屏,自动息屏会让不少用户感到麻烦,触觉智能教大家两招轻松取消自动息屏。使用触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566四核处理器,Laval鸿蒙社区推荐开发板,已适配全新OpenHarmony5.0 Release系统,SDK源码全开放!SDK源码中修改修改以下文件参数:base/powermgr/power_manager/services/native/profile/power_mode_co
    Industio_触觉智能 2024-12-09 11:39 112浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 78浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 65浏览
  • 在驾驶培训与考试的严谨流程中,EST580驾培驾考系统扮演着至关重要的数据角色。它不仅集成了转速监控、车速管理、转向角度测量、转向灯光控制以及手刹与安全带状态检测等多项功能,还通过高精度的OBD数据采集器实时捕捉车辆运行状态,确保学员在模拟及实际驾驶中的每一步操作都精准无误。EST580驾培驾考转速车速转向角转向灯光手刹安全带OBD数据采集器系统的重要性及其功能:1、提高评判效率:通过原车CAN协议兼容,不同车型通过刷写固件覆盖,不仅提高了考试的数字化、自动化程度,还减少了人为干预的安装需要,从
    lauguo2013 2024-12-09 16:51 101浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 89浏览
  •         霍尔传感器是根据霍尔效应制作的一种磁场传感器。霍尔效应是磁电效应的一种,这一现象是霍尔(A.H.Hall,1855—1938)于1879年在研究金属的导电机构时发现的。后来发现半导体、导电流体等也有这种效应,而半导体的霍尔效应比金属强得多,利用这现象制成的各种霍尔元件,广泛地应用于工业自动化技术、检测技术及信息处理等方面。霍尔效应是研究半导体材料性能的基本方法。通过霍尔效应实验测定的霍尔系数,能够判断半导体材料的导电类型、载流子浓度及载流子
    锦正茂科技 2024-12-10 11:07 64浏览
  • 肖特基具有很多的应用场景, 可以做同步整流,防止电流倒灌和电源反接等,但是随着电源电流的增大,肖特基导通正向压降0.3~0.7v的劣势也越发明显,产生了很多的热,对于工程师的散热设计是个考验,增加了工程师的设计难度和产品成本,目前一种新的理想二极管及其控制器,目前正在得到越来越广泛的应用- BMS,无人机,PLC,安防,家电,电动工具,汽车等都在快速普及理想二极管有三种架构,内置电荷泵的类似无锡明芯微MX5050T这种,驱动能力会弱点,静态功耗200uA,外置电荷泵MX74700T的这种驱动能力
    王萌 2024-12-10 08:51 85浏览
  •         在有电流流过的导线周围会感生出磁场,再用霍尔器件检测由电流感生的磁场,即可测出产生这个磁场的电流的量值。由此就可以构成霍尔电流、电压传感器。因为霍尔器件的输出电压与加在它上面的磁感应强度以及流过其中的工作电流的乘积成比例,是一个具有乘法器功能的器件,并且可与各种逻辑电路直接接口,还可以直接驱动各种性质的负载。因为霍尔器件的应用原理简单,信号处理方便,器件本身又具有一系列的du特优点,所以在变频器中也发挥了非常重要的作用。  &nb
    锦正茂科技 2024-12-10 12:57 69浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 91浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 68浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 129浏览
  • 本文介绍Linux系统(Ubuntu/Debian通用)挂载exfat格式U盘的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。修改对应的内核配置文件# 进入sdk目录cdrk3562_linux# 编辑内核配置文件vi./kernel-5.10/arch/arm64/configs/rockchip_linux_defconfig注:不清楚内核使用哪个defc
    Industio_触觉智能 2024-12-10 09:44 89浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦