第三方IP是众所周知的标准功能,例如处理器和通信核心以太网、USB、I2C、SPI和外围器件,这些功能不值得自己花费时间和精力来亲自开发。与其竞争对手相比,MLA是这款SoC的“杀手锏”,可提供每秒50万亿次操作(TOPS),而功耗则低至5瓦。

之前没多久,包含一百万只晶体管的系统级芯片(SoC)还曾被认为是大型器件。可如今,包含多达10亿只晶体管的SoC已是常见,例如,SiMa.ai的最新案例研究及其新的机器学习(ML)芯片MLSoC。该芯片能在嵌入式边缘提供轻松的机器学习。

MLSoC是在16纳米技术节点上创建的,由数十亿只晶体管构成。正如当今SoC设计中几乎无一例外的情况一样,MLSoC构成中,也采用了多个现成的第三方知识产权(IP)块的复杂组合,外加自己开发的机器学习加速器(MLA)IP。

图1:MLSoC在单芯片中同时实现了主机处理器和ML加速器功能。来源:SiMa.ai

第三方IP是众所周知的标准功能,例如处理器和通信核心以太网、USB、I2C、SPI和外围器件,这些功能不值得自己花费时间和精力来亲自开发。与其竞争对手相比,MLA是这款SoC的“杀手锏”,可提供每秒50万亿次操作(TOPS),而功耗则低至5瓦。

不过,结合来自不同供应商的数百个IP所带来的一个问题是,SoC行业已经定义并采用了多个互连协议,包括OCP、APB、AHB、AXI、STBus以及DTL,其中的每个IP都可能使用不同的协议。此外,每个IP可以支持不同的数据宽度并采用单独的时钟频率。正如可以想象到的那样,让这些IP彼此交互可能会让人望而生畏。

进入NoC

连接数百个不同IP的最佳解决方案是使用片上网络(NoC)。利用缓冲和交换,NoC在发起IP和目标IP块之间传递数据包。每个数据包都包含一个标头,其中包括一个带有源地址和目标地址的ID,以及一个包含数据的主体。大量的数据包可能会同时并发传递。

每个IP都有一个或多个称为”插座”的接口。网络接口单元(NIU)将IP”插座”连接到NoC,并对数据进行串行化和打包,同时满足每个IP的数据宽度和时钟频率要求。

开发人员通常将IP设想成在硅芯片的表面上有正方形或长方形的占位面积。尽管NoC跨越了整个芯片,但许多开发者并没有意识到它还是一个IP。

是自己开发还是现成NOC

SoC开发人员必须决定是在自己实施NoC更好,还是从第三方供应商那里获得。对于许多团队来说,也许这根本就是不值得考虑的问题,因为他们完全缺乏从头开始开发全功能NoC所需的时间、资源和技能。

创建适用于现代SoC的NoC至少需要六名工程师满负荷工作两年。然后还有同时调试NoC和其他一些设计问题。唯一能够降低风险、加快上市时间(等同于货币化时间)的现实解决方案,就是选用可信供应商经过验证的现成NoC。

实现NoC的技术优势

不仅仅需要将NIU连接到IP”插座”,还需要确定任一交换机的位置以及任一缓冲区的大小和位置。由于NoC横跨整个芯片,因此有必要为物理布局团队和工具引入多级管道(寄存器),以满足SoC的性能和时序规范。

设计还包括迭代。在流程的前端设计部分执行迭代,要比包括前端和后端物理布局要快得多。如果前端设计工程师手动插入各级管道,并且未能在正确的位置使用足够的资源,则后端物理实现团队将无法实现其目标,导致项目会被退回返工。

不幸的是,架构师通常会通过过度开发、并插入过多级的管道来解决这个问题。尽管这将有助于物理设计团队满足时间要求,但任何超出需求的管道级数都会消耗管芯面积、加大功耗并增加延迟。

解决这一问题的一种正确方法是使用物理感知NoC。这意味着,一旦物理布局团队提供了各个IP块的建议位置,该数据就可以用于自动确定最佳的管道级数和位置。通过加快物理布局过程,实现时序收敛所需耗时的后端到前端迭代次数显著减少。

FlexNoc 5就是一款这样的NoC,它具有物理感知能力,还有一些其他功能选项。对于具有数百个IP和1024+位宽连接的顶级设计,FlexNoc XL选项提供了大容量网状NoC生成器功能。FlexNoC 5高级内存选项适用于复杂内存交织方案和非连续地址位的架构。此选项使用多通道缓冲区重新排序,以避免排序规则块和响应序列化瓶颈,同时支持并发内存通道读取。

图2:物理感知片上网络IP可提高生产力。资料来源:Arteris

有些设计是安全关键型,这意味着故障或误操作有可能会导致人员严重受伤害甚至死亡,或者是设备和财产损失甚至严重损坏,或者是危害环境。在这种类型的设计中,FlexNoc 5 IP可以通过FlexNoc快速还原能力选项来补充。该软件包可帮助设计人员实现符合汽车ISO 26262和IEC 61508标准所需的安全功能。它还为增强型企业SSD耐久性提供了所需的硬件可靠性。

为什么选现成NoC IP

管理复杂SoC设计的唯一方法是使用NoC。与其花费数年时间并消耗大量工程资源来自己开发,不如选用可靠的现成NoC,以节省开发时间、降低风险并加快上市时间。

(参考原文:Create high-performance SoCs using network-on-chip IP

本文为《电子工程专辑》2023年5月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
Intel刚刚发布了新一代桌面显卡Arc B580和B570,关键是还支持AI帧生成和低延迟...
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
有博主基于曝光的信息绘制了iPhone 17系列渲染图,对比iPhone 16系列,17系列最大变化是采用横置相机模组,背部DECO为条形跑道设计,神似谷歌Pixel 9系列,这是iPhone六年来的
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播