Leti研究人员基于RRAM的TCAM电路,据称其性能媲美基于CMOS的SRAM,且适于多核心的神经形态网络处理器应用…

法国电子暨信息技术实验室(Leti)日前展示,以电阻式随机存取内存(RRAM)为基础的三态内容可寻址内存(TCAM)电路性能媲美基于CMOS的动态随机存取内存(SRAM)电路,尽管仍存在性能和可靠性之间的权衡折衷,但适于多核心的神经形态网络处理器应用。

TCAM电路的工作原理是使用指示范围(range)的屏蔽位来搜寻大量数据组合。相较于典型内存系统透过物理寻址方式检索内存单元储存的信息,TCAM则是透过内容搜寻储存的信息。因此,这些电路的性能非常适于复杂的路由和大数据(big data)应用——这类应用通常不太需要精确匹配。相较于典型的内存搜寻算法,TCAM电路的方式由于平行比对了所有储存数据以及单次频率周期内的搜寻数据,从而缩短了搜寻的时间。

传统基于SRAM的TCAM电路通常以16个CMOS晶体管建置,这使得TCAM在标准内存结构下的储存容量经常受限于几十个兆字节(megabyte;MB),而且在神经形态运算神经网络芯片中占用宝贵的芯片面积。

Leti在最近的国际电子组件会议(IEDM)上发表研究人员在TCAM技术的最新突破——在TCAM电路中以RRAM取代SRAM内存单元,可将所需的晶体管数量减少到2个(2T)以及在晶体管之上制造两个RRAM (2R),据称这是迄今为止生产这种电路的最紧凑结构。相较于传统的16晶体管TCAM结构,2T2R结构能让所需的TCAM面积减少8倍(假设两种类型的电路中晶体管尺寸相同)。

虽然这带来了芯片尺寸和功耗方面的优势,但Leti表示仍存在两项挑战。其一是电路可靠性强烈依赖于内存单元的ON和OFF状态之比:相较于16T结构(~105),基于RRAM的TCAM可靠性可能会受到相对较低ON/OFF比重(~10-100)的影响。其次,RRAM对于CMOS晶体管的耐受度(endurance)有限,而这也会影响到系统的寿命。

克服这些挑战需要某些折衷:

• 在搜寻作业期间降低施加电压,可以提高系统可靠性;然而,这也会降低系统性能,例如搜寻速度变慢。
• 在每次搜寻期间降低施加电压或提高用于预先编程TCAM单元的功率,能够克服有限的耐受度;这两种方式都能高系统的耐受度,但也同时减慢了搜寻的速度。

在IEDM发表的《深入表征基于电阻式内存的三态内容寻址内存》(In-depth Characterization of Resistive Memory-based Ternary Content Addressable Memories)一文中,Leti介绍RRAM电气特性和TCAM性能之间的关系,以及制造基于RRAM的电路特性。它显示在TCAM性能(搜寻速度)和TCAM可靠性(匹配/不匹配检测和搜寻/读取耐受度)之间存在折衷。这有助于了解如何对基于RRAM的TCAM电路进行编程,以用于网络封包路由等其他应用。

该论文的主要作者Denys RB Ly说:“假设未来的许多神经形态运算架构都具有数千颗核心,研究人员开发的TCAM电路由于具有非挥发特性,将带来更多关键优势,(因为)使用者仅必须在第一次配置网络时上传所有配置位。”他说,这意味着用户可以在每次芯片重设或电源重启时,跳过这个耗时的过程。

Ly在接受《EE Times》采访时表示,该计划所采用的神经形态处理器来自苏黎世神经讯息学研究所(INI)的NeuRAM3计划,该计划同时也支持部份基于RRAM的TCAM研究。“如果我们比较神经形态处理器的内容可寻址内存(CAM)电路所需性能,以及基于RRAM的TCAM性能,将会发现尽管存在上述问题,但结果实它确实能满足这些要求。”

181213_ND_LETI_800-min.png

神经形态处理器的CAM电路性能和Leti TCAM电路性能比较

研究人员并在论文中比较神经形态处理器的CAM电路以及Leti的TCAM电路性能。从搜寻延迟来看,当然是越低越好。然而,由于芯片能够承受非常长的延迟(脉冲相当长,大约为微秒等级),即使搜寻延迟约为90ns,Leti基于RRAM的TCAM也可能用于处理器。当前的CAM电路能够实现低至27ns的搜寻延迟,但是对于像网络路由(延迟~1ns)等典型应用中的CAM电路,这一延迟数字仍然相对较高。

支持Leti方法可行的另一个要点在于现有芯片的CAM电路长约10位,而Leti的TCAM电路则长128位。“如果我们将TCAM电路缩小到10位,我们的搜寻延迟还会更低,甚至可能至少低至27ns。而在搜寻耐受度方面,基于RRAM的TCAM电路能够处理所有事件。”再以编程耐受度来看,RRAM极其适用于神经形态处理器的CAM电路,因为它们只需要一次编程。

“总而言之,对于神经形态处理器应用,采用基于SRAM的CAM电路可能带来更好的性能、可靠性和耐受度,但我们可以采取折衷途径——即以RRAM取代SRAM单元,则可提高内存密度并降低功耗,同时使该系统仍能满足神经形态处理器的要求。”

编译:Susan Hong,EETTaiwan

 

 

阅读全文,请先
您可能感兴趣
由于供应过剩,SK Hynix计划在上半年将其NAND闪存产量减少10%,NAND闪存价格已经连续四个月下跌,SK Hynix的减产举措反映了对当前市场环境的应对策略......
半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
三星在 HBM3E市场落后于SK Hynix,正计划通过采用先进工艺最大限度地提高 HBM4 的性能。三星电子的存储业务部门成功完成了HBM4内存逻辑芯片的设计,并交由Foundry业务部采用4nm工艺进行试产......
SK海力士将在CES2025,展出HBM、企业级固态硬盘(eSSD)等面向AI的代表性存储器产品,也将展示专为端侧AI优化的解决方案和下一代面向AI的存储器产品。
PS1012采用了最新的第五代PCIe,与基于第四代的产品相比其带宽增大了一倍。因此,数据传输速度可达32GT/s(千兆传输/秒),顺序读取性能是以前一代规格产品的两倍,可达13GB/s(千兆字节/秒)。
SK海力士在HBM4上将对基础裸片的称呼已经从DRAM Base Die调整为Logic Base Die,强调了基础裸片愈发重要的逻辑功能。这意味着HBM4时代的基础裸片将全面转向逻辑半导体工艺。
大多数研发人员和导热界面材料配方设计师可能会推荐使用具备诸多优异特性的硅。然而,也存在一些例外情况。这些问题强调了在选择导热界面材料时考虑终端产品最终应用的重要性.....
在与芯科科技(Silicon Labs)首席技术官Daniel Cooley的交谈中,我们了解到该公司在物联网(IoT)和智能边缘领域所发挥的作用和未来发展。
虽然绕过产品防伪保护的手段变得越来越高级,但是最新的 NFC 芯片技术提高了信息安全性,让品牌能够保护知识产权,预防客户误买假冒商品。
西门子推出Simcenter更新版本,助力客户简化工作流程,加快航空航天认证,同时提供深入洞见
点击蓝字 关注我们SUBSCRIBE to USImage: Umar Shakir / The Verge谷歌将于今年2月(25年2月)推出其Android Automotive应用转换计划,该计划
互联网与科技企业每日重点资讯文 | 苏丁巨头动向特朗普给予TikTok禁令75天宽限期美国总统特朗普当地时间20日签署行政令,要求短视频社交媒体平台TikTok“不卖就禁用”法律在未来75天内暂不执行
目前,联想已经在印度工厂生产笔记本电脑和台式电脑,后续还将生产 AI 服务器,而摩托罗拉智能手机、平板电脑和笔记本电脑也在由代工商 Dixon Technologies 进行生产。联想印度公司总经理
    三极管的电流放大作用应该算是模拟电路里面的一个难点内容,我想用这几个动画简单的解释下为什么小电流Ib能控制大电流Ic的大小,以及放大电路的原理。    我这里的三极管也叫双极型晶体管,模电的放
刚进入2025年,汽车电驱行业又有2个项目宣布投产:● 上汽通用五菱:青岛电驱项目正式落地投产,年产能30万台;● 菲仕科技:赣州电驱项目投产,年产能12万台,供应小鹏汽车。五菱电驱项目投产年产能30
1月20日,市场调查机构 CounterPoint Research发布的报告显示,2024 全年 PC 出货量达到 2.53 亿台,同比增长 2.6%,PC 市场已恢复到正常季节性波动,并随着 AI
1月21日,研究机构 Canalys 发布的报告显示,2024 年第四季度,由于厂商在节后调整库存,印度智能手机出货量下降 4%,降至 3720 万台。其中,vivo 以 750 万台的出货量和 20
1月20日晚,联创电子科技股份有限公司(以下简称“联创电子”)发布了其2024年度业绩预告。           数据显示,联创电子预计2024年实现营业收入92.7亿元至103亿元,同比变化区间为-
一凡 发自 副驾寺智能车参考 | 公众号 AI4Auto给Cybercab装上方向盘,不就是Model Q?网友们的设想和期盼,似乎成真了,就在最近,有博主拍到特斯拉Cybercab居然有方向盘了,引
近日,纳芯微宣布推出全新基于AMR(各向异性磁阻技术)的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏感单元与ASIC技术,能够精准监测车轮转速,为防抱死制动系统(ABS)、车身电子