解密CortexR52内核Cache：操作实践、性能测试与深度解析（1）

原创瑞萨MCU小百科 2024-07-10 12:01 1393浏览 0评论 0点赞

中端示波器性能提升“秘籍” 边缘AI开发的奥秘，一场直播就能搞懂！

在开始阅读本系列文章之前，请先参阅《有关CR52 MPU配置说明》。因为这篇文章讲述了，cache配置所涉及到的寄存器的设置和MPU的一些基本概念。如果读者都已经理解了上述内容，可以跳过。本章内容主要讲述cache属性的具体含意、注意事项、以及在RZ/T2M的性能测试。

RZ/T2M cache的相关说明

RZ/T2M用的Cortex-r52内核芯片做了一级Cache支持，Cache又分数据缓存D-Cache和指令缓存I-Cache，RZ/T2M cpu0的数据缓存和指令缓存大小都是16KB，cpu1的数据缓存和指令缓存大小都是32KB。对于指令缓存，用户不必过于关注，对于有执行效率要求的代码，尽量放在TCM或者使能cache的SRAM区域。这里主要说的是数据缓存D-Cache。如果Rzt2m主频是400MHz，TCM和Cache都以400MHz工作，但是如果主频是800MHz，那么TCM必须有一个指令周期的等待。也就是说TCM的工作频最高就是400MHz，而cache的工作频与CPU主频一致。

这就是为什么当用户代码比较小的时候，如果代码放在SRAM，但是代码又大部分被cache缓存了，在CPU的主频是800MHz的情况下，此时代码的执行效率高于TCM的原因。因为cache可以达到800MHz的主频，而TCM只能达到400MHz。如果CPU主频是400MHz，在代码很小的情况下，TCM的性能与SRAM的性能几乎相当。但是用户代码很大又比较复杂的时候，远超过16KB的缓存大小时，这就要看具体情况另当别论了。

TCM不是本章内容的重点，本章内容重点是SRAM的cache的说明。T2/N2 SRAM的总线频是200MHz。数据缓存D-Cache就是为了CPU加速访问SRAM。如果每次CPU要读写SRAM区的数据，都能够在Cache里面进行，自然是最好的，实现了200MHz到400MHz的飞跃，实际是做不到的，因为数据Cache大小是有限的，总有用完的时候。

RZ/T2M系统框图

有关瑞萨RZ/T2M的更多介绍请访问：

RZ/T2M

https://www.renesas.cn/cn/zh/products/microcontrollers-microprocessors/rz-mpus/rzt2m-high-performance-multi-function-mpu-realizing-high-speed-processing-and-high-precision-control