DDRTraining系列之五:一文搞懂PrefetchArchitecture

原创嵌入式Lee 2023-12-11 17:15 1647浏览 0评论 1点赞

超低功耗CW32L083系列 STM32峰会2025：AI与GUI开发的未来，就在这里！

一. 前言

Prefetch Architecture实际和training没太大的关系,但是对于理解一些概念和一些参数的计算有很大的帮助，所以单独拎出来浅淡一下。

注:以下约定除非i特别说明均基于LPDDR2。

二. 问题引出

我们还是延续,”看到相关内容随时抛出疑问，引出问题，然后再去寻求理解”的过程。如下是在阅读LPDDR2的规格书JESD209-2F的第一节Scope时抛出的疑问。

我们看到文中提到了如下黄色部分的技术, 于是乎就想要了解一下其到底是什么？首先对SxA,SxB的这个数字2和4到底代表什么表示兴趣。

规格书后面也有简单的介绍，

LPDDR2-S2使用2n预取架构(2n prefetch architecture)。

LPDDR2-S4和LPDDR2-N使用4n预取架构(4n prefetch architecture)。

但是上文中后面的一堆文字怎么看都云里雾里不知所云，那么就引出了本文的主题，究竟什么是DDR的Prefetch Architecture。

三. Prefetch Architecture架构介绍

这里搜到了镁光的一篇技术文档《TN-46-05 GENERAL DDR SDRAM FUNCTIONALITY》,里面的框图可以比较形象的解释。顺便提一下镁光的技术手册文档内容都是非常的不错，包括其数据手册也是学习DDR的不错的资料，可以去官网搜一搜看一看(https://www.micron.com/support下的Technical Notes目录下)。

3.1 2n-Prefetch Architecture

DDR（或DDRI）应用2n预取技术，DDRII应用4n预取架构。

对于DRAM颗粒来说，2n预取即内部数据总线的宽度是外部数据总线宽度的两倍，因此内部列(column)访问频率可以为外部数据传输速率的一半。也就是说，对于设备内部的每个单读取访问周期，都会提供两个外部数据字（如图2所示）。

这里的”字”个人理解应该是颗粒外部总线宽度,即DQ宽度,不应该理解为通常意义的字，原文写的是word所以还是保留该说法。

类似地，写入设备的两个外部数据字(DQ宽度)在内部组合并为一个内部访问写入（如图3所示）。

对用户从高层来看，2n预取意味着数据访问是成对发生的。即单个读取访问获取两个数据字(DQ宽度);对于单个写入访问,必须提供两个数据字(DQ宽度)，和/或2个数据掩码位。这会影响最小burst大小传输和非最小burst传输的终止(BST命令)。2n预取架构的最小burst大小是两次外部数据传输。理解这些就可以理解手册中的burst length参数了。

总结一下就是相当于内部总线变宽了，是外部总线的两倍了，这个变宽是通过所谓的2n-Prefetch Architecture的架构实现的。所以内部传输的单位即颗粒度就是外部总线DQ宽度的两倍，所以内部访问频率只需要外部总线频率一半，但是也要求外部总线访问必须要以2xDQ宽度为单位进行，因为内部访问2n预取架构不能拆分了。

比如镁光某款DDR的burst length是2,4,8,16最低2.

某款LPDDR2的burst length就是4,8,16,最低4

某款LPDDR3的burst length就是8

3.2 4n-Prefetch Architecture

和2n一样不再赘述,上个框图，见如下图右下角部分。

3.3 Prefetch Architecture对BST(Burst Terminate )命令的影响

对于LPDDR2-S2设备，2位预取架构允许在写入或读取命令之后的任何周期中发出BST命令。

如下图所示,BST命令发出对应的始终上升沿后的WL个tCK加上tDQSS时间之后终止burst传输。注意已经发出BST命令之后即T1时刻之后,在新的读写burst之前不能再发BST命令。

所以图中burst设置为16想要传输16，实际传输2就终止了，即1x2(x2是因为一个时钟两个边沿都会传输)，延迟了一个时钟终止。

对于LPDDR2-S4和LPDDR2-N设备，4位预取架构，允许BST命令在写入或读取命令之后的偶数个时钟周期上发出。因此，被BST命令截断的读或写命令的有效burst长度是4的整数倍。如下如所示，不能在(1)处发送BST，必须在读写命令之后的偶数个时钟才能发，可以在T2处发，图中是在T4处发送，此时实际传输burst传输了8，即4x2(x2是因为一个时钟两个边沿都会传输)，延迟了4个时钟终止。