DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论

2023-05-16

DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论

原文转自：DDR扫盲——关于Prefetch与Burst的深入讨论-Felix-电子技术应用-AET-中国科技核心期刊-最丰富的电子设计资源平台 (chinaaet.com)

【嵌牛导读】关于DDR技术预取原理

【嵌牛鼻子】DDR3的预取原理以及容量计算

【嵌牛提问】如何理解DDR读写速率翻倍以及DDR3的8位预取

【嵌牛正文】

引言：

学习DDR有一段时间了，期间看了好多的资料（部分公司的培训资料、几十篇的博文，Micron的Datasheet，JESD79规范等）。但是有一个问题，想了好久（很多资料都没有说明白），至今才算搞明白，所以写一篇文章和大家分享一下。

如题，接下来要讨论的主要是关于Prefetch和Burst相关的内容。

1、Prefetch介绍

首先，简单介绍一下Prefetch技术。所谓prefetch，就是预加载，这是DDR时代提出的技术。在SDR中，并没有这一技术，所以其每一个cell的存储容量等于DQ的宽度（芯片数据IO位宽）。【关于什么是cell（存储单元，可以去看一下，我之前的博文：http://blog.chinaaet.com/justlxy/p/5100051913）】

进入DDR时代之后，就有了prefetch技术，DDR是两位预取（2-bit Prefetch），有的公司则贴切的称之为2-n Prefetch（n代表芯片位宽）。DDR2是四位预取（4-bit Prefetch），DDR3和DDR4都是八位预取（8-bit Prefetch）。而8-bit Prefetch可以使得内核时钟是DDR时钟的四分之一，这也是Prefetch的根本意义所在。

补充说明：芯片位宽的另一种说法是配置模式（Configuration），在DDR3时代，一般有x4，x8，x16。

下面以DDR3为例，下图是个简单一个简单Read预取示意图，Write可以看做是个逆向过程。

当DDR3 为x8 Configuration时，一个Cell的容量为8x8bits，即8个字节。换一句话说，在指定bank、row地址和col地址之后，可以往该地址内写入（或读取）8 Bytes。

2、回到一个简单的问题上，如何计算DDR3 SDRAM的容量

以Mircon的某型号DDR3 SDRAM为例：

以图中红色部分的内容作为分析案例（8个bank，x8的Configuration）：

计算方式一（错误）：

64K*8*1K*8（Row Addressing * Bank Addressing * Column Addressing * x8 Configuration）= 4Gb（512 Megx8）。

大部分材料给出的都是这种错误的计算方法，误导了很多的初学者。这种计算方法咋一看好像是对的。但是，仔细推敲一下，便可以发现，按照计算方式一的逻辑，则认为每一个Cell的容量是1bit*8（x8 Configuration），即8bit。这与我们在第一部分所讨论的结果（一个Cell的容量为64bits，x8 Configuration下）不符。

当然，从某种角度来说，计算方式一也是正确的，因为分离出的Column Address的位数实际上是和prefetch对应的。比如DDR3 8-bit Prefetch对3bits的Column Address，DDR2 4-bit Prefetch对应的是2bits的Column Address。只是如果直接按照计算方式一来计算的话，对于初次接触DDR的人来说，理解起来存在一定的困难，这也是我写这一篇博文的原因。

下面给出正确的计算方式，并说明原因。

计算方式二（正确）：

64K*8*（1K/8）*8*8（Row Addressing * Bank Addressing * (Column Addressing / 8) * x8 Configuration * 8-bit Prefetch）= 4Gb（512 Megx8）。

很多人都会问，为什么要把列地址寻址（Column Addressing）除以8呢？似乎计算方式二看起来更加不合理。接下来，我们先来回顾一下DDR3 SDRAM的结构框图（还是以Mircon的某型号为例）：

大图可能看的不太清楚，下面来几个特写：

没错！你没有看错！10bit的Column Address的寻址能力只有128！！！刚好差了8倍（这就是我们在计算方式二中将Column Addressing除以8的原因）！

那么问题又来了，为什么Column Address的寻址能力只有128呢？莫急，请继续看下图：

在上图中，可以清晰地发现，10bits的Column Address只有7bits用于列地址译码！列地址0,1,2并没有用！！！

那么，问题又来了！……

列地址0,1,2,这3bits被用于什么功能了？或者是Mircon的设计者脑残，故意浪费了这三个bits？显然不是。

在JESD79-3规范中有如下的这个表格：

可以发现，Column Address的A2，A1，A0三位被用于Burst Order功能，并且A3也被用于Burst Type功能。由于一般情况，我们采用的都是顺序读写模式（即{A2,A1,A0}={0,0,0}），所以此时的A3的取值并无直接影响。

那么，问题又来了！……

Burst又是什么鬼呢？且看第三部分。

3、DDR中的Burst Length

Burst Lengths，简称BL，指突发长度，突发是指在同一行中相邻的存储单元连续进行数据传输的方式，连续传输所涉及到存储单元（列）的数量就是突发长度(SDRAM)，在DDR SDRAM中指连续传输的周期数。上一部分讲到的Burst Type和Burst Order实际上就是关于Burst Length的读写顺序的配置。

【注：不了解相关名词的可以去看一下，我之前的博文：http://blog.chinaaet.com/justlxy/p/5100051913】

在DDR3 SDRAM时代,内部配置采用了8n prefetch(预取)来实现高速读写.这也导致了DDR3的Burst Length一般都是8。当然也有Bursth ength为4的设置(BC4)，是指另外4笔数据是不被传输的或者被认为无效而已。

在DDR2时代，内部配置采用的是4n prefetch，Burst length有4和8两种，对于BL=8的读写操作，会出现两次4n Prefetch的动作。

上图是JESD79-3规范中给出的DDR3 SDRAM的Command Truth Table。可以看到，读取和写入都有三种基本模式（Fixed BL8 or BC4，BC4 on the fly，BL8 on the fly）。这一部分的内容，在我之前的博文中有所提及，此处不再详细介绍。

4、参考资料

4Gb_DDR3_SDRAM.pdf

Samsung DDR3 Datasheet.pdf

JESD79-3A-DDR3规范.pdf

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论的相关文章

【leetcode】312. 戳气球（burst-balloons）（DP）[困难]

链接 https leetcode cn com problems burst balloons 耗时解题 xff1a null min 题解 xff1a 31 min 题意有 n 个气球 xff0c 编号为0 到 n 1 xff0c
Burst Imaging for Light-Constrained Structure-From-Motion论文翻译记录

准备开始2022ICRA的SLAM论文阅读记录 Abstract 在极低光照条件下拍摄的图像受噪声限制 xff0c 会导致现有的机器人视觉算法失效在本文中 xff0c 我们开发了一种图像处理技术 xff0c 用于从弱光条件下采集的图像中辅
DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论

DDR扫盲关于Prefetch 预取与Burst 突发的深入讨论原文转自 xff1a DDR扫盲关于Prefetch与Burst的深入讨论 Felix 电子技术应用 AET 中国科技核心期刊最丰富的电子设计资源平台 chinaa
图解RAM结构与原理，系统内存的Channel、Chip与Bank

文章目录转载正文标题挥发性内存分2种 SRAM和DRAM 主内存子系统 channel 和 DIMM rank 和 chip bank row column 内存的读写方式越多越好加速读写能力本文转载来自图解RAM结构与原理系
DDR工作原理

DDR SDRAM全称为Double Data Rate SDRAM 中文名为双倍数据流SDRAM DDR SDRAM在原有的SDRAM的基础上改进而来也正因为如此 DDR能够凭借着转产成本优势来打败昔日的对手RDRAM 成为当今的主流
【DRAM存储器五】DRAM存储器的架构演进-part2

个人主页 highman110 作者简介一名硬件工程师持续学习不断记录保持思考输出干货内容参考书籍 Memory Systems Cache DRAM Disk 目录
DDR SDRAM的内部结构Cell Structure(预充电+刷新)

文章目录读过程包含预充电步骤写过程写0 写1 DDR为什么要刷新以上图Cell0为例子读过程包含预充电步骤首先关闭所有字线 W0 W1 Wn 让所有FET均不导通然后将位线B0通过预充电开关Precharge 图中未画出
DDR中的ZQ校准

转载自https www xuebuyuan com 3233906 html What s the ZQ Calibration command it used to calibrate DRAM Ron ODT values In no
FPGA_MIG驱动DDR3

FPGA MIG驱动DDR3 说明 FPGA zynq 7z100 DDR3 MT41K256M16TW 107 内存大小为512MB 数据接口为16bit 环境 Vivado2018 2 IP核 Memory Interface Gene
UICollectionView：组合布局禁用预取？

我有一个非常简单的UICollectionView它使用组合布局轻松实现动态单元高度不幸的是这样做似乎会禁用内容预取UICollectionViewDataSourcePrefetching 在下面的示例代码中 collectionVi
预取示例？

任何人都可以给出一个示例或使用示例的链接 builtin prefetch在 GCC 或一般的 asm 指令 prefetcht0 中获得显着的性能优势特别是我希望该示例满足以下标准这是一个简单小型独立的示例删除 builtin
如何确定SSE预取指令大小？

我正在使用包含 SSE 预取指令的内联汇编的代码预处理器常量确定是否使用 32 64 或 128 字节预取的指令该应用程序在多种平台上使用到目前为止我必须在每种情况下调查对于给定 CPU 来说哪一个是最佳选择据我所知这是缓存行大
如何在 PHP 中检测浏览器的预取？

某些页面可以由浏览器预取请参阅this http www whatwg org specs web apps current work multipage links html link type prefetch or that htt
Intel Core 2 Duo 预取

有人有过在 Core 2 Duo 处理器上使用预取指令的经验吗我一直在使用标准预取集 prefetchnta prefetcht1等在一系列 P4 机器上取得了成功但是当在 Core 2 Duo 上运行代码时似乎prefetch
预取指令是否需要在退出之前返回结果？

在最新的 Intel 和 AMD CPU 上已执行但请求的行尚未到达指定缓存级别的预取指令是否仍会退出也就是说预取的退休是阻塞的因为它看起来对于加载来说是阻塞的还是非阻塞的关于英特尔处理器没有 Intel优化手册第7
以编程方式禁用 AMD 系统上的硬件预取

有没有一种方法可以像在 Intel 系统中那样以编程方式禁用 AMD 系统上的硬件预取器如这个话题 https stackoverflow com questions 784041 how do i programatically dis
TensorFlow 数据集的函数 cache() 和 prefetch() 有何作用？

我正在关注 TensorFlow图像分割 https www tensorflow org tutorials images segmentation教程其中有以下几行 train dataset train cache shuffle
软件预取手动指令合理的场景

我读过有关 x86 和 x86 64 Intel 的内容gcc提供特殊的预取指令 include
Oracle JDBC 预取：如何避免 RAM 不足/如何使 oracle 更快高延迟

使用 Oracle java JDBC ojdbc14 10 2 x 加载包含多行的查询需要很长时间高延迟环境这显然是 Oracle JDBC 中的默认预取默认大小 10 每 10 行需要一次往返时间我正在尝试设置一个激进的预取大小来
Tensorflow 数据 API - 预取

我正在尝试使用 TF 的新功能即 Data API 但我不知道如何使用prefetch作品在下面的代码中 def dataset input fn dataset tf data TFRecordDataset filenames co

随机推荐

px4 源码中的疑问和记录

1 在类BlockLocalPositionEstimator定义了很多私有成员如下 general parameters BlockParamInt pub agl z BlockParamFloat vxy pub thresh Blo
超简单!!小白级 PXE 实现无人值守批量安装教程

author Tresser date 2017 4 9 03 50 此文较长请细心看完一定可以成功实验环境主机 CentOS 6 5 x86 虚拟机准备工作 1 本地 yum 仓库 2 DHCP 服务器 3 TFTP 服务器 4
HTTP 账号密码验证

https developer mozilla org zh CN docs Web HTTP Authentication 通用的 HTTP 认证框架 RFC 7235 定义了一个 HTTP 身份验证框架 xff0c 服务器可以用来针对客
c语言学习小记：细说字符串的终止符'\0'

之前在使用字符串的时候 xff0c 总觉得 0 很诡异 xff0c 有些时候有 xff0c 有些时候没有 xff0c 没搞懂今天偶然看到一本好书 xff0c 书上对 0 进行了详细的介绍 xff0c 通过介绍终于搞清楚了 0 xff0c
算法导论_15.2矩阵链乘法

一问题描述对于矩阵A 2 3 和矩阵A 3 4 相乘 xff0c 总共需要做2 3 4 61 24次乘法 xff1b 因此对于三个矩阵A1 A2 A3做乘法 xff0c 不同的乘法次序会得到不同次数的乘法运算 xff1b 例如 xff0
Jetson Nano 入坑之路 ---- （1）Jetson Nano 与树莓派

目前市场上 Jetson nano 有两个版本也就是 2G和4G版 xff0c 不过名字不是这么叫的 xff0c 而是2GB版和B01版 2GB和4GB版本也就是从内存来区分的 xff0c 不过呢 xff0c 仔细一看 xff0c 他们板
【升级公告】让双控更到位，晓帆隐患排查系统三大升级

好久不见 xff0c 我们有个好消息跟大家分享晓帆隐患排查系统升级啦 xff01 xff01 相比原来的版本 xff0c 我们做了六大升级 xff0c 新版本让晓帆隐患排查系统更简洁易用 xff0c 帮大家解锁更好的使用体验 xff0c
四旋翼自主飞行器设计方案

针对2016年湖南省电子设计竞赛的飞行器赛题 xff0c 写一篇四轴的方案 xff0c 适合初学四轴的和想了解四轴的 xff0c 大神级别的可以绕道 1 方案设计 1 1姿态传感器的选择 1 1 1加速度计加速度检测芯片有 ADXL345
四轴的方案设计

针对2016年湖南省电子设计竞赛四轴的题 xff0c 写了一篇设计四轴的 xff08 Word文档 xff09 方案 xff0c 适合初学四轴的和想了解四轴的 xff0c 大神请绕道
KEIL3中批量注释和解除注释

有批量注释的 xff0c 先选中你要注释的代码 xff0c 然后Edit Advanced Comment Selection 批量取消注释就是选中要取消注释的 xff0c 然后Edit Advanced Uncomment Selecti
STM32 之供电系统及内部参照电压（VREFINT）使用及改善ADC参考电压和ADC校准

STM32 之供电系统及内部参照电压 xff08 VREFINT xff09 使用及改善ADC参考电压发布时间 xff1a 2018 12 21 10 50 浏览次数 xff1a 1553 标签 xff1a STM VREFINT AD
戴维宁（也叫戴维南）定理是什么？如何证明？_戴维宁定理等效电路求解_戴维宁定理习题

用这个实例体验下等效转换的过程和参数理解叠加定理电路的叠加定理 xff08 Superposition theorem xff09 指出 xff1a 对于一个线性系统 xff0c 一个含多个独立源的双边线性电路的任何支路的响应 xff0
python 实现简单的端口扫描器

https github com ShadomFiend kevinPortScan https download csdn net download blood seeker 10439853
在c++和C中，malloc函数的头文件是什么？C头文件, ＜stdlib.h＞；C++头文件, ＜cstdlib＞

https zhidao baidu com question 432765192 html 在c 43 43 中 xff0c malloc函数的头文件是什么我来答分享举报 4个回答热议穷游是不是一件值得骄傲的事情 Bk0X 推荐
单片机串口中断函数中，如果在里面时间过长，后面来的数据会被自动丢弃吗？答案是会丢数。很多串口测试实例上位机发送成功，但是下位机接收失败

单片机串口中断函数中 xff0c 如果在里面时间过长 xff0c 后面来的数据会被自动丢弃吗我来答分享举报 2个回答热议夫妻之间该做到绝对坦诚吗 xff1f 百度网友b30480f 高粉答主推荐于2017 09 18 繁杂信息太
晶振工作原理及参数详解(最透彻)

晶振工作原理及参数详解最透彻原文链接点击这里晶振是石英晶体谐振器 xff08 quartz crystal oscillator xff09 的简称 xff0c 也称有源晶振 xff0c 它能够产生中央处理器 xff08 CPU xf
网络调试助手简单使用教程（CM精装版V3.8.2）

打开网络调试助手 xff0c 我此处使用的版本是3 8 2 xff0c 各个版本其实使用方法大同小异首先用该软件建立一个TCP服务器 xff0c 在协议类型处选择TCP Server协议 xff0c 本机IP地址一般会默认自动填入本机IP
PCI-E x1/x4/x8/x16四种插槽区别是什么？具体有什么作用？

一现在PCI E插槽已经成为了主板上的主力扩展插槽基本集中在PCI E x1 x4 x8 x16四种上 xff0c 有何作用 xff1f 具体作用是 xff1a 1 显卡会用到PCI E插槽 PCI E 3 0 x16能够满足任何高性能
手把手教你写一个串口调试助手

硬件攻城狮 2022 05 20 14 05 发表于广东果果小师弟电子信息工程硕士在读 xff0c 分享单片机嵌入式linux 物联网等知识 xff0c 致力于打造最硬核的嵌入式技术公众号摘要 xff1a 前段时间发布了一个用QT写
DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论

DDR扫盲关于Prefetch 预取与Burst 突发的深入讨论原文转自 xff1a DDR扫盲关于Prefetch与Burst的深入讨论 Felix 电子技术应用 AET 中国科技核心期刊最丰富的电子设计资源平台 chinaa

DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论

DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论

DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论 的相关文章

随机推荐

热门标签

DDR扫盲—-关于Prefetch(预取)与Burst(突发)的深入讨论的相关文章