有多少数据加载到 L2 和 L3 缓存中？

2023-12-21

如果我有这门课：

class MyClass{
    short a;
    short b;
    short c;
};

我有这段代码对上面的内容执行计算：

std::vector<MyClass> vec;
//
for(auto x : vec){
    sum = vec.a * (3 + vec.b) / vec.c;
}

我知道CPU只从L1缓存加载它需要的数据，但是当L1缓存从L2缓存检索数据时，它会加载整个“缓存行”（其中可能包括它不需要的几个字节的数据）。

L2 缓存从 L3 缓存加载多少数据，L3 缓存从主内存加载多少数据？它是根据页面定义的吗？如果是的话，根据不同的 L2/L3 缓存大小，这个答案会有何不同？

L2 和 L3 高速缓存还具有小于虚拟内存系统页的高速缓存线。 L2 和 L3 高速缓存行的大小大于或等于 L1 高速缓存行大小，通常是 L1 高速缓存行大小的两倍。

对于最新的 x86 处理器，所有缓存都使用相同的 64 字节缓存行大小。（早期的 Pentium 4 处理器具有 64 字节 L1 高速缓存线和 128 字节 L2 高速缓存线。）

IBM 的 POWER7 在 L1、L2 和 L3 中使用 128 字节缓存块。（但是，POWER4 在 L1 和 L2 中使用 128 字节块，但在片外 L3 中使用扇区 512 字节块。扇区块为子块提供有效位。对于 L2 和 L3 缓存，扇区允许单个一致性大小在整个系统中使用。）

在末级高速缓存中使用较大的高速缓存行大小可以减少标签开销，并有利于处理器和主内存之间的长突发访问（较长的突发可以提供更多带宽并有助于更广泛的纠错和 DRAM 芯片冗余），同时允许其他级别的高速缓存和缓存一致性以使用较小的块，从而减少带宽使用和容量浪费。（大的末级缓存块还可以提供预取效果，由于末级缓存的容量相对较高，因此缓存污染问题不太严重。但是，硬件预取可以达到相同的效果，并且缓存容量的浪费较少。）（例如，典型的一级缓存），驱逐发生得更频繁，因此可以利用空间局部性的时间跨度更小（即，在缓存行被驱逐之前更有可能只使用一个较小块中的数据）。较大的缓存行也会减少可用块的数量，从某种意义上减少缓存的容量；这种容量减少对于小型高速缓存来说尤其成问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有多少数据加载到 L2 和 L3 缓存中？的相关文章

IEnumerable 作为 DataTable 性能问题

我有以下扩展它生成一个DataTable从一个IEnumerable public static DataTable AsDataTable
Microsoft.Extensions.Caching.Redis 选择与 db0 不同的数据库

一个关于了解使用哪个redis数据库以及如何配置它的问题我有一个默认值ASP NET Core Web 应用程序和默认配置的本地redis服务器含15个数据库通过包管理控制台我已经安装了 Install Package Microso
Oracle 中的 SQL 调优 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何文章链接可以让我找到 SQL 调优 Oracle 的示例如果能用例子来解释那就太好了我需
有谁知道一种更快的方法来执行 String.Split() 吗？

我正在读取 CSV 文件的每一行并且需要获取每一列中的各个值所以现在我只是使用 values line Split delimiter where line是保存由分隔符分隔的值的字符串衡量我的表现ReadNextRow我注意到它花费
比较运算符性能 <= 与 !=

让我们首先声明代码可读性胜过微优化我们应该将其留给编译器这只是一个奇怪的案例具体细节似乎与一般建议相比很有趣因此我在搞素数生成器函数并提出了一种奇怪的行为其中人们建议效率最高实际上效率最低而 C private stat
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
隐藏类以及 {} 对象与自定义构造函数之间的等效性 (v8)

鉴于这篇文章 http richardartoul github io jekyll update 2015 04 26 hidden classes html http richardartoul github io jekyll upd
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如果没有过期的内容，Redis maxmemory-policy volatile-lru 是否会被驱逐？

我有一个 redis 服务器设置了maxmemory policy set to volatile lru 文档表明当达到内存限制时这将从设置过期的条目集中逐出在这种情况下 redis 是否只驱逐过期的项目如果内存中的所有内容都设
Google App Engine 如何预编译 Java？

App Engine 对应用程序的 Java 字节码使用预编译过程以增强应用程序在 Java 运行时环境中的性能预编译代码的功能与原始字节码相同有没有详细的信息这是做什么的我在一个中找到了这个谷歌群组消息 http groups
为什么 Python 中的无分支函数和内置函数速度较慢？

我发现了 2 个无分支函数它们可以在 python 中查找两个数字的最大值并将它们与 if 语句和内置 max 函数进行比较我认为无分支或内置函数将是最快的但最快的是 if 语句函数有人知道这是为什么吗以下是功能 If 语句 2
JSON.stringify 对于大型对象来说非常慢

我在 javascript 中有一个非常大的对象大约 10MB 当我对其进行字符串化时需要很长时间因此我将其发送到后端并将其解析为一个对象实际上是带有数组的嵌套对象这也需要很长时间但这不是我们在这个问题中的问题问题我怎样才能
python中的StringIO实际用途是什么？

StringIO到底是用来做什么的我一直在互联网上寻找一些例子然而几乎所有的例子都非常抽象他们只是展示如何使用它但它们都没有表明为什么和在什么情况下应该将使用它附注不要与 stackoverflow 上的这个问题混
Spring-boot中将redis-cache反序列化为对象的问题

我在 Client 类中使用 JsonNode 来处理 MySQL 8 数据库中 JSON 类型的字段即使对于 API 请求它也能很好地工作但是当我使用 Redis 启用缓存我确实需要它时我注意到 Redis 无法序列化 Jso
当跳转在 32 字节上不完全对齐时，使用 MITE（传统管道）代替 DSB（微指令缓存）

这个问题曾经是这个现已更新问题 https stackoverflow com questions 59883527 unrolling 1 cycle loop reduces performance by 25 on skylake
同一索引操作上的不同估计行？

简介和背景我必须优化一个简单的查询下面的示例重写几次后我认识到同一个索引操作的估计行数会根据查询的编写方式而有所不同最初该查询执行了聚集索引扫描因为生产中的表包含二进制列该表相当大大约 100 GB 并且全表扫描执行起来需
提高第一个查询的性能

如果执行以下数据库 postgres 查询则第二次调用要快得多我猜第一个查询很慢因为操作系统 linux 需要从磁盘获取数据第二个查询受益于文件系统级别和 postgres 中的缓存有没有一种方法可以优化数据库以快速获得结果fir
如何在 JMeter 中显示实际循环计数

我们可以通过以下方式显示实际线程 threadNum 实际循环计数有类似的东西吗您可以使用 jm Thread Group idx 获取当前循环迭代 jm Thread Group idx 请注意这是 JMeter 5 中一般增强功能的
如何以最低的价格优化购物车？

我有一个我想买的物品清单这些商品由不同的商店提供价格也不同商店有单独的送货费用我正在寻找一种最佳的购物策略以及支持它的java库以最低的总价购买所有商品 Example 商品 1 在 Shop1 的售价为 100 美元在 Sh
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht

随机推荐

Microsoft JScript 运行时错误：对象不支持属性或方法“验证”

这个问题是我收到错误 Microsoft JScript 运行时错误对象不支持属性或方法验证不明白为什么有什么建议么
如何获取原始订单中的字段？

我有一个类似的代码 class Ordered object x 0 z 0 b 0 a 0 print dir Ordered 它打印 a b x z 如何按原始顺序获取字段 x z b a 我在 Django 模型中看到了类似的行为如
Java：当一个新线程从同步块启动时会发生什么？

第一个问题这是 Java 中一个非常简短但基本的东西我不知道在下面的情况下是run 方法以某种方式使用锁执行somemethod 获得了吗 public synchronized void somemethod Thread t n
了解 csr 格式

我试图了解 scipy CSR 的工作原理 https docs scipy org doc scipy reference sparse html https docs scipy org doc scipy reference spar
通过Javascript跨域XHR上传[重复]

这个问题在这里已经有答案了可能的重复在 IE9 中解析 xml json 响应 https stackoverflow com questions 10866439 parsing xml json response in ie9 我想
现代 C 编译器中 __STDC_IEC_559__ 的状态

C99添加了一个宏 STDC IEC 559 可用于测试编译器和标准库是否符合 ISO IEC IEEE 60559 或 IEEE 754 标准根据这个问题的答案如何检查 ieee 754 单精度 32 位浮点表示 https stac
如何将包含 Integers 的 ArrayList 转换为原始 int 数组？

我正在尝试使用以下代码将包含 Integer 对象的 ArrayList 转换为原始 int 但它引发编译时错误可以用Java进行转换吗 List
如何在 Gatsby 中使用 React.lazy

当使用React lazy在 Gatsby 中你会在执行时出错production gatsby build 最好的使用方法是什么React lazy and suspense在盖茨比计划中 React lazy 和 Suspense 还
python 中是否有与 R 的 qchisq 函数等效的函数？

The R qchisq函数将 p 值和自由度数转换为相应的卡方值是否有一个具有同等功能的 Python 库我在 SciPy 中环顾四周没有发现任何东西 It s scipy stats chi2 ppf 百分点函数 cdf 的倒数
快速排序 (Java) 在 array.length > 60k 时导致 StackOverFlow

我的代码可以正常工作据我所知直到我的输入数组大小 a length 大约是 62 000 此时我始终得到StackOverFlowError 我之前使用过两次递归调用quicksort 小于和大于枢轴q 然后我切换到尾递归正如您所看到
Snackbar 滑动动画导致浮动操作按钮意外跳转

我的活动中有一个浮动操作按钮当小吃栏出现时它应该向上移动一点但是当我使用代码将小吃栏动画更改为滑动时 pressAgainToExitSnackBar setAnimationMode BaseTransientBottomBar A
当一个字段是日期字段时，如何在 MongoDB 中按多个字段进行分组

我对 MongoDB 还很陌生我正在尝试弄清楚当其中一个字段是计算日期字段时如何按多个字段进行分组我的数据如下简化 id ObjectId 52d6ed19e4b0a491abb53ff2 build duration 667075
无法捕获 Winforms 中未处理的异常

我正在尝试捕获 C Windows 窗体应用程序中的所有未处理异常我已将以下代码添加到Program cs文件但未捕获异常我得到异常例如NullReferenceException 我究竟做错了什么 static void Main
如何在 Windows 上为 javax.net.ssl.trustStore 配置 trustStore？

我正在尝试使用 imap 从 java 中的电子邮件服务器中提取消息但遇到了以下异常 DEBUG JavaMail version 1 4 2 DEBUG successfully loaded resource META INF jav
Ionic 2+ 中选项卡页面的 setRoot

我有两张地图每张地图都有自己的视图我正在使用选项卡从一个视图跳转到另一个视图但是当我使用这种导航方法时不会设置根目录并且页面在访问后不会被推送或弹出或设置这是我使用的谷歌地图的问题当我使用菜单区域中设置根目录的常规菜单时此
使用 Flask 和 Python 从配置文件中读取属性

建筑自在 Flask 中将配置文件作为字典读取 https stackoverflow com questions 50415433 reading config file as dictionary in flask我正在尝试定义自定义配
为什么需要对 μop 进行分层？

In Intel CPU 中的 MicroFusion 作者丹尼斯巴赫瓦洛夫 https easyperf net blog 2018 02 15 MicroFusion in Intel CPUs 他说 Unlamination fo
PowerShell 5.1 - 如何卸载当前使用的模块

我们在一个部署 PowerShell 脚本中使用一些 PowerShell 模块使用以下命令我们将模块即 XXXX 安装到 C Program Files WindowsPowerShell Modules 中 Install Mod
为什么 Espresso 的 registerIdlingResources 被弃用，以及什么取代了它？

我正在使用 Espresso for Android 进行 UI 测试并遵循 Google 的代码示例 https github com googlesamples android testing blob master ui espre
有多少数据加载到 L2 和 L3 缓存中？

如果我有这门课 class MyClass short a short b short c 我有这段代码对上面的内容执行计算 std vector

有多少数据加载到 L2 和 L3 缓存中？

有多少数据加载到 L2 和 L3 缓存中？ 的相关文章

随机推荐

热门标签

有多少数据加载到 L2 和 L3 缓存中？的相关文章