为什么迭代二维数组行优先比列优先更快？

2023-12-29

下面是简单的 C++ 代码，用于比较迭代二维数组行主要与列主要。

#include <iostream>
#include <ctime>

using namespace std;

const int d = 10000;

int** A = new int* [d];

int main(int argc, const char * argv[]) {
    for(int i = 0; i < d; ++i)
        A[i] = new int [d];
    
    clock_t ColMajor = clock();
    
    for(int b = 0; b < d; ++b)
        for(int a = 0; a < d; ++a)
            A[a][b]++;
    
    double col = static_cast<double>(clock() - ColMajor) / CLOCKS_PER_SEC;
    
    clock_t RowMajor = clock();
    for(int a = 0; a < d; ++a)
        for(int b = 0; b < d; ++b)
            A[a][b]++;
    
    double row = static_cast<double>(clock() - RowMajor) / CLOCKS_PER_SEC;
    

    
    cout << "Row Major : " << row;
    cout << "\nColumn Major : " << col;

    return 0;
}

不同值的结果d:

d = 10^3 :

行专业：0.002431

列专业：0.017186

d = 10^4 :

行专业：0.237995

列专业：2.04471

d = 10^5

行专业：53.9561

栏目专业：444.339

现在的问题是为什么行专业比列专业更快？

这显然取决于您所使用的机器，但一般来说：

您的计算机将部分程序内存存储在缓存中，该缓存的延迟比主内存小得多（即使在补偿缓存命中时间时也是如此）。
C 数组按行主顺序连续存储。这意味着如果您要求元素x，然后元素x+1存储在主存储器中紧随其后的位置x被储存了。
计算机缓存通常会“抢先”使用尚未使用但本地接近程序已使用的内存的内存地址填充缓存。想象一下你的计算机在说：“好吧，你想要地址 X 处的内存，所以我假设你很快就会想要 X+1 处的内存，因此我会抢先为你获取该内存并将其放入你的缓存中” 。

当您通过行主序枚举数组时，您是以连续方式存储在内存中的方式枚举它，并且您的机器已经为您预先将这些地址加载到缓存中because它猜你想要它。因此，您可以获得更高的缓存命中率。当您以另一种非连续方式枚举数组时，您的机器可能无法预测您正在应用的内存访问模式，因此它无法为您预先将内存地址拉入缓存，并且您将无法不会产生那么多的缓存命中，因此必须更频繁地访问主内存，这比缓存慢。

另外，这可能更适合https://cs.stackexchange.com/ https://cs.stackexchange.com/因为系统缓存的行为方式是在硬件中实现的，空间局部性问题似乎更适合那里。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么迭代二维数组行优先比列优先更快？的相关文章

机器Epsilon精度差异

我正在尝试计算 C 中双精度数和浮点数的机器 epsilon 值作为学校作业的一部分我在 Windows 7 64 位中使用 Cygwin 代码如下 include
随着时间的推移，添加到 List 变得非常慢

我正在解析一个大约有 1000 行的 html 表我从一个字符串中添加 10 个字符串 td 每行到一个list td
如何在 C# 中打开 Internet Explorer 属性窗口

我正在开发一个 Windows 应用程序我必须向用户提供一种通过打开 IE 设置窗口来更改代理设置的方法 Google Chrome 使用相同的方法当您尝试更改 Chrome 中的代理设置时它将打开 Internet Explorer
为什么 GCC 不允许我创建“内联静态 std::stringstream”？

我将直接前往 MCVE include
C++ 多行字符串原始文字[重复]

这个问题在这里已经有答案了我们可以像这样定义一个多行字符串 const char text1 part 1 part 2 part 3 part 4 const char text2 part 1 part 2 part 3 part 4
访问外部窗口句柄

我当前正在处理的程序有问题这是由于 vista Windows 7 中增强的安全性引起的特别是 UIPI 它阻止完整性级别较低的窗口与较高完整性级别的窗口对话就我而言我想告诉具有高完整性级别的窗口进入我们的应用程序它在 XP 或
WPF 数据绑定到复合类模式？

我是第一次尝试 WPF 并且正在努力解决如何将控件绑定到使用其他对象的组合构建的类例如如果我有一个由两个单独的类组成的类 Comp 为了清楚起见请注意省略的各种元素 class One int first int second cla
在 Unity 中实现 Fur with Shells 技术

我正在尝试在 Unity 中实现皮毛贝壳技术 http developer download nvidia com SDK 10 5 direct3d Source Fur doc FurShellsAndFins pdf Fins 技术被
结构体的内存大小不同？

为什么第一种情况不是12 测试环境最新版本的 gcc 和 clang 64 位 Linux struct desc int parts int nr sizeof desc Output 16 struct desc int parts
如何定义一个可结构化绑定的对象的概念？

我想定义一个concept可以检测类型是否T can be 结构化绑定 or not template
x:将 ViewModel 方法绑定到 DataTemplate 内的事件

我基本上问同样的问题这个人 https stackoverflow com questions 10752448 binding to viewmodels property from a template 但在较新的背景下x Bind V
C# xml序列化必填字段

我需要将一些字段标记为需要写入 XML 文件但没有成功我有一个包含约 30 个属性的配置类这就是为什么我不能像这样封装所有属性 public string SomeProp get return someProp set if som
如何在当前 Visual Studio 主机内的 Visual Studio 扩展中调试使用 Roslyn 编译的代码？

我有一个 Visual Studio 扩展它使用 Roslyn 获取当前打开的解决方案中的项目编译它并从中运行方法程序员可以修改该项目我已从当前 VisualStudioWorkspace 成功编译了 Visual Studio 扩
C# 动态/expando 对象的深度/嵌套/递归合并

我需要在 C 中合并 2 个动态对象我在 stackexchange 上找到的所有内容仅涵盖非递归合并但我正在寻找能够进行递归或深度合并的东西非常类似于jQuery 的 extend obj1 obj2 http api jquer
如何在 Linq to SQL 中使用distinct 和 group by

我正在尝试将以下 sql 转换为 Linq 2 SQL select groupId count distinct userId from processroundissueinstance group by groupId 这是我的代码
编译时展开 for 循环内的模板参数？

维基百科 here http en wikipedia org wiki Template metaprogramming Compile time code optimization 给出了 for 循环的编译时展开我想知道我们是否可以
C++ 中的参考文献

我偶尔会在 StackOverflow 上看到代码询问一些涉及函数的重载歧义例如 void foo int param 我的问题是为什么会出现这种情况或者更确切地说你什么时候会有对参考的参考这与普通的旧参考有何不同我从未在现
DotNetZip：如何提取文件，但忽略zip文件中的路径？

尝试将文件提取到给定文件夹忽略 zip 文件中的路径但似乎没有办法考虑到其中实现的所有其他好东西这似乎是一个相当基本的要求我缺少什么代码是 using Ionic Zip ZipFile zf Ionic Zip ZipFile
Mono 应用程序在非阻塞套接字发送时冻结

我在 debian 9 上的 mono 下运行一个服务器应用程序大约有 1000 2000 个客户端连接并且应用程序经常冻结 CPU 使用率达到 100 我执行 kill QUIT pid 来获取线程堆栈转储但它总是卡在这个位置
如何确定 CultureInfo 实例是否支持拉丁字符

是否可以确定是否CultureInfo http msdn microsoft com en us library system globalization cultureinfo aspx我正在使用的实例是否基于拉丁字符集我相信你可以使

随机推荐

VHDL-读取HEX文件

In VHDL 从 HEX 文件初始化 std logic vector 数组 https stackoverflow com questions 20164216 vhdl init std logic vector array from
为什么我们不应该在java中使用受保护的静态

我正在经历这个问题Java中有没有办法覆盖类变量 https stackoverflow com questions 685300 is there a way to override class variables in java 首先c
ListView 项目上的删除按钮

我开始为 UWP 进行开发我正在尝试创建一个ListView填充有x bind 现在我想在所有单个项目上创建一个按钮来删除它们类似于 Windows 10 邮件我已经创建了
使用字符串值作为变量名[重复]

这个问题在这里已经有答案了是否可以使用 String 作为变量名就像这个例子一样 String musicPlaying music2 Music music1 new Music blaalla Music music2 new Mu
在 Firebase 中构建关系

我的 Firebase 中有两项 providers and services 我正在尝试找出使用 Firebase 推荐的扁平化架构方法构建和建立关系的最佳方法我的数据看起来像这样 services hip replacement ti
在java 8中是否可以做一个懒惰的groupby，返回一个流？

我有一些较大的文本文件我想通过对其行进行分组来处理它们我尝试使用新的流媒体功能例如 return FileUtils readLines parallelStream map collect groupingBy pair gt pa
如何使用 exoplayer 横向全屏播放视频

我正在使用 exoplayer 在我的 Android 应用程序中播放来自 url 的视频在纵向中一切都按预期工作在活动中使用视图页面片段和选项卡我的目标是当用户处于横向状态时全屏播放视频这意味着只有视频将以横向方式播放所有其
如何在解决方案中的所有项目之间共享 LocalDB 实例？

我有一个 VS 2012 解决方案设置如下 EF 模型项目 EF模型测试项目 ASP NET MVC 4 应用程序 WCF数据服务项目在开发过程中我想使用 LocalDB 作为 EF 的后备数据库 MVC 和 WCF 项目都使用 EF
将图像存储在 MySQL 数据库中

我想知道如何在 MySQL 数据库中存储图像和文件我想获得这样的图像和文件www example rsrc php example image jpg Facebook 上的示例 facebook example com rsrc php
在 DataGridViewComboboxColumn 上设置所选项目

我有一个带有 DataGridViewComboboxColumn 列的 datagridview 其中包含 3 个值小号中号大号我恢复了用户默认值在本例中为中我想在 datagridview 中显示一个下拉单元格但默认值为中
spring.jmx.enabled 的确切目的是什么？

对于 Spring Boot v2 4 2 在通过 JMX 进行监控和管理 https docs spring io spring boot docs current reference html production ready feat
在 PSQL 脚本中使用环境变量

是否可以在 sql 文件中使用 Linux 环境变量我正在使用复制选择查询写入输出文件并且我想将该目录放入变量中所以我想做一些类似的事情 COPY SELECT FROM a TO outputdir a csv Outputdir
为动态创建的组件分离 vuex 存储

这个问题让我有点卡住了不幸的是我在这里找不到答案问也没有帮助因此在做了一些研究并到处询问之后似乎我找到了这个问题的解决方案如果您有一个已经知道答案的问题并且您希望公开记录这些知识以便其他人包括你自己稍后可以找到它当
从字符串中提取版本号

我有一个包含组件和版本号的字符串 data c kuh small1 divider bin 1 4 4 divider conf 1 3 3 w 1 16 storage bin 1 5 4 storage conf 1 5 0 w 1
在 R 中，如何在对数据进行聚类后绘制相似度矩阵（如框图）？

我想生成一个图表显示聚类数据和相似度矩阵之间的相关性我怎样才能在 R 中做到这一点 R 中是否有任何函数可以创建像此链接中的图片一样的图形 http bp0 blogger com VCI4AaOLs A SG5H jm f8I AAA
列出 VBA 2003 中类的属性

我到处搜索看看这个问题是否有一个简单的答案但似乎没有我正在使用 Excel VBA 2003 是的我知道它已经过时但我无法更改它我想要做的就是列出给定自定义类中所有可读属性的名称和值我想做这样的事情类定义对于名为 cFoo
Nginx 尝试记录到 /var/logs 而不是 /var/log？

我注意到当我使用以下命令测试我的 nginx 配置时nginx t 它给了我一个警告 nginx alert could not open error log file open var logs nginx error log faile
主线程中的错误：MKNormalizedPointForLayer

我正在开发基于核心位置的iPhone应用程序出现一些奇怪的错误当我在后台状态发送应用程序并将其发送回前台时在主线程中出现名为错误MKNormalizedPointForLayer仅此而已我必须去哪里寻找解决方案谷歌在这方面做得很差
JavaFX WebView 未加载 HTTPS 页面

我使用 JavaFX WebView 控件编写了一个浏览器一切都很好直到我尝试加载加密页面我尝试https www gmail com https www gmail com我在加载工作线程的异常属性中收到未知错误仅当我将应用程序
为什么迭代二维数组行优先比列优先更快？

下面是简单的 C 代码用于比较迭代二维数组行主要与列主要 include

为什么迭代二维数组行优先比列优先更快？

为什么迭代二维数组行优先比列优先更快？ 的相关文章

随机推荐

热门标签

为什么迭代二维数组行优先比列优先更快？的相关文章