并行应用程序具有随机行为

2024-03-10

我正在编写一个 C 程序，使用 pthreads 在二维矩阵上进行波前模式计算。为了获得良好的性能，我以交错的方式将几行分配给每个线程，如下所示：

线程0 ------------------

线程 1 ------------------

线程 2 ------------------

线程 3 ------------------

线程0 ------------------

线程 1 ------------------

线程 2 ------------------

线程 3 ------------------

etc.

在这个计算中，我认为这是唯一可行的分割，因为每个线程都需要在每行上计算的新值，并且在它们可用之前无法进一步移动。现在，这里的问题是线程 1 需要线程 0 在其行上计算的值，因此它必须落后于线程 0，而不是领先于线程 0。为此，我将每一行分成块，并用关键部分保护每个块。计算过程如下：

线程0 ----------

线程1------

线程 2 ---

这样，第 i 行始终必须落后于第 i - 1 行。我希望您理解这个想法。我已经实现了这个想法，并且正在双四核系统的机器上对其进行测试。我正在经历奇怪的行为。结果计算正确，但运行时间在比顺序时间短 8 倍到比顺序时间长的范围内变化。实际上，12000 x 12000 矩阵的顺序时间为 16 秒，并行运行时间在 2 到 17 秒之间，并且在两次连续运行中通常有所不同。

我最初的想法是这个问题对局部性非常敏感，所以如果假设线程 0 和线程 1 调度在不同的物理处理器上，我当然可能会得到糟糕的性能。环顾 /proc/cpuinfo，我推断出核心的映射使得 0、2、4、6 位于处理器 0 上，而 1、3、5、7 位于处理器 1 上。然后，在创建线程时，我使用 pthread_setaffinity_np 设置正确核心上线程的亲和力。然而，一切都没有改变。我还尝试使用 pthread_attr_setaffinity_np 和 sched_setaffinity 但我得到相同的随机运行时间。

要么内核忽略了我的关联调用，要么这不是问题。我真的希望有人可以帮助我，因为我已经没有想法了。谢谢。

内核不会忽略您的亲和力调用，这不是问题所在。

看起来像是缓存未命中。如果您的线程没有通过相同的数据互连，您可以在行之间留出很大的内存间隙以避免这种情况。

尝试制作单行数据大小的块（64字节）尝试让线程 0 读取 64 个字节，只有在此之后线程 1 才会从同一位置读取数据 - 依此类推。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

并行应用程序具有随机行为的相关文章

GLKit的GLKMatrix“列专业”如何？

前提A 当谈论线性存储器中的列主矩阵时列被一个接一个地指定使得存储器中的前 4 个条目对应于矩阵中的第一列另一方面行主矩阵被理解为依次指定行以便内存中的前 4 个条目指定矩阵的第一行 A GLKMatrix4看起来像这样 u
为什么两个不同的 Base64 字符串的转换会返回相等的字节数组？

我想知道为什么从 base64 字符串转换会为不同的字符串返回相同的字节数组 const string s1 dg const string s2 dq byte a1 Convert FromBase64String s1 byte a2
秒表有最长运行时间吗？

多久可以Stopwatch在 NET 中运行如果达到该限制它会回绕到负数还是从 0 重新开始 Stopwatch Elapsed返回一个TimeSpan From MSDN https learn microsoft com en us
不支持将数据直接绑定到存储查询（DbSet、DbQuery、DbSqlQuery）

正在编码视觉工作室2012并使用实体模型作为我的数据层但是当页面尝试加载时上面提到的标题我使用 Linq 语句的下拉控件往往会引发未处理的异常下面是我的代码 using AdventureWorksEntities dw new
从Web API同步调用外部api

我需要从我的 Web API 2 控制器调用外部 api 类似于此处的要求使用 HttpClient 从 Web API 操作调用外部 HTTP 服务 https stackoverflow com questions 13222998
如何使用 ICU 解析汉字数字字符？

我正在编写一个使用 ICU 来解析由汉字数字字符组成的 Unicode 字符串的函数并希望返回该字符串的整数值五 gt 5 三十一 gt 31 五千九百七十二 gt 5972 我将区域设置设置为 Locale getJapan 并使用
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
OleDbDataAdapter 未填充所有行

嘿我正在使用 DataAdapter 读取 Excel 文件并用该数据填充数据表这是我的查询和连接字符串 private string Query SELECT FROM Sheet1 private string ConnectStr
不同枚举类型的范围和可转换性

在什么条件下可以从一种枚举类型转换为另一种枚举类型让我们考虑以下代码 include
带动态元素的 WPF 启动屏幕。如何？

我是 WPF 新手我需要一些帮助我有一个加载缓慢的 WPF 应用程序因此我显示启动屏幕作为权宜之计但是我希望能够在每次运行时更改屏幕并在文本区域中显示不同的引言这是一个生产力应用程序所以我将使用非愚蠢但激励性的引言当然如
创建链表而不将节点声明为指针

我已经在谷歌和一些教科书上搜索了很长一段时间我似乎无法理解为什么在构建链表时节点需要是指针例如如果我有一个节点定义为 typedef struct Node int value struct Node next Node 为什么为了
使用 Bearer Token 访问 IdentityServer4 上受保护的 API

我试图寻找此问题的解决方案但尚未找到正确的搜索文本我的问题是如何配置我的 IdentityServer 以便它也可以接受授权带有 BearerTokens 的 Api 请求我已经配置并运行了 IdentityServer4 我还在
无锁算法真的比全锁算法性能更好吗？

陈雷蒙德 http blogs msdn com b oldnewthing 一直在做一个huge http blogs msdn com b oldnewthing archive 2011 04 15 10154245 aspx ser
如何查看网络连接状态是否发生变化？

我正在编写一个应用程序用于检查计算机是否连接到某个特定网络并为我们的用户带来一些魔力该应用程序将在后台运行并执行检查是否用户请求托盘中的菜单我还希望应用程序能够自动检查用户是否从有线更改为无线或者断开连接并连接到新网络并执行魔
这些作业之间是否存在顺序点？

以下代码中的两个赋值之间是否存在序列点 f f x 1 1 x 2 不没有在这种情况下标准确实是含糊不清的如果你想确认这一点 gcc 有这个非常酷的选项 Wsequence point在这种情况下它会警告您该操作可能未定义
为什么编译时浮点计算可能不会得到与运行时计算相同的结果？

In the speaker mentioned Compile time floating point calculations might not have the same results as runtime calculation
如何将带有 IP 地址的连接字符串放入 web.config 文件中？

我们当前在 web config 文件中使用以下连接字符串 add name DBConnectionString connectionString Data Source ourServer Initial Catalog ourDB P
测试用例执行完成后，无论是否通过，如何将测试用例结果保存在变量中？

我正在使用 NUNIT 在 Visual Studio 中使用 Selenium WebDriver 测试用例的代码是我想在执行测试用例后立即在变量中记录测试用例通过或失败的情况我怎样才能实现这一点 NUnit 假设您使用 NUnit
如何在文本框中插入图像

有没有办法在文本框中插入图像我正在开发一个聊天应用程序我想用图标图像更改值等但我找不到如何在文本框中插入图像 Thanks 如果您使用 RichTextBox 进行聊天请查看Paste http msdn microsoft co
对来自流读取器的过滤数据执行小计

编辑问题未得到解答我有一个基于 1 个标准的过滤输出前 3 个数字是 110 210 或 310 给出 3 个不同的组从流阅读器控制台问题已编辑因为第一个答案是我给出的具体示例的字面解决方案我使用的实际字符串长度为 450 个

随机推荐

在 Scala 中 - 将案例类列表转换为元组列表

我有一堂案例课 case class table a String b Option String 我有一个这种类型的列表我们称之为 list1 val list1 List table tabele get just filling t
Python导入：更改“子”中的变量会更改“父”/其他子中的变量吗？

假设您有 3 个模块 a py b py 和 c py a py v1 1 v2 2 etc b py from a import c py from a import v1 0 c py会改变a py和b py中的v1吗如果没有有办法
wget 中的 HTTP 500 错误

看看这个页面 http www ptmytrade com product asp id 61363 http www ptmytrade com product asp id 61363 它加载良好至少在这里现在我想用 wget 来抓
返回数字的最后 5 位

如何只显示号码的最后5位输入示例 123456789 将返回 56789 假设需要转换的数字是整数然后您可以使用模块化数学您可以将数字转换为以 100 000 为基数的模块这意味着仅保留最后 5 位数字转换可以通过除法余数的运算符
如何禁用和启用表 mysql 中的所有约束（包括）。 PK FK CHK UNI 等

我需要将测试数据加载到表中我想禁用每个可能的约束我已经找到了如何全局关闭外键但我需要禁用所有约束 PK FK CHK UNIQ 等是否可以在全球范围内进行当然在那之后我必须打开所有限制使用以下命令禁用约束 disable UN
从输出流获取输入流

我有一个组件在输出流中为我提供数据 ByteArrayOutputStream 并且我需要将其写入 SQL 数据库的 blob 字段而不创建临时缓冲区因此需要获取输入流根据答案here https stackoverflow com q
为什么我的 php 代码返回 inf？

我有一个数学问题我试图计算一组值的总组合当我尝试运行我的计算时它只返回 INF 而不是数字 tally 1 foreach output as key gt er tally tally ord strtolower er 96 ec
按时间间隔访问和设置 iPhone 的闹钟/用户警报

有什么方法可以访问或设置 iPhone 的闹钟吗我假设如果这不可用唯一的其他方法是推送通知以定期提醒用户有任何想法吗没有用于访问日历或闹钟的公共 API
退出前是否需要关闭文件描述符？

当然大多数情况下的直接答案是 yes 而且我坚信进程应该正确地清理它分配的任何资源但我的情况是一个长期运行的系统守护进程它在启动时打开固定数量的文件描述符并在启动之前关闭它们退出这是一个嵌入式平台我试图使代码尽可能紧凑同时不
在 VBA 中逐行读取/解析文本文件

我正在尝试使用 VBA 解析文本文档并返回文本文件中给出的路径例如文本文件如下所示 Blah blah instructions Blah blah instructions on line 2 G Folder data xls D
Spring - 从查询中获取结果集

我想用Spring JDBCTemplate但我想收到ResultSet 它不会将完整的查询结果存储在内存中就像您会发现使用 java 执行标准语句一样JDBC 我发现的最接近的ResultSet was SqlRowSet sqlRow
使用 SimpleDateFormat 时出错

我正在尝试使用 SimpleDateFormat 类从该字符串中解析 DateTime 2012 年 7 月 5 日 11 38 02 442 世界标准时间 UTC 上午我尝试了以下格式字符串 SimpleDateFormat datef
数据库设计（库存数据库）

我正在寻求设计一个跟踪小吃店的库存数据库由于这将是单人计算机访问并且需要轻松移动到另一个系统因此我计划使用 SQLite 作为数据库引擎基本概念是跟踪从 Sams Club 等批发仓库购买的库存然后跟踪库存我试图克服的主要障碍
在 WooCommerce 3 中获取订单运送商品详细信息

我怎样才能得到订单运输方式 ID 例如 flate rate 自 WooCommerce 3 以来一切都发生了变化现在变得很复杂我已经尝试过 order gt get data 在 foreach 循环中但数据受到保护如果您想获取
R 将整个文件夹移动到另一个目录

我想将整个文件夹从一个目录移动到另一个目录这是我的代码 folder old path C Users abc Downloads managerA path new C User abc Desktop managerA current
一张数据库表可以包含多个主键吗？

一张数据库表可以包含多个主键吗是的我说的是 RDBMS 一张表可以有没有主键一个主键由一列组成或者一个复合主键由两列或多列组成除此之外您可以拥有任意数量的唯一索引这基本上可以完成相同的操作
具有混合数据类型的 TensorFlow 数据集生成器

我正在使用 TensorFlow 数据集 API https www tensorflow org guide datasets https www tensorflow org guide datasets 特别是我将它与 Tensor
在 Rails 中创建所见即所得表单生成器 (á la Wufoo)

我必须向 Rails Web 应用程序添加类似 Wufoo 的 WYSIWYG 表单构建器功能有谁知道有帮助的好资源宝石引擎插件示例代码这并不是您问题的真正答案但不幸的是由于我的声誉水平我仍然无法添加评论抱歉 Drupa
静态方法与否？

我需要使用 PHP 开发一个小型 CMS 现在我正在尝试弄清楚其结构 CMS 将使用一组函数生成诸如数据库功能缓存国际化之类的东西我想这样做使函数成为大站点类的非静态方法的一部分这样我就可以运行该类的多个实例但不确定我是否
并行应用程序具有随机行为

我正在编写一个 C 程序使用 pthreads 在二维矩阵上进行波前模式计算为了获得良好的性能我以交错的方式将几行分配给每个线程如下所示线程0 线程 1 线程 2 线程 3 线程0 线程 1 线程 2 线程 3 etc 在这个计算

并行应用程序具有随机行为

并行应用程序具有随机行为 的相关文章

随机推荐

热门标签

并行应用程序具有随机行为的相关文章