在固定不同 CPU 的 2 个线程之间传递一些变量的最佳方式

2023-11-30

我有一个问题需要了解是否有更好的解决方案。我编写了以下代码，将一些变量从编写器线程传递到读取器线程。这些线程固定到共享相同 L2 缓存的不同 CPU（禁用超线程）。

writer_thread.h

struct a_few_vars {
    uint32_t x1;
    uint32_t x2;

    uint64_t x3;
    uint64_t x4;
} __attribute__((aligned(64)));

volatile uint32_t head;
struct a_few_vars xxx[UINT16_MAX] __attribute__((aligned(64)));

reader_thread.h

uint32_t tail;
struct a_few_vars *p_xxx;

写入线程增加头变量，读取线程检查头变量和尾变量是否相等。如果它们不相等，则按如下方式读取新数据

while (true) {
    if (tail != head) {
        .. process xxx[head] ..
        .. update tail ..
    }
}

性能是迄今为止最重要的问题。我使用的是 Intel Xeon 处理器，读取器线程每次都会从内存中获取 head 值和 xxx[head] 数据。我使用对齐数组来实现无锁

就我而言，是否有任何方法可以尽快将变量刷新到读取器CPU缓存中。我可以从写入器 CPU 触发读取器 CPU 的预取吗？我可以使用 __asm__ 的特殊英特尔指令（如果存在）。总之，在固定到不同 CPU 的线程之间传递结构中的变量的最快方法是什么？

提前致谢

一个线程编写一个线程是未定义的行为volatile根据 C11，当另一个线程读取该变量时。volatile访问也不会相对于其他访问进行排序。你要atomic_store_explicit(&head, new_value, memory_order_release)在作家和atomic_load_explicit(&head, memory_order_acquire)在阅读器中创建 acq/rel 同步，并强制编译器在存储之前使存储到结构中可见head这向读者表明有新数据。

(tail对于读取器线程来说是私有的，因此写入器没有机制可以在写入更多数据之前等待读取器看到新数据。因此，从技术上讲，如果写入器线程在读取器仍在读取时再次写入，则结构内容可能会出现竞争。所以结构也应该是_Atomic).

您可能需要一个序列锁，其中写入者更新序列号，而读取者之前检查它and复制出变量后。 https://en.wikipedia.org/wiki/Seqlock这使您可以在读取器复制数据时写入器正在更新的极少数情况下进行检测并重试。

这对于只写/只读情况非常有用，特别是当您不需要担心读者错过更新时。

请参阅我在 C++11 中对 SeqLock 的尝试：使用 32 位原子实现 64 位原子计数器并且如何使用c++11原子库实现seqlock锁

And GCC 使用“memory_order_seq_cst”在负载上重新排序。这是允许的吗？显示另一个示例（此示例会导致 gcc 错误）。

将它们从 C++11 std::atomic 移植到C11 标准原子应该很简单。确保使用atomic_store_explicit，因为默认内存排序为普通atomic_store is memory_order_seq_cst哪个更慢。

实际上，您无能为力，无法加快作家使其商店在全球范围内可见的速度。 CPU 核心已经尽快将存储从其存储缓冲区提交到其 L1d（遵守 x86 内存模型的限制，该模型不允许 StoreStore 重新排序）。

在 Xeon 上，请参阅CPU何时将storebuffer中的值刷新到L1 Cache？有关不同侦听模式及其对单个套接字内核心间延迟的影响的一些信息。

多核上的缓存是一致的，使用MESI来保持一致性。

阅读器在原子变量上旋转等待可能是你能做的最好的事情，使用_mm_pause()在自旋循环内部，以避免退出自旋循环时清除内存顺序错误推测管道。

您也不希望在写入过程中醒来并重试。您可能希望将 seq-lock 计数器与数据放在同一缓存行中，因此这些存储有望合并到写入核心的存储缓冲区中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在固定不同 CPU 的 2 个线程之间传递一些变量的最佳方式的相关文章

在模板类中声明模板友元类时出现编译器错误

我一直在尝试实现我自己的链表类以用于教学目的我在迭代器声明中指定了 List 类作为友元但它似乎无法编译这些是我使用过的 3 个类的接口 Node h define null Node
调用 McAfee 病毒扫描引擎

我收到客户的请求要求使用他们服务器上的 McAfee 病毒扫描将病毒扫描集成到应用程序中我做了一些调查发现 McScan32 dll 是主要的扫描引擎它导出各种看起来有用的函数我还发现提到了 McAfee Scan Engine
在 xaml 中编写嵌套类型时出现设计时错误

我创建了一个用户控件它接受枚举类型并将该枚举的值分配给该用户控件中的 ComboBox 控件很简单我在数据模板中使用此用户控件当出现嵌套类型时问题就来了我使用这个符号来指定 EnumType x Type myNamespace
没有特殊字符的密码验证器

我是 RegEx 的新手已经进行了大量搜索但没有找到任何具体内容我正在编写一个验证密码字符串的正则表达式可接受的字符串必须至少具有 4 种字符类型中的 3 种数字小写字母大写字母特殊字符我对包含有一个想法也就是说如果这
如何在 Cassandra 中存储无符号整数？

我通过 Datastax 驱动程序在 Cassandra 中存储一些数据并且需要存储无符号 16 位和 32 位整数对于无符号 16 位整数我可以轻松地将它们存储为有符号 32 位整数并根据需要进行转换然而对于无符号 64 位整
C++11 删除重写方法

Preface 这是一个关于最佳实践的问题涉及 C 11 中引入的删除运算符的新含义当应用于覆盖继承父类的虚拟方法的子类时背景根据标准引用的第一个用例是明确禁止调用某些类型的函数否则转换将是隐式的例如最新版本第 8 4 3 节
std::vector 与 std::stack

有什么区别std vector and std stack 显然向量可以删除集合中的项目尽管比列表慢得多而堆栈被构建为仅后进先出的集合然而堆栈对于最终物品操作是否更快它是链表还是动态重新分配的数组我找不到关于堆栈的太多信息但
无限循环与无限递归。两者都是未定义的吗？

无副作用的无限循环是未定义的行为看here https coliru stacked crooked com view id 24e0a58778f67cd4举个例子参考参数 https en cppreference com w cpp
如何使从 C# 调用的 C（P/invoke）代码“线程安全”

我有一些简单的 C 代码它使用单个全局变量显然这不是线程安全的所以当我使用 P invoke 从 C 中的多个线程调用它时事情就搞砸了如何为每个线程单独导入此函数或使其线程安全我尝试声明变量 declspec thread 但
ASP.NET Core 3.1登录后如何获取用户信息

我试图在登录 ASP NET Core 3 1 后获取用户信息如姓名电子邮件 id 等信息这是我在登录操作中的代码 var claims new List
如何获取 EF 中与组合（键/值）列表匹配的记录？

我有一个数据库表其中包含每个用户年份组合的记录如何使用 EF 和用户 ID 年份组合列表从数据库获取数据组合示例 UserId Year 1 2015 1 2016 1 2018 12 2016 12 2019 3 2015 91
WcfSvcHost 的跨域异常

对于另一个跨域问题我深表歉意我一整天都在与这个问题作斗争现在已经到了沸腾的地步我有一个 Silverlight 应用程序项目 SLApp1 一个用于托管 Silverlight SLApp1 Web 的 Web 项目和 WCF 项目
结构体的内存大小不同？

为什么第一种情况不是12 测试环境最新版本的 gcc 和 clang 64 位 Linux struct desc int parts int nr sizeof desc Output 16 struct desc int parts
实例化类时重写虚拟方法

我有一个带有一些虚函数的类让我们假设这是其中之一 public class AClassWhatever protected virtual string DoAThingToAString string inputString retu
C 函数 time() 如何处理秒的小数部分？

The time 函数将返回自 1970 年以来的秒数我想知道它如何对返回的秒数进行舍入例如对于100 4s 它会返回100还是101 有明确的定义吗 ISO C标准没有说太多它只说time 回报该实现对当前日历时间的最佳近似结
在 WPF 中使用 ReactiveUI 提供长时间运行命令反馈的正确方法

我有一个 C WPF NET 4 5 应用程序用户将用它来打开某些文件然后应用程序将经历很多动作读取文件通过许多插件和解析器传递它这些文件可能相当大 gt 100MB 因此这可能需要一段时间我想让用户了解 UI 中发生的情况
C# 中的 IPC 机制 - 用法和最佳实践

不久前我在 Win32 代码中使用了 IPC 临界区事件和信号量 NET环境下场景如何是否有任何教程解释所有可用选项以及何时使用以及为什么微软最近在IPC方面的东西是Windows 通信基础 http en wikipedia org
为什么 std::uint32_t 与 uint32_t 不同？

我对 C 有点陌生我有一个编码作业很多文件已经完成但我注意到 VS2012 似乎有以下语句的问题 typedef std uint32 t identifier 不过似乎将其更改为 typedef uint32 t identifi
现代编译器是否优化乘以 1 和 -1

如果我写 template
使用 WGL 创建现代 OpenGL 上下文？

我正在尝试使用 Windows 函数创建 OpenGL 上下文现代版本基本上代码就是创建窗口类注册班级创建一个窗口 choose PIXELFORMATDESCRIPTOR并设置它创建旧版 OpenGL 上下文使上下文成为当前

随机推荐

使用 htaccess 进行移动重定向

我有一个网站叫 www website org 我有一个移动网站名为 m website org 我想使用 htaccess 自动将主网站 URL 重定向到移动版本但是移动版本上有一个链接指向主网站称为 www website or
数据框中行值的平均值，不包括 R 中的最小值和最大值

我得到以下数据框 df 此处显示的片段 H2475 H2481 H2669 H2843 H2872 H2873 H2881 H2909 E1 94 470 26 481 15 120 18 490 16 189 11 422 14 886
如何知道两个表情符号是否会显示为一个表情符号？

表情符号由2个unicodeScalars U 1F44D U 1F3FC组成如何将其识别为 1 个显示表情符号因为它将在 iOS 上如此显示 Swift 4 Xcode 9 更新从 Swift 4 开始表情符号序列被视为单
如何防止android应用程序中的choosePrivateKeyAlias对话框？

我有一个 Android 应用程序可以在网络视图中调用安全网站 webview 检索证书并将其提供给网站我必须使用KeyChain choosePrivateKeyAlias this keyChainAliasCallback nul
通过将指针传递给c中的函数来创建二维数组

因此我阅读了数十个将 2D 数组指针传递给函数以在函数中获取更改该数组的值的示例但是是否可以在函数内部创建分配内存像这样的事情 include
按日期排序 Angular 2 管道

这是我的代码 div class conv single conv date date dd MM yyyy j conv text div 我有这样的对象 date somedate text text1 这是我的 orderBy 管道
谷歌云消息，服务不可用

我正在创建一个应用程序并使用 GCM 来接收通知问题是当我调用函数 gcm register SENDER ID 时我收到服务不可用消息我查了很多资料很多人都面临这个问题我尝试了这个解决方案 Android 2 2 上的 GC
cordova/phonegap 插件添加 VS config.xml

我发现phonegap cordova 插件有些令人困惑例如我可以运行 cordova plugin add cordova plugin whitelist OR phonegap plugin add cordova plugin w
如何使用 iTextsharp 在服务器地图路径上保存 pdf

我正在使用以下代码生成 pdf 它工作完美 string strQuery select from userdata SqlCommand cmd new SqlCommand strQuery DataTable dt GetData c
对具有相同列的两个文件进行排序会产生不同的排序

我对这个标题感到抱歉但我不知道如何解释我试图对两个文件进行排序因为我想合并它们它们看起来像这样 test1 txt rs1010735 224915429 rs1010805 38189142 rs10108 114516330 r
如何在 HQL (hibernate sql) 中使用一个 like 运算符在多列中进行搜索

希望有人能帮我解决这个 HQL 查询我在用着 Query query session createQuery sql 其中sql是 select distinct c id from EstateConsumer as c where c
window.focus(), self.focus() 在 Firefox 中不起作用

大家好我正在开发一个聊天应用程序我有多个聊天窗口我想知道哪个窗口包含新消息我有以下代码 function getCount ajax type POST url baseUrl Chat count data chat id doc
在 R 中编写一个函数来分离工作值和错误值

我一直在使用来自 Heuristic Andrew 的这段很棒的代码blog 您可以在其中定位 IP 地址我希望能够在大型 24867 个 IP IP 地址向量上运行该函数问题是大多数 IP 地址都会返回以下错误 Error in fi
为什么 ‘title’ 属性会导致浏览器忽略我的样式？

以下 html 文档连同 CSS 无法渲染样式b css div A div div B div a css div A
使用maven2使用jdk1.5编译项目

我设法使用 maven2 创建我的项目结构但是当我使用 mvn install 编译我的项目时出现错误 source 1 3 不支持泛型谷歌搜索使用 jdk1 5 构建我的项目并添加构建标签
如何获取在 javascript 中发起请求的 ID 更新面板

我想知道在 JavaScript 中发起请求的 ID 更新面板我编写了这个脚本但它返回undefined var prm Sys WebForms PageRequestManager getInstance prm add initi
表示同一实体的名称

以下定义声明区域每个名称都在程序文本的某个部分中引入称为声明区域这是程序中最大的部分该名称是有效的也就是说该名称可以用作指代同一实体的非限定名称我们在下面的规范中有示例 int j 24 int main int i j
如何获取Windows上每个线程的CPU使用率（win32）

寻找 Win32 API 函数 C 或 Delphi 示例代码它们可以告诉我线程而不是进程的总时间的 CPU 使用率百分比和或总 CPU 时间我有线程 ID 我知道 Sysinternals Process Explorer 可
如何使用phpmyadmin将Excel文件导入mysql数据库

我想通过 phpmyadmin 导入选项从 Excel 工作表格式 xls 导入到 mysql 数据库据我所知我们需要先将格式转换为csv格式然后才能导入到phpmyadmin 但不幸的是如果我更改为 csv 某些特殊字符或符号将变
在固定不同 CPU 的 2 个线程之间传递一些变量的最佳方式

我有一个问题需要了解是否有更好的解决方案我编写了以下代码将一些变量从编写器线程传递到读取器线程这些线程固定到共享相同 L2 缓存的不同 CPU 禁用超线程 writer thread h struct a few vars uint3

在固定不同 CPU 的 2 个线程之间传递一些变量的最佳方式

在固定不同 CPU 的 2 个线程之间传递一些变量的最佳方式 的相关文章

随机推荐

热门标签

在固定不同 CPU 的 2 个线程之间传递一些变量的最佳方式的相关文章