64 位整数的 cmpxchg 示例

2023-12-07

我在 i686 架构中使用 cmpxchg（比较和交换）进行 32 位比较和交换，如下所示。

（编者注：原来的 32 位示例有错误，但问题不在于它。我相信这个版本是安全的，而且作为奖励，它也可以正确编译 x86-64。另请注意，为此不需要或不建议使用内联汇编；__atomic_compare_exchange_n或年龄较大的__sync_bool_compare_and_swap为。。。工作int32_t or int64_t在 i486 和 x86-64 上。但这个问题是关于使用内联汇编来做的，以防万一你仍然想要这样做。）

// note that this function doesn't return the updated oldVal
static int CAS(int *ptr, int oldVal, int newVal)
{
    unsigned char ret;
    __asm__ __volatile__ (
            "  lock\n"
            "  cmpxchgl %[newval], %[mem]\n"
            "  sete %0\n"
            : "=q" (ret), [mem] "+m" (*ptr), "+a" (oldVal)
            : [newval]"r" (newVal)
            : "memory");    // barrier for compiler reordering around this

    return ret;   // ZF result, 1 on success else 0
}

对于 64 位比较和交换，x86_64 架构的等效项是什么

static int CAS(long *ptr, long oldVal, long newVal)
{
    unsigned char ret;
    // ?
    return ret;
}

The x86_64指令集有cmpxchgq (q对于四字）用于 8 字节（64 位）比较和交换的指令。

还有一个cmpxchg8b该指令适用于 8 字节数量，但设置起来更复杂，需要您使用edx:eax and ecx:ebx而不是更自然的 64 位rax。几乎可以肯定，这种情况存在的原因与 Intel 很早之前就需要 64 位比较和交换操作有关x86_64伴随着。它仍然以 64 位模式存在，但不再是唯一的选择。

但是，正如所说，cmpxchgq对于 64 位代码来说可能是更好的选择。

如果您需要 cmpxchg 一个 16 字节对象，则使用 64 位版本cmpxchg8b is cmpxchg16b。最早的 AMD64 CPU 中缺少它，因此编译器不会为它生成它std::atomic::compare_exchange在 16B 对象上，除非您启用-mcx16（对于海湾合作委员会）。不过，汇编程序会对其进行汇编，但请注意，您的二进制文件无法在最早的 K8 CPU 上运行。（这仅适用于cmpxchg16b，不cmpxchg8b在 64 位模式下，或cmpxchgq).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

gcc

Assembly

x8664

inlineassembly

64 位整数的 cmpxchg 示例的相关文章

段错误...关于你好世界

这段代码非常简单但我在 x86 64 Linux 系统上遇到了段错误这让我很烦恼刚开始接触asm 请耐心等待与 NASM 组装nasm f elf64 test asm 与连接ld o test test o SECTION tex
从内存加载动态库

是否可以从内存而不是从 mac gcc 上的文件系统加载库在 Windows 中我使用 MemoryModule 但它显然不跨平台兼容首先要做到这一点我建议您阅读OS X ABI 动态加载器参考 https developer a
./configure 使用指定版本的 g++

如何告诉配置文件使用指定版本的 g 进行编译 Thanks 在 bash shell 中您可以执行以下操作 configure CC gcc 2 95 其他 shell 也会有类似的技术但我无法帮助您了解具体细节如果您的项目是 C
为什么 x86-64 上的 GCC 在函数内插入 NOP？

给定以下 C 函数 void go char data char name 64 strcpy name data x86 64 上的 GCC 5 和 6 编译普通gcc c g o其次是objdump 这到 00000000000000
GCC：分段错误和调试程序仅在优化时崩溃

这是线程的后续内容 C 分段错误也许 GDB 在骗我 https stackoverflow com questions 22828609 c segmentation fault and maybe gdb is lying to me
在 x86 汇编语言中获取文件大小的简单方法

假设我已经在汇编中打开了一个文件并且在寄存器 eax 中有该文件的文件句柄我将如何获取文件的大小以便为其分配足够的缓冲区空间我在这里研究了另一个讨论建议使用sys fstat 28 系统调用来获取文件统计信息但无法实现它 My a
列出目标文件中未定义的引用

所以我正在用 g 构建一堆模块我使用 c 命中一些源文件来生成 o 目标文件然后我有时会使用 ld 的 r 标志组合目标文件以生成更多 o 文件在此过程中的某个地方某个功能没有被包含在内所以我想做的是找到一个快速工具它可以查
与 glib-2.0 链接时，cygwin gcc 4.3 中的参数顺序很重要

我正在尝试使用 cygwin 编译适用于 os x 和 linux 的代码然而我发现 gcc 的参数顺序给出了意想不到的结果例如以下情况会失败 gcc std gnu99 I usr include glib 2 0 I usr l
CMakeLists.txt:30（项目）处的 CMake 错误：找不到 CMAKE_C_COMPILER

我正在尝试使用 CMake 制作 Visual Studio 解决方案来编译最新版本的 aseprite 并且 CMake 不断向我提供 No CMAKE C COMPILER could be found No CMAKE CXX COM
从 64 位 nasm 代码接收 32 位寄存器

我正在学习 64 位 nasm 我通过执行以下操作来汇编 nasm 文件该文件仅包含 64 位寄存器 nasm f elf64 HelloWorld nasm o HelloWorld o 并链接它执行以下操作 ld HelloWorld
将 1 字节立即值添加到 2 字节内存位置

The add说明文档来自这一页 http x86 renejeschke de html file module x86 id 5 html说如下请注意我突出显示的两条说明我在 NASM 中尝试了以下代码符合第一个突出显示的指令
如何创建可获取数字的小矮人计算机 (LMC) 代码。奇数时显示1，偶数时显示0

我的研究需要帮助如果数字是偶数它可以显示 1 如果数字是奇数它可以显示 0 例如如果输入是 99 它将显示输出 1 这意味着奇数如果我显示 10 它将显示输出 0 这意味着偶数我没有任何代码因为我不知道如何开始请帮忙我对这
如何正确初始化“min”变量？

我的代码中有一个小问题用于从一系列数字中查找最小值当我初始化时min 0 最小值结果为0 但是当我不初始化时min 答案是正确的为什么会出现这种情况 Xcode 告诉我应该初始化min多变的 int a 20 0 int max 0
在 CMake 中使用 -isystem 而不是 -I

在使用 gcc 构建时 CMake 是否有任何方法可以强制通过 include directories 或者可能通过不同的函数指定的路径使用 isystem 标志而不是 I 标志 See http gcc gnu org onlinedo
如何从内存加载值而不污染缓存？

我想读取内存位置而不污染缓存我正在 X86 Linux 机器上工作我尝试使用 MOVNTDQA 汇编指令 asm movntdqa source dest n t dest x my var source m my mem 0 memo
如何在 Bazel 中禁用 C/C++ `-Werror` 构建错误？（又名：如何关闭已由“-Wall -Werror”打开的特定警告）

我在构建时遇到以下错误 has undefined behavior Werror Wundefined reinterpret cast Bazel 构建从此完全停止clang llvm编译器 Wundefined reinterpret
汇编PC相对寻址模式

我正在研究数据路径并一直在尝试理解分支指令这就是我的理解在 MIPS 中每条指令都是 32 位这是 4 个字节所以下一条指令将是四个字节之外举个例子我说PC地址是128 我的第一个问题是理解这个128意味着什么我目前的信念
无法理解寄存器和变量之间的汇编mov指令

我在 64 位 Linux 上使用 NASM 汇编器有一些关于变量和寄存器的东西我无法理解我创建一个名为 msg 的变量 msg db hello world 现在当我想写入标准输出时我移动msg to rsi注册但我不明白mov
x86-64 AMD 上 CALL 指令的操作数生成

以下是示例程序 objdump 的输出 080483b4
3 操作数 imul 指令在 ia-32 汇编中到底起什么作用？

我正在阅读说明 imul 0xffffffd4 ebp ebx 4 eax 我对它到底在做什么感到困惑我明白那个imul乘法但我无法弄清楚语法我知道并且更喜欢 Intel MASM 语法所以我将使用它请注意操作数的顺序在 AT

随机推荐

Dynamic_cast(pb) 返回 null

在C Primer 5th 19 2 1中关于dynamic cast 它说对于dynamic cast
URI:Module 的未定义方法“escape”

我是一个研究 Ruby on Rails 的菜鸟我正在尝试将 ruby on Rails 应用程序集成到 Quickbooks 中我正在按照以下步骤这个视频当我尝试按连接到 QuickBooks 按钮进行身份验证时我陷入了困境我
消除字符向量中非唯一元素的歧义

给定一个由非唯一的患者姓名首字母组成的向量 init c AA AB AB AB AC 寻找消歧义如下 init1 c AA AB01 AB02 AB03 AC 即唯一的首字母应保持不变非唯一的首字母应通过添加两位数来消除歧义使用指示
从 boost::labeled_graph 获取节点标签

我想检索 BGL 的labeled graph 中标记节点的标签但找不到执行此操作的方法以下 MWE 演示了我正在寻找的内容 g O3 question cpp o question exe I std c 11 lprotobuf l
VS2010 添加服务引用相对于直接 ClientBase<> 的优点

我注意到当在 VS2010 中使用添加服务引用时会创建大量文件其中一个文件是 Reference cs 它为服务合同创建一个 ClientBase 因此我想知道 VS 创建的大量额外文件是否有任何优势或者我可以自己使用 Cli
JavaScript 中的随机化 for 循环

我有一个生成 html 的 for 循环我希望这种方法随机生成元素现在它们基本上是生成的即 d1 d2 di 我希望它们遵循随机序列即 d1 di di 3 di k for let i numberOfInputs i lt dl
单例还是静态记录器？

我当前的 C 应用程序是一个可执行文件 EXE 和一些 DLL 因此多个二进制文件我想创建一个记录器一些简单的自定义记录器无论从何处调用它都会写入单个文本文件这应该在所有二进制文件 exe 和 dll 中可用请注意它是单线程应
优化“for”循环

std vector
添加进度条

我有一个使用一个类的 Windows 窗体应用程序其名称是Parser 该表单有一个按钮当我单击 Windows 表单应用程序按钮时它会调用解析器类方法之一此方法只需逐行读取文本文件并将每一行写入单独的文件我想在表单中添加一个进度
与 Paramiko 的嵌套 SSH 会话

我正在将我编写的 Bash 脚本重写为 Python 该脚本的关键是 ssh t first com ssh second com very remote command 我在使用 paramiko 进行嵌套身份验证时遇到问题我找不到任何
PHP PDO 初始化由于“双端口”而失败 - 未捕获的 PDOException：SQLSTATE[HY000] [2002]

我收到这个错误 PHP 致命错误未捕获 PDOException SQLSTATE HY000 2002 无法解析 myPath xxDb php 32 中的地址 localhost 3306 3306 注意地址中的双端口本地主机
如何在 firebase 存储上下载图像？

我想下载图像firebase存储在Android应用程序中这是我的形象我尝试了这个但它不起作用 storageRef child 1 1 jpg getDownloadUrl getResult Try this Create a s
不同数据集上相同值的一致因子水平

我不确定我是否完全理解因素是如何运作的因此如果我错了请以易于理解的方式纠正我我总是假设在进行回归时 R 在幕后将分类变量转换为整数但这部分超出了我的思路它将使用训练集中的分类值并在构建模型后检查测试数据集中是否有相同的分类
Tensorflow错误无法创建目录

我正在创建一个深度学习程序并尝试训练数据我已经开始使用张量板但遇到了与创建的文件相关的错误说程序无法创建目录并且没有这样的文件或目录我按照senddex教程进行Python深度学习第4部分但仍然有错误 import tensor
Python打开浏览器并运行javascript函数

我有一个关于 python 和 javascript 的问题我喜欢创建一个与 javascript 网页通信的文件首先我将创建一个 Python 文件该文件将打开本地网页此示例 localhost test html 此页面是模板
如何在 C# 中的单个 SQL 查询中更新水果列表的板条箱 ID

关于我的问题如何更新 SQL 表逻辑我想要一个可以执行类似操作的查询我的最后一个问题很令人困惑因此我问一个不同的问题如何在 C 中的单个 SQL 查询中更新水果列表的板条箱 ID FruitS 和 CrateID 是外键并且始终
如何将两个嵌套字典合并到同一字典下

例如我有一本字典 dictA nest1 01feb 1 2 3 4 5 02feb 1 7 8 9 10 nest2 01feb 1 2 3 4 5 02feb 6 4 8 10 10 里面的列表具有相同的长度我需要合并nest1 an
关于 Html 我在不同的登录屏幕中看到了不同的密码屏蔽字符而不是大黑点如何更改密码字段中的密码掩码字符我找不到执行此操作的选项请帮忙没有 HTML 属性可以对密码字段掩码字符进行样式化您需要结合使用 HTML CSS 和 JavaScrip

如何按一定比例随机选择

我想以不等的概率在两个选项之间随机选择例如当用户按下按钮时 25 的时间会发出声音 A 75 的时间会发出声音 B 我可以手动执行简单的比例例如 1 4 和 2 4 但我遇到了麻烦比例如 3 5 思考这个问题的一般方法是什么我的意思

64 位整数的 cmpxchg 示例

我在 i686 架构中使用 cmpxchg 比较和交换进行 32 位比较和交换如下所示编者注原来的 32 位示例有错误但问题不在于它我相信这个版本是安全的而且作为奖励它也可以正确编译 x86 64 另请注意为此不需要或不建

64 位整数的 cmpxchg 示例

64 位整数的 cmpxchg 示例 的相关文章

随机推荐

热门标签

64 位整数的 cmpxchg 示例的相关文章