如何指示可以使用内联 ASM 参数指向的内存？

2024-01-17

考虑以下小函数：

void foo(int* iptr) {
    iptr[10] = 1;
    __asm__ volatile ("nop"::"r"(iptr):);
    iptr[10] = 2;
}

使用海湾合作委员会，这编译为 https://godbolt.org/z/A3yVqA:

foo:
        nop
        mov     DWORD PTR [rdi+40], 2
        ret

特别注意，首先写入iptr, iptr[10] = 1根本不会发生：内联汇编nop是函数中的第一件事，并且只是最后的写入2出现（在 ASM 调用之后）。显然编译器决定它只需要提供值的最新版本iptr itself，但不是它指向的内存。

我可以告诉编译器内存必须是最新的memory破坏，像这样：

void foo(int* iptr) {
    iptr[10] = 1;
    __asm__ volatile ("nop"::"r"(iptr):"memory");
    iptr[10] = 2;
}

这会产生预期的代码：

foo:
        mov     DWORD PTR [rdi+40], 1
        nop
        mov     DWORD PTR [rdi+40], 2
        ret

然而，这是太强条件，因为它告诉编译器all内存必须被写入。例如，在以下函数中：

void foo2(int* iptr, long* lptr) {
    iptr[10] = 1;
    lptr[20] = 100;
    __asm__ volatile ("nop"::"r"(iptr):);
    iptr[10] = 2;
    lptr[20] = 200;
}

期望的行为是让编译器优化掉第一次写入lptr[20]，但不是第一次写入iptr[10]. The "memory"clobber 无法实现此目的，因为这意味着必须同时进行两次写入：

foo2:
        mov     DWORD PTR [rdi+40], 1
        mov     QWORD PTR [rsi+160], 100 ; lptr[10] written unecessarily
        nop
        mov     DWORD PTR [rdi+40], 2
        mov     QWORD PTR [rsi+160], 200
        ret

有没有某种方法可以告诉接受 gcc 扩展 asm 语法的编译器，asm 的输入包括指针及其可以指向的任何内容？

这是正确的；要求一个指针作为内联汇编的输入not暗示所指向的内存也是输入或输出或两者。对于寄存器输入和寄存器输出，对于所有 gcc 知道的 asm，只需通过屏蔽低位来对齐指针，或者向其添加一个常量。（在这种情况下你会want它可以优化死店。）

The simple option is asm volatile and a "memory" clobber¹.

您要求的更窄更具体的方式是使用“虚拟”内存操作数也寄存器中的指针。您的 asm 模板没有引用此操作数（除非在 asm 注释中查看编译器选择的内容）。它告诉编译器你使用的是哪个内存actually读、写或读+写。

虚拟内存输入："m" (*(const int (*)[]) iptr)
或输出："=m" (*(int (*)[]) iptr)。或者当然"+m"使用相同的语法。

该语法正在转换为数组指针并取消引用，因此实际输入是 Carray。（如果您实际上有一个数组，而不是指针，则不需要任何转换，只需将其作为内存操作数即可。）

如果您未指定尺寸[]，它告诉 GCC 相对于该指针访问的任何内存都是输入、输出或输入/输出操作数。如果你使用[10] or [some_variable]，告诉编译器具体的大小。对于运行时变量大小，gcc 实际上会错过以下优化：iptr[size+1] is not输入的一部分。

GCC 记录了这一点 https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html#Clobbers-and-Scratch-Registers-1因此支持它。我认为如果数组元素类型与指针相同，或者如果它是，则这不是严格别名违规char.

（来自海湾合作委员会手册）
一个 x86 示例，其中字符串内存参数的长度未知。
   asm("repne scasb"
    : "=c" (count), "+D" (p)
    : "m" (*(const char (*)[]) p), "0" (-1), "a" (0));

如果可以避免在指针输入操作数上使用早期破坏，则虚拟内存输入操作数通常会使用同一寄存器选择简单的寻址模式。

但是，如果您确实使用 Early-clobber 来保证 asm 循环的严格正确性，有时虚拟操作数会使 gcc 在内存操作数的基地址上浪费指令（以及额外的寄存器）。检查汇编output编译器的。

背景：

这是内联 asm 示例中的一个普遍错误，通常未被检测到，因为 asm 包装在一个函数中，该函数不会内联到任何调用者中，从而诱使编译器重新排序存储以进行合并，从而消除死存储。

GNU C 内联 asm 语法是围绕描述single给编译器的指令。目的是告诉编译器有关内存输入或内存输出的信息"m" or "=m"操作数约束，它选择寻址模式。

在内联汇编中编写整个循环需要小心确保编译器真正知道发生了什么（或者asm volatile plus a "memory"clobber），否则在更改周围代码或启用允许跨文件内联的链接时优化时，您将面临损坏的风险。

也可以看看使用内联汇编循环数组 https://stackoverflow.com/questions/34244185/looping-over-arrays-with-inline-assembly用于使用asm语句作为循环body，仍然在 C 中执行循环逻辑。使用实际（非虚拟）"m" and "=m"操作数，编译器可以通过使用它选择的寻址模式中的位移来展开循环。

脚注 1：A"memory"clobber 让编译器将 asm 视为非内联函数调用（可以读取或写入除本地内存之外的任何内存）逃逸分析 https://en.wikipedia.org/wiki/Escape_analysis已证明没有逃脱）。转义分析包括 asm 语句本身的输入操作数，还包括任何早期调用可能存储指针的任何全局或静态变量。因此，通常本地循环计数器不必在循环周围溢出/重新加载asm声明与"memory"破坏。

asm volatile有必要确保 asm 不会被优化，即使其输出操作数未使用（因为您需要发生未声明的写入内存的副作用）。

或者对于仅由asm读取的内存，如果相同的输入缓冲区包含不同的输入数据，则需要asm再次运行。没有volatile，asm语句可以是CSEd https://en.wikipedia.org/wiki/Common_subexpression_elimination脱离循环。（A"memory"破坏者确实not使优化器在考虑是否将所有内存视为输入asm语句甚至需要运行。）

asm没有输出操作数是隐式的volatile，但最好将其明确化。（GCC 手册有一节介绍asm 易失性 https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html#Volatile).

e.g. asm("... sum an array ..." : "=r"(sum) : "r"(pointer), "r"(end_pointer) : "memory")有一个输出操作数，因此不是隐式易失性的。如果你像这样使用它

 arr[5] = 1;
 total += asm_sum(arr, len);
 memcpy(arr, foo, len);
 total += asm_sum(arr, len);

Without volatile第二个asm_sum可以进行优化，假设具有相同输入操作数（指针和长度）的相同 asm 将产生相同的输出。你需要volatile对于任何不是其显式输入操作数的纯函数的汇编语言。如果不优化的话then the "memory"clobber 将达到要求内存同步的预期效果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何指示可以使用内联 ASM 参数指向的内存？的相关文章

std::map find 在 C++ 中不起作用[重复]

这个问题在这里已经有答案了我使用以下几行创建了一个哈希映射和一个迭代器 std map
gcc：对 -static -shared -fPIE -fPIC -Wl,-pie 感到困惑

我正在尝试构建 clang 所有库都静态链接这样我就可以在具有古老 GCC 4 4 版本的 CentOS 6 上运行它首先我想添加选项 static通过打开 LLVM BUILD STATIC 就足够了但到了链接阶段就出错了生成
如何获取枚举数作为常量？

From 枚举中定义的项目总数 https stackoverflow com questions 856154 total number of items defined in an enum 我发现我可以使用以下方法获取枚举数 Enum
MVVM：来自 FileOpenPicker 的图像绑定源

我将 OnActivated 添加到 app xaml cs 中它可以正常工作 protected async override void OnActivated IActivatedEventArgs args var continua
处理器关联组 C#

我使用的是 72 核的 Windows Server 2016 我看到有两组处理器我的 net 应用程序将使用一个或其他组我需要能够强制我的应用程序使用我选择的组我看到下面的代码示例但我无法使其工作我可能传递了错误的变量我希望应
为类型列表创建别名并将其作为模板参数传递

我正在使用可变参数模板来实现访问者模式 template
二叉树和快速排序？

我有一个家庭作业内容如下别生气担心我是not请你帮我做作业编写一个程序通过使用二分查找的快速排序方法对一组数字进行排序树推荐的实现是使用递归算法这是什么意思到目前为止这是我的解释正如我在下面解释的那样我认为两者都有
如何反序列化 XML 文档

如何反序列化此 XML 文档
如何将 dll 中包含的组件嵌入到 exe 中，以便它可以从内存运行？

我正在尝试制作一个必须从内存运行的程序通过Assembly Load bin 如上所述here http www codeproject com Articles 13897 Load an EXE File and Run It fro
如何在 Windows 上的 GCC 中链接 CS50 C 库

我是编程新手一直在尝试使用以下命令编译我的代码MinGW https en wikipedia org wiki MinGW GCC 但我尝试包括CS50 https en wikipedia org wiki CS50 cs50 c
为什么 xcode IDE 认为 `friend` 是保留字

我一直在开发一个个人项目并在我创建的新类中包含以下代码 property readonly getter isFriend BOOL friend 它似乎没有任何问题当我构建它时它可以编译得很好但是当我们在xcode IDE看起来像
仅使用一个 #include 表达式一次包含多个头文件？

是否有任何表达式可以使语法一次包含多个标头而无需为每个新文件编写 include 表达式例如 include
.Net 支持柯里化泛型吗？

假设我们有一个嵌套的泛型类 public class A
如何在 C++11 中返回类成员向量

我读了几篇关于如何从方法返回向量的文章其中包括 c11 右值和移动语义混淆返回语句 https stackoverflow com questions 4986673 c11 rvalues and move semantics conf
如何使用 itextsharp 更改 PDF 公式的按钮图标？

我目前正在尝试使用 itextsharp 填写预定义的表单除了添加图像之外一切正常这之前已经在 Adob e 的 FDF 工具包中运行过该工具包已编译为 NET 1 1 这不再适用于 NET 4 0 我改用了 itextsharp
从 SQL 语句中检索元数据（表名）

我使用的是 Visual Studio 2008 我创建了一个 Winforms 应用程序并且尝试从 SQL 语句中提取表名 con new SqlConnection connString String queryString Sele
asio::this_coro::executor 的实现是什么

在协程函数中我们可以添加auto ex co await asio this coro executor 获取该协程的执行者但当我想了解它的定义时我发现了这个 Awaitable type that returns the execu
如何正确处置注入的DLL线程？

我将一个 DLL 注入到目标进程中以在玩 MMORPG 时充当助手当前功能将按键转换为鼠标点击因为 MMORPG 要求用户移动鼠标才能实现某些功能这是我所鄙视的假设我出于某种原因想要取消注入 DLL 我该怎么做呢这个方法干净吗
C# 使用 .Equals() 比较两个 double

我使用 ReShaper 当我用比较两个双精度值时它建议我应该使用 Math 具有公差的 ABS 方法看 https www jetbrains com help resharper 2016 2 CompareOfFloatsByE
将二进制长字符串转换为十六进制 C#

我正在寻找一种将长二进制字符串转换为十六进制字符串的方法二进制字符串看起来像这样 0110011010010111001001110101011100110100001101101000011001010110001101101011 我

随机推荐

如何附加到 Android MediaRecorder 输出文件

我想知道是否有一种方法可以告诉 MediaRecorder 附加到现有的音频文件而不是从头开始换句话说我想使用现有文件调用 setOutputFile 并将新音频附加到该文件而不是删除它 Android MediaRecorder 不
如何使WPF资源在触发器运行时重新计算？

简而言之我有一个Style 它用TemplateBinding使其参数化而不是一遍又一遍地重复自己但是当使用该样式的触发器并且在该触发器的 setter 中使用资源时它就不会显示甚至没有显示默认值这是一个重现此问题的小程序测
twitter-bootstrap-rails gem 工作流程

如何在 Rails 3 2 1 应用程序中使用 twitter bootstrap rails gem 工作流程是怎样的我这样做之后 rails g bootstrap layout LAYOUT NAME xed or uid opti
如何使用 qmake 和 macdeployqt 缩小应用程序

如何使用 qmake 和 macdeployqt 缩小应用程序我已在项目 pro 文件中设置 QT core gui 并在生成的应用程序上运行 qmake 和 macdeployqt 问题是该程序捆绑了 QtNetwork QtScrip
在 Node.js 中递归复制文件夹

有没有一种更简单的方法来复制文件夹及其所有内容而无需手动执行一系列操作fs readir fs readfile fs writefile递归地我只是想知道我是否缺少一个理想情况下可以像这样工作的函数 fs copy path to s
AutoMapper 最佳实践 - 我是否应该向 DAO 询问信息以实现从 DTO 到域对象的映射？
将 CSV 文件加载到 MySQL Workbench

我有很多 excel CSV 文件需要加载到 MySQL Workbench 中的数据库中我使用的是 Mac OS X 我已经四处寻找好的演练或教程但我还没有看到任何清楚解释如何将 CSV 加载到 MySQL Workbench 中的内
如何计算字符串中的唯一字符[重复]

这个问题在这里已经有答案了假设我们有变量 myString blabla 或 mystring 998769 myString Length will get you your result myString Count char IsL
使用 GitHub 包 R 操作

我试图使用actions https github com features actions in a package https github com Nelson Gon manymodelr我写问题是这个包actions https
ModuleNotFoundError：AWS 中没有名为“应用程序”的模块错误

我正在尝试将 Django 应用程序部署到 AWS 当我尝试创建应用程序时出现错误 ModuleNotFoundError 没有名为应用程序的模块使用django create django env 我不知道为什么我的 djang
asp.net mvc 中 HttpUnauthorizedResult 的默认登录 url

我写了一个自定义AuthorizeAttribute在asp net mvc3应用程序中具有以下条件 public override void OnAuthorization AuthorizationContext filterConte
如何告诉我的 DataTemplate 绑定到 PARENT ViewModel 中的属性？

我有以下内容MainView xaml可以很好地用作 MVVM 菜单切换器的文件我有这些对 Page1View Page1ViewModel Page2View Page2ViewModel in my 主视图模型我用两个 ViewMod
如何将 WebLogic Server 配置到现有 Eclipse

我刚刚安装了 WebLogic Server 但在安装过程中我忘记了设置 Eclipse 的路径现在我使用新安装的 Eclipse 来自 Oracle 安装向导如何配置 Oracle WebLogic Server 以使用我的 Ecli
具有一列单选按钮的 EXT js 网格

我有一个 ext js 网格如下所示 var grid new Ext grid GridPanel columns header Account Id dataIndex accountId header Account NUmber
AngularJS 中如何进行分页？

我的内存中有一个包含大约 1000 个项目的数据集并且正在尝试创建一个寻呼机这个数据集但我不确定如何做到这一点我正在使用自定义过滤器函数来过滤结果效果很好但不知何故我需要获取页数有什么线索吗 Angular UI Bootst
填写groupby中缺失的日期

想象一下我有一个数据框如下所示 ID DATE VALUE 1 31 01 2006 5 1 28 02 2006 5 1 31 05 2006 10 1 30 06 2006 11 2 31 01 2006 5 2 31 02 2006
如何在 Aerospike Node.js 客户端中获取主键

我正在尝试从 Aerospike 获取所有记录以及主键我尝试使用 client query 功能如下所示 var query client query aerospikeDBParams dbName testRecords var s
我应该使用什么来代替 OnMouseXXX 事件处理程序？

我构建了一个小应用程序在某些对象中使用 OnMouseDrag 和 OnMouseDown 我认为这将是最好的选择因为该方法不属于 Update 方法然而在编译应用程序时 Unity 表示游戏脚本或其他自定义代码包含 OnMou
%errorlevel% 在循环命令中返回 0

好的我已经安装了 Dropbox 但它不符合我的要求所以我使用 Revo Pro 卸载了它但是当我打开任务管理器时我的计算机中仍然有与其相关的进程在运行因此我决定进行批处理来查找并删除与其相关的所有文件 echo off cd
如何指示可以使用内联 ASM 参数*指向*的内存？

考虑以下小函数 void foo int iptr iptr 10 1 asm volatile nop r iptr iptr 10 2 使用海湾合作委员会这编译为 https godbolt org z A3yVqA foo nop

如何指示可以使用内联 ASM 参数*指向*的内存？

背景：

如何指示可以使用内联 ASM 参数*指向*的内存？ 的相关文章

随机推荐

热门标签

如何指示可以使用内联 ASM 参数指向的内存？

如何指示可以使用内联 ASM 参数指向的内存？的相关文章