内联asm未经优化无法编译

2024-03-08

我需要在 32 位 Linux 进程中使用 futex 系统调用，但无法使用syscall函数（标头不可用）。这仍然可以通过使用内联汇编来完成，如下所示：

#include <time.h>

#define SYS_futex 0xf0

// We need -fomit-frame-pointer in order to set EBP
__attribute__((optimize("-fomit-frame-pointer")))
int futex(int* uaddr, int futex_op, int val, const struct timespec* timeout, int* uaddr2, int val3)
{
    register int ebp asm ("ebp") = val3;
    int result;
    asm volatile("int $0x80"
                 : "=a"(result)
                 : "a"(SYS_futex), "b"(uaddr), "c"(futex_op), "d"(val), "S"(timeout), "D"(uaddr2), "r"(ebp)
                // : "memory"  // would make this safe, but could cause some unnecessary spills.  THIS VERSION IS UNSAFE ON PURPOSE, DO NOT USE.
          );
        
    if (result < 0)
    {
        // Error handling
        return -1;
    }
    return result;
}

编译成功，如预期的那样。

但是，由于我们没有指定可以读取和/或写入的内存位置，因此可能会导致一些偷偷摸摸的错误。因此，我们可以使用虚拟内存输入和输出（如何指示可以使用内联 ASM 参数*指向*的内存？ https://stackoverflow.com/questions/56432259/how-can-i-indicate-that-the-memory-pointed-to-by-an-inline-asm-argument-may-be)

asm volatile("int $0x80"
             : "=a"(result), "+m"(uaddr2)
             : "a"(SYS_futex), "b"(uaddr), "c"(futex_op), "d"(val), "S"(timeout), "D"(uaddr2), "r"(ebp), "m"(*uaddr), "m"(*timeout));

当编译时gcc -m32，它失败了'asm' operand has impossible constraints。当编译时clang -fomit-frame-pointer -m32，它失败了inline assembly requires more registers than available。但我不明白为什么。

但是，当编译时-O1 -m32（或除-O0），编译得很好。

我看到两个明显的解决方案：

Use the "memory"相反，这可能限制太多，阻止编译器将不相关的变量保留在寄存器中
Use __attribute__((optimize("-O3")))，我想避免

还有其他解决办法吗？

编译器不知道你实际上没有使用*uaddr and *timeout操作数，所以它仍然需要决定什么%9 and %10如果您要使用它们，应该扩展到。这些对象的地址作为参数传递，因此它无法生成直接的内存引用；它必须是间接的，这意味着需要分配寄存器来存储这些地址；例如，编译器可以尝试加载指针uaddr into ecx然后展开%9 to (%ecx)。不幸的是，您已经为其他操作数声明了所有机器的寄存器，因此没有可用于此目的的寄存器。

通过优化，编译器足够聪明，可以找出指针uaddr已经可以在ebx，所以可以展开%9 to (%ebx)同样地%10 to (%esi)。那么它不需要任何额外的寄存器，一切都很好。

如果你真的提到，你就会看到这种情况发生%9 and %10在内联汇编中，如这个例子 https://godbolt.org/z/eqnej9。启用优化后，它就像我说的那样。如您所知，如果不进行优化，它就无法编译，但是如果我们删除其他几个操作数 https://godbolt.org/z/Ws4578释放一些寄存器（这里ecx and edx），我们看到它现在正在扩展%7, %8（他们被重新编号）到(%edx), (%ecx)，并提前相应地加载这些寄存器。它不知道这是多余的，因为edx and ebx两者包含相同的值。

我认为除了您已有的想法之外，没有任何好的方法可以避免这种情况：启用优化，或使用“内存”破坏器。我怀疑“内存”破坏实际上会影响如此短的函数中生成的代码，无论如何，如果您在没有优化的情况下进行编译，那么您已经放弃了高效代码的任何希望。或者，只需用汇编语言编写整个函数即可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

内联asm未经优化无法编译的相关文章

std::vector 与 std::stack

有什么区别std vector and std stack 显然向量可以删除集合中的项目尽管比列表慢得多而堆栈被构建为仅后进先出的集合然而堆栈对于最终物品操作是否更快它是链表还是动态重新分配的数组我找不到关于堆栈的太多信息但
free 和 malloc 在 C 中如何工作？

我试图弄清楚如果我尝试从中间释放指针会发生什么例如看下面的代码 char ptr char malloc 10 sizeof char for char i 0 i lt 10 i ptr i i 10 ptr ptr ptr pt
如何在 C++ 中标记字符串？

Java有一个方便的分割方法 String str The quick brown fox String results str split 在 C 中是否有一种简单的方法可以做到这一点 The 增强分词器 http www boost o
C++ 多行字符串原始文字[重复]

这个问题在这里已经有答案了我们可以像这样定义一个多行字符串 const char text1 part 1 part 2 part 3 part 4 const char text2 part 1 part 2 part 3 part 4
WPF 数据绑定到复合类模式？

我是第一次尝试 WPF 并且正在努力解决如何将控件绑定到使用其他对象的组合构建的类例如如果我有一个由两个单独的类组成的类 Comp 为了清楚起见请注意省略的各种元素 class One int first int second cla
Linux 中 m 标志和 o 标志将存储在哪里

我想知道最近收到的路由器通告的 m 标志和 o 标志的值从内核源代码中我知道存储了 m 标志和 o 标志 Remember the managed otherconf flags from most recently received R
SSH，运行进程然后忽略输出

我有一个命令可以使用 SSH 并在 SSH 后运行脚本该脚本运行一个二进制文件脚本完成后我可以输入任意键本地终端将恢复到正常状态但是由于该进程仍在我通过 SSH 连接的计算机中运行因此任何时候它都会登录到stdout我在本地终
C# 列表通用扩展方法与非通用扩展方法

这是一个简单的问题我希望集合类中有通用和非通用方法例如List
有没有一种快速方法可以从 Jar/war 中删除文件，而无需提取 jar 并重新创建它？

所以我需要从 jar war 文件中删除一个文件我希望有类似 jar d myjar jar file I donot need txt 的内容但现在我能看到从 Linux 命令行执行此操作的唯一方法不使用 WinRAR Winzip
实例化类时重写虚拟方法

我有一个带有一些虚函数的类让我们假设这是其中之一 public class AClassWhatever protected virtual string DoAThingToAString string inputString retu
如何在当前 Visual Studio 主机内的 Visual Studio 扩展中调试使用 Roslyn 编译的代码？

我有一个 Visual Studio 扩展它使用 Roslyn 获取当前打开的解决方案中的项目编译它并从中运行方法程序员可以修改该项目我已从当前 VisualStudioWorkspace 成功编译了 Visual Studio 扩
C# 动态/expando 对象的深度/嵌套/递归合并

我需要在 C 中合并 2 个动态对象我在 stackexchange 上找到的所有内容仅涵盖非递归合并但我正在寻找能够进行递归或深度合并的东西非常类似于jQuery 的 extend obj1 obj2 http api jquer
为什么使用小于 32 位的整数？

我总是喜欢使用最小尺寸的变量这样效果就很好但是如果我使用短字节整数而不是整数并且内存是 32 位字可寻址这真的会给我带来好处吗编译器是否会做一些事情来增强内存使用对于局部变量它可能没有多大意义但是在具有数千甚至数百万项的结构
如何在 Android 中使用 C# 生成的 RSA 公钥？

我想在无法假定 HTTPS 可用的情况下确保 Android 应用程序和 C ASP NET 服务器之间的消息隐私我想使用 RSA 来加密 Android 设备首次联系服务器时传输的对称密钥 RSA密钥对已在服务器上生成私钥保存在服务器
相当于Linux中的导入库

在 Windows C 中当您想要链接 DLL 时您必须提供导入库但是在 GNU 构建系统中当您想要链接 so 文件相当于 dll 时您就不需要链接为什么是这样是否有等效的 Windows 导入库注意我不会谈论在 Win
对于某些 PDF 文件，LoadIFilter() 返回 -2147467259

我正在尝试使用 Adob e IFilter 搜索 PDF 文件我的代码是用 C 编写的我使用 p invoke 来获取 IFilter 的实例 DllImport query dll SetLastError true CharSet
为什么C++代码执行速度比java慢？

我最近用 Java 编写了一个计算密集型算法然后将其翻译为 C 令我惊讶的是 C 的执行速度要慢得多我现在已经编写了一个更短的 Java 测试程序和一个相应的 C 程序见下文我的原始代码具有大量数组访问功能测试代码也是如此 C 的
如何使用 JSch 将多行命令输出存储到变量中

所以我有一段很好的代码我很难理解它允许我向我的服务器发送命令并获得一行响应该代码有效但我想从服务器返回多行主要类是 JSch jSch new JSch MyUserInfo ui new MyUserInfo String
MySQL Connector C/C API - 使用特殊字符进行查询

我是一个 C 程序我有一个接受域名参数的函数 void db domains query char name 使用 mysql query 我测试数据库中是否存在域名如果不是这种情况我插入新域名 char query 400 spri
如何确定 CultureInfo 实例是否支持拉丁字符

是否可以确定是否CultureInfo http msdn microsoft com en us library system globalization cultureinfo aspx我正在使用的实例是否基于拉丁字符集我相信你可以使

随机推荐

ShinyDashboard 动态要点

我希望有一个简单的问题可以将标签有序列表传递到闪亮的仪表板中我想做的是有一个函数可以根据过滤的类别生成项目符号的有序列表这是我希望能够使用名为 nba teams 的数据框执行的操作的一个简单示例 teams conference B
Android ViewPageAdapter 为每个选项卡提供单独的后台堆栈

我有一个只有一个 Activity 的 Android 应用程序该活动包含一个带有 ViewPageAdapter 的 SlidingTabLayout 如下所示this http www exoguru com android mate
致命错误：刷新表视图时索引超出范围

当拉动刷新时我遇到了这个奇怪的应用程序崩溃我的代码如下 var posts Posts override func viewDidLoad super viewDidLoad refreshControl gt pull to refr
Pandas 和 scikit-learn：KeyError：[....] 不在索引中

我不明白为什么会出现错误KeyError 1351 1352 1353 13500 13501 13502 not in index 当我运行这段代码时 cv KFold n splits 10 for train index test i
Hibernate Criteria - 如何将连接结果限制为单个实体类型？

好的下面的查询 SELECT O P FROM ORDERS O PRODUCT P WHERE O ORDER ID P ORDER ID AND P ID 1234 可以按如下标准完成 List ordersAndProducts s
在本地安装和设置 TYPO3 的最快方法是什么？

我想在本地计算机上安装并设置 TYPO3 最佳实践和最快方法是什么要在本地计算机上运行 TYPO3 您需要在计算机上运行 Web 服务器这可以通过不同的方式完成基于 Linux 的机器上的本机 Web 服务器 PHP 和数据库虚拟机
禁用先决条件按钮 - MSI 安装程序

我创建了一个 msi 安装程序我想进一步添加先决条件例如 Net 但是当我转到安装项目属性时先决条件按钮被禁用我该如何启用它其他详情我正在使用 VS 2015 SQL Server 2008 R2 Net 4 5 2 C
Power Query 表达式错误：“记录”类型的值无法转换为“文本”类型

我遇到的问题是无法执行以下代码语法似乎没问题但是当我尝试执行它时我得到的响应是 Expression Error 我们无法将 Record 类型的值转换为 Text 类型细节值记录类型类型 let body page 1 p
我可以为 Angular/TypeScript 中导入的库指定别名吗？

我遇到以下问题我已经和一个叫做的模型一起工作了一段时间Location 但现在我发现 Angular 也有这样的模型所以我在一个组件中发生了以下碰撞而我需要这两个模型 import Location from src app core
FIFO 页面替换策略是否有可能优于 LRU？

作为操作系统作业的一部分我被要求比较给定页面访问序列的先进先出和最近最少使用的页面替换策略产生的页面错误数量令人困惑的是 FIFO 产生的页面错误似乎比 LRU 少这可能吗还是我犯了一个错误是的 FIFO 有可能击败 LRU 我能
如何使用/学习Video4Linux2（屏幕显示）输出API？

我最新的微处理器 Freescale iMX233 有 8 个硬件叠加层以及内置的 YUV 到 RGB 转换功能他们通过 v4l2 驱动程序公开了这些功能 v4l2 文档 http www linuxtv org downloads v
使用 tablesorter 对日期字段进行排序

我正在使用 JQuery 表排序器插件该表有一列显示日期格式05 Mar 2012 tablesorter 插件似乎将此列视为文本因为它按顺序对其进行排序 2012 年 3 月 5 日 2012 年 1 月 6 日 2012 年 12
java.util.Date 和 getYear()

我在 Java 中遇到以下问题我看到有些人遇到了 JavaScript 中存在类似问题但我使用的是 Java System out println new Date getYear System out println new Greg
无法使用鼠标将上下文粘贴到 Primefaces Extension pe:inputNumber 中

我们一直在我们的项目中使用 Primefaces v 3 5 和 Primefaces Extensions v 0 7 0 这非常棒为开发者和社区干杯 inputNumber 组件几乎可以满足我们处理小数字段时的所有需求有一件事是is
java.lang.NoClassDefFoundError：com/google/common/collect/Maps - Selenium

尊敬的硒专家我在 JPA 2 0 程序中遇到了以下运行时错误由于某种原因该错误似乎与 Firefox Profile 相关 Exception in thread main java lang NoClassDefFoundError
如何使用 INSERT INTO + SELECT FROM 插入自定义值？

我想在执行时插入自定义值以及表列INSERT INTO SELECT FROM WHERE clause INSERT INTO RoleMappingEmployee Delete History RoleMappingEmployeeK
Kafka生产者读取数据文件

我正在尝试在循环中加载数据文件以检查统计信息而不是 Kafka 中的标准输入下载 Kafka 后我执行了以下步骤启动动物园管理员 bin zookeeper server start sh config zookeeper pro
打开特定
标签后自动关闭所有其他
标签

这是我的代码
是否可以以编程方式获取共享库中函数的签名？

标题很清楚我们可以通过以下方式加载库dl open etc 但是我怎样才能得到其中函数的签名呢这个答案不能笼统地回答从技术上讲如果您使用详尽的调试信息编译可执行文件代码可能仍然是优化的发布版本则可执行文件将包含额外的部分从而提
内联asm未经优化无法编译

我需要在 32 位 Linux 进程中使用 futex 系统调用但无法使用syscall函数标头不可用这仍然可以通过使用内联汇编来完成如下所示 include

内联asm未经优化无法编译

内联asm未经优化无法编译 的相关文章

随机推荐

热门标签

内联asm未经优化无法编译的相关文章