MASM x64 中的跳转表实现？

2023-12-05

我正在尝试使用跳转表在汇编（MASM64、Windows、x64）中实现算法。基本思想是：我需要对数据执行 3 种不同类型的操作。这些操作取决于一些变量，但我发现实现大量切换和许多冗长的实现很乏味。

PUBLIC superFunc@@40 ;__vectorcall decoration
.DATA
ALIGN 16
jumpTable1 qword func_11, func_12, func_13, func_14
jumpTable2 qword func_21, func_22, func_23, func_24
jumpTable3 qword func_31, func_32, func_33, func_34

.CODE
superFunc@@40 PROC
        ;no stack actions, as we should do our stuff as a leaf function
        ;assume the first parameter (rcx) is our jumpTable index, and it's
        ;the same index for all functions
        mov     rax,    qword ptr [rcx*8 + offset jumpTable1]
        mov     r10,    qword ptr [rcx*8 + offset jumpTable2]
        mov     r11,    qword ptr [rcx*8 + offset jumpTable3]
        jmp     qword ptr [rax]
superFunc@@40 ENDP
func_11:
        [...] do something with data
        jmp     qword ptr [r10]
func_12: ; shorted, simply does something else to the data and jumps thru r10
[...]
func_21:
        [...] do something with data
        jmp     qword ptr [r11]
func_22: ; shorted, simply does something else to the data and jumps thru r11
[...]
func_31:
        [...] do something with data
        ret
func_32: ; shorted, simply does something else to the data and returns
END

现在编译良好，但它不与我的主 C++ 插件（DLL）链接，给我以下链接器错误：

LINK : warning LNK4075: ignoring '/LARGEADDRESSAWARE:NO' due to '/DLL' specification
error LNK2017: 'ADDR32' relocation to 'jumpTable1' invalid without /LARGEADDRESSAWARE:NO

我怎样才能正确地实现这样的事情？也许更好的措辞：如何在 MASM64 中正确实现跳转表并跳转/调用这些表中的地址？

P.S.：我可以在 C++ 中设置一个函数表，并通过参数告诉 superFunc。如果我找不到更好的解决方案，我就会这么做。

RIP 相对寻址仅在寻址模式下没有其他寄存器时才起作用。

[table + rcx*8]只能用 x86-64 机器代码编码为[disp32 + rcx*8]，因此仅适用于适合 32 位有符号绝对地址的非大地址。 Windows 显然可以支持这一点LARGEADDRESSAWARE:NO，就像在 Linux 上一样编译用-no-pie解决同样的问题。

MacOS 没有解决方法，您根本无法使用 64 位绝对寻址。Mach-O 64 位格式不支持 32 位绝对地址。 NASM 访问阵列 shows 如何使用 RIP 相对索引静态数组lea将表地址存入寄存器同时避免使用 32 位绝对地址。

你的跳转表本身很好：他们使用64-bit绝对地址，可以在虚拟地址空间中的任何位置重定位。（在 ASLR 之后使用加载时修复。）

我认为你的间接层次太多了。由于您已经将函数指针加载到寄存器中，因此您应该使用jmp r10 not jmp [r10]。在任何可能的分支错误预测之前，预先将所有负载加载到寄存器中可以让它们更快地进入管道，因此maybe如果您有大量闲置寄存器，这是一个好主意。

内联一些后面的块会更好，如果它们很小，因为任何给定 RCX 值可到达的块都无法通过任何其他方式到达。所以内联所有的会更好func_21 and func_31 into func_11，依此类推func_12。您可以使用汇编器宏来使这更容易。

实际上重要的是最后的跳转func_11 always去func_21。最好还有其他方法可以到达该街区，例如来自跳过表 1 的其他间接分支。这没有理由func_11不要陷入其中；它仅限制您可以在这两个块之间进行哪些优化，如果func_21仍然必须是未从以下位置落入的执行路径的有效入口点func_11.

但无论如何，您可以像这样实现您的代码。如果确实优化的话，可以去掉后面的调度步骤和相应的负载。

我认为这是有效的 MASM 语法。如果没有，应该仍然清楚所需的机器代码是什么。

    lea    rax,  [jumpTable1]          ; RIP-relative by default in MASM, like GAS [RIP + jumpTable1] or NASM [rel jumpTable1]

    ; The other tables are at assemble-time-constant small offsets from RAX
    mov    r10,  [rax + rcx*8 + jumpTable3 - jumpTable1]
    mov    r11,  [rax + rcx*8 + jumpTable2 - jumpTable1]
    jmp    [rax + rcx*8]


func_11:
    ...
    jmp  r10         ; TODO: inline func_21  or at least use  jmp func_21
                     ;  you can use macros to help with either of those

或者，如果您只想为一张表绑定一个寄存器，可以使用：

    lea    r10,  [jumpTable1]    ; RIP-relative LEA
    lea    r10,  [r10 + rcx*8]   ; address of the function pointer we want
    jmp    [r10]

align 8
func_11:
    ...
    jmp   [r10 + jumpTable2 - jumpTable1]    ; same index in another table


align 8
func_12:
    ...
    jmp   [r10 + jumpTable3 - jumpTable1]    ; same index in *another* table

这充分利用了表之间已知的静态偏移。

跳转目标的缓存局部性

在跳跃目标矩阵中，任何单一使用都会沿着“列”向下移动以遵循某些跳跃链。显然，最好转置布局，使跳转链沿着“行”行进，这样所有目标都来自同一缓存行。

即这样安排你的桌子func_11 and 21可以结束于jmp [r10+8]，进而jmp [r10+16]，而不是+表之间的一些偏移，以改进空间局部性。 L1d 加载延迟只有几个周期，因此与在第一个间接分支之前加载到寄存器相比，CPU 在检查分支预测的正确性时没有太多额外的延迟。（我正在考虑第一个分支错误预测的情况，因此 OoO exec 无法“看到”内存间接 jmp，直到开始发出正确的路径为止。）

避免使用 64 位绝对地址：

您还可以存储相对于跳转目标附近的某个引用地址或相对于表本身的 32 位（或 16 或 8 位）偏移量。

比如看看GCC编译时做了什么switch与位置无关的代码中的跳转表，即使对于允许运行时修复绝对地址的目标也是如此。

https://gcc.gnu.org/bugzilla/show_bug.cgi?id=84011包括一个测试用例；看到它Godbolt 与 GCC 的 MASM 风格.intel_syntax。它使用一个movsxd从表中加载，然后add rax, rdx / jmp rax。表条目是这样的dd L27 - L4 and dd L25 - L4（其中这些是标签名称，给出从跳跃目标到“锚点”L4 的距离）。

（也与该案例相关https://gcc.gnu.org/bugzilla/show_bug.cgi?id=85585).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MASM x64 中的跳转表实现？的相关文章

将代码保存在 L1 缓存中

我一直在阅读维基百科关于 K 编程语言的文章 http en wikipedia org wiki K programming language Performance characteristics这就是我所看到的解释器的小尺寸和语言的
跳转目的地太远：3 个字节

我的循环有问题其中包含的代码很长并且给了我错误jump destination too far by 3 byte s 当我删除时 mov edx offset str1 call writestring 这部分位于主过程下方它不会给出
寻找有效的移位/加法/LEA 指令序列来乘以给定常量（避免 MUL/IMUL）

我正在尝试编写一个 C 程序 mult c 它有一个接收 1 个 int 参数的 main 函数用atoi argv 1 这是一些常数k我们想要乘以该程序将生成一个汇编文件mult s实现 int mult int x return x
ARM 汇编：从 STDIN 获取字符串

我目前正在学习 CS 课程我们刚刚开始在 Raspberry Pi 上使用 ARM Assembly 事实证明这相当困难想知道是否有人可以提供帮助我当前的任务是从 stdin 获取一个字符串使用 scanf 并计算其中的字符数然后
/usr/bin/as：无法识别的选项“-EL”

因此在为我的1plus手机编译android内核时经过3天的多次尝试我放弃了并尝试在这里询问是否有人以前遇到过这个问题这个错误对我来说有点模糊但我觉得问题来自于我最近对 GNU Linux 发行版 Gentoo 的更改它在不应该
x86 程序执行期间方向标志 (DF) 的默认状态

在反汇编中我经常看到使用字符串操作指令而不考虑方向标志 DF 的状态如下所示 or ecx 0FFFFFFFFh xor eax eax mov edi ebp repne scasb CLD or STD自函数开始以来未找到指令也未
如何使用存储在 x64 位置的 x64 内存地址进行跳转？

据我所知使用 64 位地址作为操作数的 jmp 是不可能的但我相信使用 x64 内存位置是来自here http www tptp cc mirrors siyobik info instruction JMP htmlJMP r m
给寄存器赋值并加减

我对此完全迷失了我需要使用寄存器来计算以下表达式的编程 varA varA varB varC varD 其中 varA varB 等是变量将整数值分配给上述变量的 EAX EBX ECX 和 EDX 寄存器这意味着您可以对输入进行
编译器在函数名称前添加下划线前缀的原因是什么？

当我看到 C 应用程序的汇编代码时如下所示 emacs hello c clang S O hello c o hello s cat hello s 函数名称以下划线作为前缀例如callq printf 为什么这样做以及它有什么优点
0 和双字 0 有什么区别？

正如问题所述有什么区别例如 mov eax 0 and mov eax dword 0 我一直在使用 cmp 语句但我无法理解其中的区别一个是地址另一个是数值如前所述 MOV 指令没有区别对于 CMP 您将有以下区别 qwor
使用`esp*scale 时寻址内存时出错

内存寻址一般形式发现了here https stuff mit edu afs athena project rhel doc OldFiles 3 rhel as en 3 i386 memory html is base index
C 结构如何返回[重复]

这个问题在这里已经有答案了我想知道如何返回一个结构例如 typedef struct number uint64 t a b c d number number get number number res 0 0 0 0 return
RISC-V反汇编器与秒杀运行结果不符？

我已经设置了一个 hello world 程序只是为了测试我的riscv32 unknown elf工具链 spike pk等等虽然我设法使用打印了 hello worldspike isa RV32 pk hello elf 我发现如果我
为什么每次在 GDB 中构建和反汇编函数时都会得到相同的地址？

每次反汇编函数时为什么总是得到相同的指令地址和常量地址例如执行以下命令后 gcc o hello hello c ggdb gdb hello gdb disassemble main 转储代码将是当我退出 gdb 并重新反汇编 m
使用 XCHG 解锁的自旋锁

维基百科提供的使用 x86 XCHG 命令的自旋锁的示例实现是 Intel syntax locked The lock variable 1 locked 0 unlocked dd 0 spin lock mov eax 1 Set t
用于计算三角函数、对数或类似函数的算法。仅限加减法

我正在修复 Ascota 170 古董机械可编程计算机它已经开始工作了现在我正在寻找一种算法来展示其功能例如计算三角或对数表或类似的东西不幸的是从数学运算来看计算机只能进行整数的加减法从 1E12到1E12的55个寄存器甚
在LPC2148 ARM处理器上创建中断向量的汇编代码

我最近刚刚开始使用 LPC2148 ARM 处理器我试图理解一些有关创建中断向量的汇编代码这是代码 Runtime Interrupt Vectors Vectors b start reset start ldr pc undf un
如果没有按下任何键，则检查按键而不阻塞

我正在创建一个应用程序来查看当前时间并创建了一个循环来每秒更新时间循环看起来像这样 UPDATE The code to be re executed JMP UPDATE 但我无法结束它当我使用 MOV AH 00H INT 21H
GCC 从 C++ 程序生成的汇编代码中的 .cfi 和 .LFE 是什么？

我有以下 C 代码 int factorial int n if n 0 return 1 return n factorial n 1 int main void factorial 5 return 0 当我使用 g S Factori
尝试理解 printf() 的 gcc 汇编输出

我正在尝试学习如何理解汇编代码因此我一直在研究 GCC 的汇编输出以获取一些愚蠢的程序其中之一只不过是int i 0 我现在或多或少完全理解了其中的代码最大的困难是理解散布的 GAS 指令无论如何我向前迈了一步并添加了printf

随机推荐

是否有用于 ID3 元数据的 Perl 或 Python 库？ [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案基本上我有一堆从我兄弟的 iPod 上下载的音乐文件它们保留了元数据但 iPod 似乎喜欢将它们存储在那些绝对可怕的四个字符名称下我想我应该编写一个漂亮快速的脚本来按照我的
如何通过 XAML 中的样式重用项目子项？

我有一个 WPF 子菜单我想在 XAML 中的几个地方重用它这是八张合集
检测点是在 raphael.js 形状的内部还是外部

我有一个 raphael js 形状我正在其上绘制圆圈我只希望当圆没有超出其所绘制的形状的边界时出现一个圆为了更清楚地说明这一点以下是我不希望发生的情况的示例示例http img682 imageshack us img682 4
谷歌折线图：线向下时改变颜色

https developers google com chart interactive docs gallery linechart 大家好我想知道有没有办法改变线条向下移动时的颜色我用谷歌搜索但找不到任何东西例如折线图向上移动
在Python中向小数点后的浮点数添加零

我正在从一个文件中读取数据修改它并将其写入另一个文件新文件将由另一个程序读取因此保留精确的格式至关重要例如我的输入文件中的数字之一是 1 000000 我的脚本对列应用了一些数学并且应该返回 2 000000 但目前返回的是 2
Typescript 有联合，那么枚举是多余的吗？

自从 TypeScript 引入联合类型以来我想知道是否有任何理由声明枚举类型考虑以下枚举类型声明 enum X A B C var x X X A 和类似的联合类型声明 type X A B C var x X A 如果它们基本上服务
平滑鼠标移动

我正在开发一个软件根据我从 kinect 的深度图像获得的某些坐标来移动鼠标但我有 30 帧秒图像秒并且这些坐标随着每一帧而变化因此鼠标不断移动我的问题是有没有办法让鼠标的移动平滑是的您可以使用一些参数开始跟踪以使移
将 Gradle 支持添加到 IntelliJ 项目的最佳方法

我环顾四周没有找到将现有 IntelliJ 项目转换为 Gradle 的最佳解决方案我在团队环境中工作我们目前共享 ipr 文件因为我们有一些跟踪的构建配置我们最终将摆脱那些支持 Gradle 的人但在 Gradle 转换完成之
更新可变 HashMap 值，这是一个可变集合

我有一张如下所示的地图 Map A gt Collection B 该映射会循环更新然而特殊之处在于更新主要意味着将元素 B 添加到 Collection B 对于某些键 A 我试图找出是否可以通过将 Collection 的类型从
需要在solaris命令中重新排列和求和列

我有以下名为 atp csv 文件的数据 Date Time M ID N ID Status Desc AMount Type 2015 01 05 00 00 00 076 1941321748 BD9010423590206 200
如何在 MatLab 中设计 SOAP 调用

我根本不清楚如何从 MatLab 调用网络服务我正在尝试申请本指南但我不明白几个部分比如这个哪里指定是GET还是POST What is 名称空间我应该如何提供我拥有的 WSDL 文件我很迷失所以任何提示将不胜感激如果您有权访问
EF Code First Mysql 到 SQL Server

我有一个 MVC 5 应用程序我首先将其配置为使用 Mysql 但现在希望它使用 SQL Server 我的应用程序首先使用代码和迁移来生成数据库更改所有必需的配置后我尝试从包管理控制台运行更新数据库但我不断收到此错误 System
同步块是否会阻止其他线程向同步列表中插入数据？

所以我正在开发一个多线程java应用程序我有这个问题 List
负数和正数的正则表达式

我需要一个输入字段的正则表达式以允许负数和正数并且不允许字母特殊字符我见过其他人实现了这一点但他们允许在字符串中的任何位置使用减号而我只想允许在字符串的开头使用减号注意我想允许用户使用箭头 del home 键等这是获取正
如何在 SSRS 2008 R2 中将图表的宽度与 Tablix 的宽度对齐？或者如何使用 DynamicWidth 属性？

我正在创建 SSRS 报告该报告由 tablix 和图表组成两者都描述相同的数据即相同的数据库查询 Tablix 的实际列数由查询返回的行数动态决定我们以按列的方式显示记录 Example 如果查询返回 5 条记录则 Tablix
如何将缓存清单添加到 Meteor 应用程序？

嗯添加就没有问题了但是如何生成缓存清单呢我需要以某种方式获取 Meteor 生成的 CSS 和 JS 组合的路径 http www whatwg org specs web apps current work manifests Up
查找左上角和右下角点 (C++)

我正在为我正在进行的项目寻求帮助我正在做的是多边形近似算法我已经获得了边界的所有点但为了启动算法我需要从点集中找到左上角和右下角的点所有点都存储在一个结构体数组中其中包含每个点的 x 和 y 坐标关于循环点数组的简单方法有什么
如何在Android中的.csv文件中逐行写入contactname和contactno？

我想从手机中获取联系人姓名和相应的联系人号码并将其写入 csv文件每行将包含整个联系人列表中每个人的联系人姓名和联系电话号码联系方式怎么写 csv file 我编写了用于显示联系人姓名列的代码但它仅显示一个联系人这意味着它会覆盖现
如何将 Map 对象写入文件

我想从 a 写入文件Map目的这是我的尝试 try stuMap put student getId student Path file Paths get student txt to create the file Files wri
MASM x64 中的跳转表实现？

我正在尝试使用跳转表在汇编 MASM64 Windows x64 中实现算法基本思想是我需要对数据执行 3 种不同类型的操作这些操作取决于一些变量但我发现实现大量切换和许多冗长的实现很乏味 PUBLIC superFunc 40 v

MASM x64 中的跳转表实现？

避免使用 64 位绝对地址：

MASM x64 中的跳转表实现？ 的相关文章

随机推荐

热门标签

MASM x64 中的跳转表实现？的相关文章