考虑到指令具有不同的长度，CPU 如何知道下一条指令应该读取多少字节？

2024-03-01

所以我正在读一篇论文，其中他们说静态反汇编二进制代码是不可判定的，因为一系列字节可以用多种可能的方式表示，如图所示（其 x86 ）

所以我的问题是：

那么CPU是如何执行这个的呢？例如，在图中，当我们到达 C3 之后时，它如何知道下一条指令应该读取多少字节？
CPU如何知道执行一条指令后应该将PC增加多少？它是否以某种方式存储当前指令的大小，并在想要增加 PC 时添加该大小？
如果CPU能够以某种方式知道它应该为下一条指令读取多少字节或者基本上如何解释下一条指令，为什么我们不能静态地做到这一点？

简单的方法是只读取一个字节，对其进行解码，然后确定它是否是一条完整的指令。如果没有读取另一个字节，则在必要时对其进行解码，然后确定是否已读取完整的指令。如果不继续读取/解码字节，直到读取完整的指令。

这意味着如果指令指针指向给定的字节序列，则只有可能的方法来解码该字节序列的第一条指令。之所以出现歧义，是因为要执行的下一条指令可能不位于紧随第一条指令之后的字节处。这是因为字节序列中的第一条指令可能会更改指令指针，因此除了后续指令之外的其他指令也会被执行。

RET（retn）示例中的指令可能是函数的结尾。函数通常以 RET 指令结尾，但不一定如此。一个函数可能有多个 RET 指令，但这些指令都不在函数末尾。相反，最后一条指令将是某种 JMP 指令，它跳回到函数中的某个位置，或者完全跳回另一个函数。

这意味着在您的示例代码中，如果没有更多上下文，就不可能知道 RET 指令后面的任何字节是否会被执行，如果是的话，哪个字节将是以下函数的第一条指令。函数之间可能有数据，或者该 RET 指令可能是程序中最后一个函数的结尾。

x86 指令集尤其具有相当复杂的格式，其中包括可选前缀字节、一个或多个操作码字节、一两个可能的寻址形式字节，以及可能的位移和立即字节。前缀字节可以添加到几乎任何指令的前面。操作码字节决定有多少操作码字节以及指令是否可以具有操作数字节和立即数字节。操作码还可能表明存在位移字节。第一个操作数字节确定是否存在第二个操作数字节以及是否存在位移字节。

Intel 64 和 IA-32 架构软件开发人员手册中有下图显示了 x86 指令的格式：

用于解码 x86 指令的类似 Python 的伪代码如下所示：

# read possible prefixes

prefixes = []
while is_prefix(memory[IP]):
    prefixes.append(memory[IP))
    IP += 1

# read the opcode 

opcode = [memory[IP]]
IP += 1
while not is_opcode_complete(opcode):
    opcode.append(memory[IP])
    IP += 1

# read addressing form bytes, if any

modrm = None
addressing_form = []    
if opcode_has_modrm_byte(opcode):
    modrm = memory[IP]
    IP += 1
    if modrm_has_sib_byte(modrm):
        addressing_form = [modrm, memory[IP]]
        IP += 1
    else:
        addressing_form = [modrm]

# read displacement bytes, if any

displacement = []
if (opcode_has_displacement_bytes(opcode)
    or modrm_has_displacement_bytes(modrm)):
    length = determine_displacement_length(prefixes, opcode, modrm)
    displacement = memory[IP : IP + length]
    IP += length

# read immediate bytes, if any

immediate = []
if opcode_has_immediate_bytes(opcode):
    length = determine_immediate_length(prefixes, opcode)
    immediate = memory[IP : IP + length]
    IP += length

# the full instruction

instruction = prefixes + opcode + addressing_form + displacement + immediate

上述伪代码遗漏的一个重要细节是指令长度限制为 15 个字节。可以构造 16 字节或更长的有效 x86 指令，但此类指令在执行时将生成未定义操作码 CPU 异常。（我还遗漏了其他细节，例如如何在 Mod R/M 字节内部编码操作码的一部分，但我认为这不会影响指令的长度。）

然而，x86 CPU 实际上并不像我上面描述的那样解码指令，它们只是解码指令，就好像它们一次读取每个字节一样。相反，现代 CPU 会将整个 15 个字节读入缓冲区，然后并行解码字节（通常在一个周期内）。当它完全解码指令、确定其长度并准备好读取下一条指令时，它会转移缓冲区中不属于指令的剩余字节。然后，它读取更多字节以再次将缓冲区填充到 15 个字节，并开始解码下一条指令。

现代 CPU 会做的另一件事是推测性地执行指令，这不是我上面所写的内容所暗示的。这意味着 CPU 将解码指令并尝试在执行完前面的指令之前尝试执行它们。这反过来意味着 CPU 可能最终会解码 RET 指令之后的指令，但前提是它无法确定 RET 将返回到哪里。由于尝试解码和暂时执行不打算执行的随机数据可能会导致性能下降，因此编译器通常不会在函数之间放置数据。尽管他们可能会用永远不会执行的 NOP 指令填充此空间，以便出于性能原因对齐函数。

（他们很久以前就在函数之间放置只读数据，但这是在可以推测执行指令的 x86 CPU 变得普遍之前。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

考虑到指令具有不同的长度，CPU 如何知道下一条指令应该读取多少字节？的相关文章

LDR指令如何将常量加载到寄存器中？

我刚刚读了一本ARM指令书看到一条指令我无法解释 It says LDR将 32 位常量加载到r0登记 LDR r0 pc const number 8 pc const number DCD 0xff00ffff 我不明白什么 pc c
为什么 NASM 在使用有效的指令助记符作为操作数中的符号名称方面没有问题？

我编写了以下简单程序但 nasm 拒绝编译它 section text global start start mov rax 0x01 mov rdi 0x01 mov rsi str mov rdx 0x03 syscall mov r
x86 汇编乘法和除法指令操作数，16 位及更高

我对 x86 汇编中的乘法和除法运算如何工作感到相当困惑例如下面的代码看起来并不太困难因为处理的是 8 位 8 位乘法 User Input num1 20 num2 15 mov ax num1 moves the 8 bits i
Linux 内核中是否使用了扩展指令集（SSE、MMX）？

好吧它们带来至少应该带来性能的巨大提升不是吗所以我还没有看到任何 Linux 内核源代码但很想问它们是否以某种方式被使用在这种情况下对于没有此类指令的系统必须有一些特殊的代码上限 SSE 和 MMX 指令集在音频视
编译器在函数名称前添加下划线前缀的原因是什么？

当我看到 C 应用程序的汇编代码时如下所示 emacs hello c clang S O hello c o hello s cat hello s 函数名称以下划线作为前缀例如callq printf 为什么这样做以及它有什么优点
使用`esp*scale 时寻址内存时出错

内存寻址一般形式发现了here https stuff mit edu afs athena project rhel doc OldFiles 3 rhel as en 3 i386 memory html is base index
为什么我可以访问寄存器中较低的双字/字/字节，但不能访问较高的双字/字/字节？

我开始学习汇编程序这对我来说看起来不合逻辑为什么我不能在寄存器中使用多个高字节我明白了历史原因rax gt eax gt ax 所以让我们关注new64 位寄存器例如我可以使用r8 and r8d 但为什么不呢r8dl and r
如何创建一个扩展为“(x+y*240)*2”这样的表达式的 GNU GAS 宏？

我正在使用 GAS 为 ARM Linux 构建一个程序但我想做一些宏以使我的开发更加智能然后我想知道我怎样才能为此做一个宏 x y 240 2 were x and y are int 将像这样使用 mov r0 MACRO SHO
MS-DOS - 是否可以对 24 位图形进行编程？

是否可以在 DOS 机器上以 24 位颜色深度进行编程我知道 VGA 支持 8 位色深但是有没有办法弄出 24 位色深谷歌的研究没有发现任何结果我正在 FreeDOS 而不是 MS DOS 上编程如果这会影响答案的话对的这是可
是否可以调用驻留在 exe 中的非导出函数？

我想调用驻留在第 3 方 exe 中的函数并获取其结果好像有should是一种方法只要我知道函数地址调用约定等但我不知道如何有谁知道我会怎么做我意识到任何解决方案都是非标准的黑客但有must成为一种方式我的非恶意用例我正在
当我尝试在 Armv8 程序集中分配数组时，执行冻结

所以我正在用汇编语言进行编程这只是一个简单的代码这样我就可以学习如何分配数组以便稍后在 NEON 编程中使用它们 ASM FUNC FPE data balign 8 array skip 80 array1 word 10 20 3
在LPC2148 ARM处理器上创建中断向量的汇编代码

我最近刚刚开始使用 LPC2148 ARM 处理器我试图理解一些有关创建中断向量的汇编代码这是代码 Runtime Interrupt Vectors Vectors b start reset start ldr pc undf un
如果没有按下任何键，则检查按键而不阻塞

我正在创建一个应用程序来查看当前时间并创建了一个循环来每秒更新时间循环看起来像这样 UPDATE The code to be re executed JMP UPDATE 但我无法结束它当我使用 MOV AH 00H INT 21H
段寄存器如何参与内存地址转换？

到目前为止我所学到的有关细分的知识虚拟地址包含段选择器和偏移量段选择器与GDTR配合使用查找段描述符的线性地址段描述符保存有关所选段的信息包括其线性地址所以我的问题是根据我所读到的内容虚拟地址被加载到段寄存器中然后以某种
GCC 从 C++ 程序生成的汇编代码中的 .cfi 和 .LFE 是什么？

我有以下 C 代码 int factorial int n if n 0 return 1 return n factorial n 1 int main void factorial 5 return 0 当我使用 g S Factori
2022年Android CPU架构分布（armeabi-v7a vs arm64-v8a）

有没有关于 2022 年 Android 设备上的架构使用情况的官方信息我有一个支持armeabi v7a 和arm64 v8a 的应用程序我想要放弃对armeabi v7a的支持并且仅支持 64 位设备 arm64 v8a 但我找不到
计算 [1..N] 中前导 1 下面有 K 个零位的整数？（没有 HW POPCNT 的连续范围的 popcount）

I have following task Count how many numbers between 1 and N will have exactly K zero non leading bits e g 710 1112 will
Visual Studio：如何正确构建和指定 x64 和 x86 的配置和平台

使用 Visual Studio 2012 Professional 和 Ultimate 以及所有最新更新如何正确指定配置和平台以正确构建 x86 和 x64 当您第一次创建 Winforms 应用程序时 Visual Studio 会
是否有必要每个机器码只能映射到一个汇编代码？

假设这两者本质上是相同的 push 1 and 0x1231 这表示每个汇编指令都映射到一个机器代码但是否每个机器码只能映射到一个汇编代码呢 MIPS汇编语言有几个伪指令例如 move 在内部只是一个带有隐式 0 操作数的 add
在汇编中使用 printf 会导致管道传输时输出为空，但可以在终端上使用

无输出 https stackoverflow com questions 54507957 printf call from assembly do not print to stdout即使在终端上当输出不包含换行符时也有相同的原因

随机推荐

显示喜欢项目列表中的项目的用户

我认为这是一个不切实际的问题但我想得到一些反馈来确认我有一个产品和用户数据库用户可以在其中喜欢产品喜欢的数据存储在仅包含 pid 和 uid 的参考表中客户请求是显示喜欢产品列表中每个产品的 3 位用户问题是不可能在产品列表的
Chrome/Webkit 中的 CSS 动画/缩放问题

此效果在 FF 中运行良好但在 Chrome 中则不然 Chrome 中的 Firebug 结果显示 webkit animation 未在 Chrome 中呈现然而在 Firefox 中您会在对象入口处看到拉伸效果在 Chr
使用 ICS 更改 wifi 网络时，ErrnoException：isConnected 失败：EHOSTUNREACH（没有到主机的路由）

在 ics 上使用我的应用程序时将 wifi 网络从网络更改为网络后所有图像请求都开始返回但出现异常异常失败 gt org apache http conn HttpHostConnectException Connection t
使用 Scanner 的 nextLine() 和 hasNextLine() 方法时出现问题

我有一个包含以下数据的日志文件最短路径 2 RV3280 RV0973C RV2888C最短路径 1 RV3280 RV2502C最短路径 2 RV3280 RV2501C RV1263最短路径 2 RV2363 Rv3285 RV328
Windows 服务如何以标准时间间隔启动应用程序？

顾问设置 Windows 服务来运行应用程序该应用程序应该每 15 分钟运行一次该应用程序根本没有运行并且服务似乎运行良好我不熟悉应用程序作为服务运行时如何以标准间隔运行该服务使用 SRVANY EXE 工具任何使用 SRVAN
mysql删除重复数据

这向我显示了所有具有完全相同的两个条目的名字和姓氏 SELECT firstname lastname COUNT AS Count FROM people GROUP BY firstname lastname HAVING Count
尝试运行 Strapi 会出现模块解析错误

我正在尝试通过 Ubuntu 20 04 上的 npm 使用 npm rundevelop 运行一个 Strapi 项目该代码来自我的一个小组项目没有其他人遇到这些问题 Error cache plugins strapi plugin
带有 goto 命令的 Windows 批处理文件不起作用

我对 GOTO 命令和附属标签有疑问事实给定文件夹中的一堆文件它们是日志错误我需要打开它们并检查它们是否包含特定字符串如果是则从文件名中删除一些字符最后一次出现之后的所有字符包括其本身并执行其他操作为了切断字符我以循
F# 缺少类型约束

在以下代码中请注意 get Zero 的类型约束 type Wrapper lt t gt Data t let compute lt t when t static member get Zero unit gt t and t sta
nodejs Route.get() 需要回调函数但得到一个 [object String]

我开始使用带有express的nodejs进行编码所以我在我的文件 test js 中执行了此操作该文件位于我的文件夹中 const express require express const router new express Ro
每组查询的前 3 个值 MS Access

我是 MS Access 的新手我正在尝试进行一个查询该查询将根据分数提取 3 个不同类别中的前 3 名人员即期望的结果是 Child s name Membership Type Total Points Jon Snow Seni
无法在特定 div 上滚动来触发 jquery 函数

简短版本这有效 document on click Container function 这不会 document on scroll Container function 长版很抱歉发布代码片段是不可行的因为它是一个复杂的类似应用
类中的部分评估类型

这是我提出的问题的具体版本here https stackoverflow com questions 60072003 reordering type parameters in haskell 我有一个算法可以产生一些输出并且可以产
使用鼠标选择要捕获的区域

我正在制作一个基于Java的屏幕截图应用程序当您按下键盘上的组合键时我想这样做这个视频 http www youtube com watch v bJ6VbbpQ0XY发生在您在屏幕上选择区域的位置并且它会拍摄所选区域的屏幕截图如何
Google 搜索查询中参数的含义？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有没有关于 Google 查询中的参数含义的资源有没有分析过 Google 搜索页面的内部运作方式例子是 http www googl
如何使用eclipse进行C#开发？ [复制]

这个问题在这里已经有答案了可以使用eclipse进行C 开发吗如果可以的话该怎么办呢您最喜欢的组合是什么虽然我见过一些半成品的插件但我不相信有任何东西可以做到这一点close到 Eclipse 中的 Java 工具如果您使用的
使用 jquery-1.4.1.js 访问被拒绝

我正在使用 VS2010 和 jquery 1 4 1 js 版本我尝试访问 WCF 服务但出现奇怪的错误访问被拒绝 in jquery 1 4 1 js在页码处4982 jquery 1 4 1 js Open the socket
清除控制台缓冲区

我正在 VS2008 中编写一个示例控制台应用程序现在我有一个Console WriteLine 在屏幕上显示输出的方法然后有Console ReadKey 等待用户结束应用程序 If I press Enter while the C
如何从服务类调用组件方法 - Angular

我试图从服务类调用组件方法但收到类似错误类型错误无法读取未定义的属性测试的错误但是我遇到了类似的问题但主要解释了组件到组件的调用所以我没有正确理解例子测试组件 ts Component selector componen
考虑到指令具有不同的长度，CPU 如何知道下一条指令应该读取多少字节？

所以我正在读一篇论文其中他们说静态反汇编二进制代码是不可判定的因为一系列字节可以用多种可能的方式表示如图所示其 x86 所以我的问题是那么CPU是如何执行这个的呢例如在图中当我们到达 C3 之后时它如何知道下一条指令应该读

考虑到指令具有不同的长度，CPU 如何知道下一条指令应该读取多少字节？

考虑到指令具有不同的长度，CPU 如何知道下一条指令应该读取多少字节？ 的相关文章

随机推荐

热门标签

考虑到指令具有不同的长度，CPU 如何知道下一条指令应该读取多少字节？的相关文章