在 x86-64 CPU 上通过交叉修改代码重现意外行为

2024-05-07

Question

对于可能在 x86 或 x86-x64 系统上触发意外行为的交叉修改代码有哪些想法，在这些系统中，交叉修改代码中的所有操作均已正确完成，但在执行处理器之前执行序列化指令除外修改代码？

如下所述，我有一个 Core 2 Duo E6600 处理器进行测试，它被明确提到是一个容易出现相关问题的处理器。我将在这台机器上测试与我分享的任何想法并提供更新。

背景

在 x86 和 x64 系统上，编写交叉修改代码的官方指南是执行以下操作：

; Action of Modifying Processor
Store modified code (as data) into code segment;
Memory_Flag ← 1; 

; Action of Executing Processor
WHILE (Memory_Flag ≠ 1)
  Wait for code to update;
ELIHW;
Execute serializing instruction; (* For example, CPUID instruction *)
Begin executing modified code;

对于某些处理器，在勘误表中明确提到了序列化指令的必要性。例如，Intel Core 2 Duo E6000 系列有以下勘误：（来自http://www.mathemainzel.info/files/intelX6800andintelE6000.pdf http://www.mathemainzel.info/files/intelX6800andintelE6000.pdf)

一个处理器或系统总线主控器将数据写入当前正在执行第二个处理器的代码段，其目的是让第二个处理器执行该数据作为代码称为交叉修改代码 (XMC)。不强制第二个的XMC 处理器在执行之前执行同步指令新代码称为非同步 XMC。

软件使用非同步XMC修改指令字节处理器的流可能会出现意外或不可预测的执行正在执行修改后的代码的处理器的行为。

有一些猜测是，如果不使用序列化指令，为什么会出现意外的执行行为？http://linux.kernel.narkive.com/FDc9TB0d/patch-linux-kernel-markers http://linux.kernel.narkive.com/FDc9TB0d/patch-linux-kernel-markers:

当 i-fetch 完成并且微操作处于跟踪中时缓存然后原始之间不再有直接关联机器指令边界和微操作。这是因为优化。例如（出于说明目的而人造的）：

移动eax,ebx

mov内存，eax

移动eax,1

（使用英特尔符号而不是 ATT - 习惯的力量）

在跟踪缓存中，不会有微操作来用 ebx 更新 eax。

动态地将“mov eax,ebx”更改为“mov ecx,ebx”会使优化的跟踪缓存，因此唯一的资源是 GPF。如果修改不会使跟踪缓存无效，然后没有 GPF。这问题是：“当跟踪缓存发生时，我们能否预测情况？没有被无效”，并且一般来说答案是否定的，因为微架构不公开。但可以猜测，修改带有中断指令的单字节操作码 - int3 - 不造成无法处理的不一致。这就是英特尔确认的。继续存储int3，无需同步（即强制刷新跟踪缓存）。

还有更多信息https://sourceware.org/ml/systemtap/2005-q3/msg00208.html https://sourceware.org/ml/systemtap/2005-q3/msg00208.html:

当我们意识到这一点时，我与英特尔进行了长时间的讨论微架构的家伙。事实证明，这个错误的原因（顺便说一下，英特尔不打算修复）是因为跟踪缓存 - 由指令产生的微指令流解释 - 不能保证有效。之间的阅读我认为这个问题的出现是因为在跟踪缓存，不再可能识别原始的指令边界。如果 CPU 发现跟踪缓存由于不同步的交叉修改而已失效指令执行将通过 GPF 中止。进一步讨论与英特尔透露，用 int3 替换第一个操作码字节不会受到此勘误的影响。

除了我在这里发布的内容之外，我在互联网上看到的关于这个问题的信息并不多。此外，我还没有发现任何公开的例子表明人们在 x86 和 x86-64 系统上使用交叉修改代码时因未能执行序列化指令而被咬。

我有一台运行 Intel Core 2 Duo E6600 处理器的计算机，该处理器被明确记录为容易出现此问题，并且我有not能够编写触发此问题的代码。

编写代码来执行此操作对我来说是一种个人好奇心。在生产代码中，我只是遵循规则，但我认为在重现这一点时我可能需要学习一些东西。

想象一个具有很长的处理器指令流水线 http://en.wikipedia.org/wiki/Instruction_pipeline其中寄存器和内存仅在最后一个流水线阶段修改。当您为此处理器编写自修改代码并修改内存中已存在于管道中的指令时，修改将无效。在这种情况下，程序的行为取决于处理器的管道有多长。

为了使具有更长管道的新处理器的行为与旧型号完全相同，英特尔处理器包含一种机制，可以在检测到这种情况时刷新（清空）管道。刷新后，修改后的代码将被提取到管道中，因此新处理器的行为与旧处理器完全相同。

序列化指令是刷新管道的另一种方法。当它到达管道末端时，管道被刷新并在串行化指令之后再次开始获取。

因此，勘误表本质上是说，某些处理器模型不会检查来自其他处理器的写入是否会覆盖已在其管道中执行的指令。该检查仅适用于本地写入，不适用于外部写入。但是，如果插入序列化指令，则会强制处理器刷新管道，一切都会按预期运行。

要重现勘误表中描述的行为，您需要确保从一个处理器修改的代码位于另一个处理器的管道内。看一下分支预测（决定哪个代码路径位于管道内）和同步原语。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 x86-64 CPU 上通过交叉修改代码重现意外行为的相关文章

Haskell 中多核编程的现状如何？

Haskell 中多核编程的现状如何现在有哪些项目工具和库可用有哪些经验报道 2009年至2012年期间发生了以下事件 2012 从 2012 年开始并行 Haskell 状态更新开始出现在并行 Haskell 摘要 http w
当一种语言是另一种语言的平行超集时，这意味着什么？

我正在阅读关于实时并发 C 的期刊文章 http link springer com article 10 1007 2FBF00365999 并且它在摘要中提到因此你们中的任何人都可以通过该链接查看上下文 Concurrent C 是
x86 asm 图形设置的分辨率高于 640x480？

我刚刚开始使用汇编语言感觉像学习新东西并且遇到了一些问题到目前为止我一直在浏览的所有教程都没有回答或者太旧而无法知道 1 我尝试了一些搜索也许我只是不知道正确的关键字但我找不到用于更改屏幕分辨率等的图形模式的更新列表我发现的
将以下机器语言代码（0x2237FFF1）翻译成MIPS汇编

到目前为止我已经翻译了这段代码但我不明白的是如何计算计算 16 位立即地址的数量 0x2237FFF1 转为二进制 0010 0010 0011 0111 1111 1111 1111 0001 现在我正在读取操作码 001000 并知
在后台线程上搜索

我试图在 iPhone 应用程序中搜索数千个对象但是搜索严重滞后每次击键后 UI 都会冻结 1 2 秒为了防止这种情况我必须在后台线程上执行搜索我想知道是否有人有一些在后台线程上搜索的提示我读了一点NSOperation并在网上
无论线程如何，对象是否总是能看到其最新的内部状态？

假设我有一个带有简单整数计数变量的可运行对象每次可运行对象运行时该变量都会递增该对象的一个实例被提交以在计划的执行程序服务中定期运行 class Counter implements Runnable private int coun
如何构建gcc multilib工具链？

我正在尝试在新安装的 ubuntu 14 04 的 AMD64 版本上构建 gcc multilib 工具链它只有 x86 64 gcc 和 g 安装没有 multilib 支持我的配置行是 configure disable che
Java HashSet 是线程安全的只读吗？

如果我通过 Collections unmodifyingSet 运行 HashSet 实例后它是线程安全的吗我问这个是因为 Set 文档声明它不是但我只是执行读取操作来自 Javadoc 请注意此实现不是同步的如果多个线程同时
INT 13h 无法读取超出特定扇区的数据

我正在为我的操作系统编写内核在将磁盘扇区加载到内存时遇到问题以下是从磁盘加载扇区的函数代码部分 mov ax 0x3000 mov es ax mov ax 0x0201 mov bx word ptr bp 6 bx 0x000 0x
+=、|=、&= 等是原子的吗？ [复制]

这个问题在这里已经有答案了修改运算符是这样的吗等等原子 I know 是原子的如果你执行x 同时在两个不同的线程中你总是会得到x增加了 2 而不是x x 1优化关闭我想知道是否variable constant 以及类似的东西
如何在汇编中使用 ReadString？

mov edx offset Prompt1 call WriteString mov ecx 32 mov edx offset String1 call ReadString 现在我该如何访问String1 如何将其移入寄存器以便对其
Java 空值检查

我有一个thread1 if object null object play 和另一个thread2可以写null into object随时参考我将同时运行这些线程我知道thread2可以重写object后参考null检查并会抛出Nu
在现代 x86-64 上计算 64 位整数的整数 Log10 的最快方法是什么？

标题我找到了大量 32 位示例但没有找到完整的 64 位示例使用这个帖子 https codegolf stackexchange com questions 47290 fastest way to compute order of
为什么 GCC 在堆栈上压入额外的返回地址？

我目前正在学习汇编的基础知识在查看 GCC 6 1 1 生成的指令时遇到了一些奇怪的情况这是来源 include
Java 线程 JavaDoc

我编写了一个只能在特定线程上调用的方法是否应该将标准注释或注释添加到方法的 javadoc 中来表示这一点不知道有任何这样的标准注释 Java 并发实践 http www javaconcurrencyinpractice com 在第
微软怎么能说WinAPI中一个字的大小是16位呢？

我刚刚开始学习WinAPI 在MSDN中对WORD数据类型提供了以下解释 WORD16 位无符号整数范围是十进制 0 到 65535 该类型在 WinDef h 中声明如下 typedef 无符号短 WORD 很简单而且它与我一直在使
使用 volatile bool 强制另一个线程等待是否安全？（C++）

我读到的有关 volatile 的所有内容都说它永远不安全但我仍然倾向于尝试它而且我还没有看到这种特定场景被宣布为不安全我有一个单独的线程来渲染场景从主模拟线程中提取数据这没有同步并且工作正常问题是当程序退出时渲染器需要停
shell脚本中是否有互斥/信号量机制？

我正在 shell 脚本中寻找互斥信号量并发机制考虑以下情况除非 a 用户不关闭共享文件否则 b 用户应该无法打开更新它我只是想知道如何在 shell 脚本中实现互斥量信号量临界区等在 shell 脚本中实现锁定机制文
当内存排序放宽时，C++ 延迟会增加

我在 Windows 7 64 位 VS2013 x64 发行版上尝试内存排序我想使用最快的同步来共享对容器的访问我选择了原子比较和交换我的程序产生两个线程写入器推送到向量读取器检测到这一点最初我没有指定任何内存顺序所以我假
为什么 VC++ 编译器 MOV+PUSH args 而不是仅仅 PUSH 它们？ x86

在 VC 的反汇编中正在进行函数调用编译器在压入本地指针之前将其 MOV 到寄存器 memcpy nodeNewLocation pNode sizeCurrentNode 0041A5DA 8B 45 F8 mov eax dword

随机推荐

应用程序未运行时处理推送通知

当我的应用程序是not运行并收到推送通知如果我单击该通知应用程序将启动但随后它不会提示用户我设置的警报视图询问他们是否要查看通知的内容它刚刚启动就坐在那里推送通知确实有效完美当应用程序is正在运行无论是作为活动应用程序还是在
Rails 5 错误消息：子模型父模型必须存在

我有两个模型父模型是财产子模型是电话当尝试使用嵌套电话数据创建新的属性记录时我收到一条错误消息 Phones 属性必须存在我研究了 Rails Guide 和许多其他文档但没有确定原因如果你想查看所有代码这里有一个公共 gi
WampServer Hosts 文件不退出

我的 wamp 服务器安装后出现问题但是我的 wamp 服务器仍然正常但我可以知道如何纠正此错误吗错误如下文件 C WINDOWS system32 drivers etc hosts 不可写文件 C WINDOWS syste
在方法中使用 IncludeMultiple

我正在使用 Ladislav Mrnka 的扩展方法 public static IQueryable
在 Rust 程序意外退出期间注册要运行的函数的最佳方法是什么？

我正在用 Rust 创建一个终端文本编辑器编辑器将终端置于原始模式禁用字符回显等然后在退出时恢复原始终端功能然而编辑器存在一些错误并且由于无符号变量下溢等问题时不时地意外崩溃发生这种情况时将终端恢复到原始状态的清理代码永远
0xp0 打印 0.0（十六进制浮点文字）

我只是想知道为什么会编译既然它确实编译了那意味着什么 System out println 0xp0 p OUTPUT 0 0 The JLS http docs oracle com javase specs jls se7 html
从 HTML IFRAME 调用 JS 函数（均为 Web 资源）

我上传了两个网络资源 a HTML and b JS 在 HTML 文档中我有一个执行脚本的部分并且它按预期工作将加载上传到我的表单上的 IFRAME 中现在由于代码的大小我觉得需要重构它并且我想将一些方法从 HTML Web
如果公司使用 C++、C# 或 Java 作为应用语言，为什么还要学习 Perl、Python、Ruby？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想知道为什么 C C Java 开发人员想要学习动态语言假设公司不会将其主要开发语言从 C C Java 切换到动态语言那么动态
W3C TTML 计时属性说明

In W3C TTML dfxp 标准 http www w3 org TR ttaf1 dfxp content vocabulary div a div元素可以包含begin end and duration属性如何解释这些时序属性的
Android 崩溃报告 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
RMarkdown：浮动目录和开头目录

我想知道是否可以在文档开头有一个浮动目录和另一个浮动目录我目前的首要任务如下 title TEST author brettljausn date January 15 2018 output html document toc true
有没有办法像我们在bunyan CLI 中显示的那样显示winston 日志文件？

In Bunyan https github com trentm node bunyanlogger 我们可以看到这样的日志文件 tail f sample log bunyan并以彩色显示日志并漂亮地显示 json 对象但我找不到类似
Oracle：PL/SQL 中查看值是否存在的最快方法：列表、VARRAY 或临时表

UPDATE如果您想查看很长的原始问题请查看编辑这是问题的更清晰的简短版本我需要看看是否GroupA 不总是GroupA 这会改变每个循环迭代存在于大约 200 个组的列表数组临时表等等中如何存储这 200 个组完全由我
2013 年初的 glmer 模型：重新运行时有关收敛的警告消息

一年多前 2013年2月我曾使用过lmer使用以下命令运行涉及二项式结果的混合效应模型 nl3 lmer lt glmer cul bi food act where intlan inter cul via m via h 1 Id d
使用 MSAL 与 Angular 进行重定向_uri_mismatch Azure AD B2C

使用时loginRedirect or acquireTokenRedirect 我收到以下错误 redirect uri mismatch AADB2C90006 3a 请求中提供的重定向 URI http 3a 2f 2flocalho
docker 容器内的 Spring Boot 实时重新加载不起作用

我们有一个在 docker 容器内运行的 Spring boot gradle 项目该容器使用 docker 卷 Spring devtools 实时重新加载功能与以下属性一起使用 spring devtools restart enab
使用正则表达式标记化进行 NLP 词干提取和词形还原

定义一个函数名为performStemAndLemma 它需要一个参数第一个参数 textcontent 是一个字符串编辑器中给出了函数定义代码存根执行以下指定任务 1 对给出的所有单词进行分词textcontent 该单词应包含字
为什么使用初始化语法时不调用转换运算符，以及为什么 clang 错误消息看起来是错误的？

我有以下代码它使用显式转换构造函数构造一个对象 t2 该构造函数执行 t1 的隐式转换这是预期的并在 C 编程语言第三版的 11 4 1 节中进行了描述 include
NLog 配置为自动记录所有异常？

有没有办法配置 NLog 自动记录我的应用程序可以发送的所有异常目前我将访问所有 TRY CATCH 块并在 CATCH 中手动添加日志记录但如果我错过了一些怎么办如果将来其他人这样做怎么办有没有办法告诉 NLog 始终记录所有异
在 x86-64 CPU 上通过交叉修改代码重现意外行为

Question 对于可能在 x86 或 x86 x64 系统上触发意外行为的交叉修改代码有哪些想法在这些系统中交叉修改代码中的所有操作均已正确完成但在执行处理器之前执行序列化指令除外修改代码如下所述我有一个 Core 2 Duo

在 x86-64 CPU 上通过交叉修改代码重现意外行为

Question

背景

在 x86-64 CPU 上通过交叉修改代码重现意外行为 的相关文章

随机推荐

热门标签

在 x86-64 CPU 上通过交叉修改代码重现意外行为的相关文章