驱动程序如何使用 MONITOR 指令（_mm_monitor 内在函数）？

2024-03-18

我正在探索使用MONITOR指令（或等效的内在指令，_mm_monitor）。尽管我找到了描述它们的文献，但我找不到任何关于如何使用它的具体示例/样本。

任何人都可以分享如何在驱动程序中使用该指令/内在的示例吗？本质上，我想用它来观察内存范围。

The monitor http://x86.renejeschke.de/html/file_module_x86_id_175.html instruction arms the address monitoring hardware using the address specified in RAX/EAX/AX.^{Quote from Intel}
The state of the monitor is used by the instruction mwait.

使用的有效地址大小（16、32 或 64 位）取决于编码指令的有效地址大小（即可以用67h前缀，默认情况下它与代码大小相同）。

中给出的地址rax/eax/ax是逻辑地址的偏移部分，用于计算用于装备监视器的线性地址。
段部分是ds默认情况下，可以应用段覆盖前缀来更改段。
作为监视器使用的线性地址，分页不会影响监视。

The availability of the monitor (and mwait) instruction is indicated by the bit CPUID.01H:ECX.MONITOR[bit 3]¹.
It is a privileged instruction but Intel claims:

这些指令在大于 0 的级别上有条件地可用。

检测这种情况的建议方法是try执行monitor并处理最终的#UD异常（以操作系统将其报告给用户层程序的自定义方式）。

监控的地址范围must可回写缓存。
由于涉及缓存和缓存一致性子系统size地址范围以最小和最大大小给出。
CPUID.01H:EAX[位 15:0]给出最小范围大小。这是硬件监视器监视的区域的长度。
然而，缓存一致性流量可能适用于较大尺寸的“块”（行），并且如果后者包含在前者中，则与受监控区域相邻的写入仍然会触发它。
这产生了最大范围大小，可以在CPUID.01H:EBX[位 15:0].
要正确使用monitor确保监视的数据结构适合最小范围大小，但也确保没有代理在其旁边的地址中写入最大范围大小。

例如，如果最小范围大小为 8 个字节，最大大小为 16 个字节，请确保监视的结构适合 8 个字节，但用另外 8 个字节填充它以达到总共 16 个字节，这样就不会从第 8 个字节开始写入到第 16 个字节发生。

在单集群系统中，以上两个值是相等的。我的都是64字节。
BIOS 负责报告高速缓存一致性线大小IA32_MONITOR_FILTER_LINE_SIZE在多集群系统中。

为了指令排序和访问权的目的，monitor是一个负载。

monitor允许程序员指定hints and 扩展.
扩展名指定于ecx当提示出现时edx.
不支持的扩展会引发 #GP 异常，不支持的提示将被忽略。
我不知道有任何扩展或提示monitor，英特尔手册报告

对于奔腾 4 处理器（系列 15，型号 3），未定义扩展或提示。

我相信这条线总体来说是正确的，只是其中有一个过时的处理器型号。
此外，伪代码为monitor报告#GPIf ECX ≠ 0.

装备显示器而不检查其状态（使用mwait）不会造成任何伤害。

其内在本质是void _mm_monitor(void const *p, unsigned extensions,unsigned hints).

一旦监视器布防，它可以由不同的条件触发：

外部中断：NMI、SMM、INIT、BINIT、MCERR

故障、中止，包括机器检查

架构 TLB 失效，包括对 CR0、CR3、CR4 的写入和某些 MSR 写入

由于快速系统调用和远程调用而导致的自愿转换

屏蔽中断（如果启用）

监视地址范围内的写入

监视器的状态对程序员不可见，但可以使用以下命令进行测试mwait.
mwait进入实现定义的低功耗状态，直到监视器处于触发状态。
如果监视器未进入布防状态或已被触发mwait is a nop否则它会使处理器停止执行指令，直到触发监视器为止。

mwait也可以给出扩展 and hints.
扩展名设置在ecx并提示eax.
在撰写本文时，唯一的扩展是：

Bit 0即使被屏蔽（例如，即使 EFLAGS.IF=0），也将中断视为中断事件。仅当以下情况时才可设置CPUID.05H:ECX[位 1] = 1.
位 31-1预订的

这些提示让程序员可以指定实现定义的低功耗模式。

Bits 3:0C 状态内的子 C 状态，由位 [7:4] 指示
Bits 7:4目标C状态
值为0表示C1； 1表示C2等
01111B 的值表示 C0
注意：MWAIT 扩展的目标 C 状态是处理器特定的 C 状态，而不是 ACPI C 状态

C 模式的子状态数（因此是可用性）由下式给出：CPUID.05h.EDX:

位 03 - 00：使用 MWAIT 支持的 C0* 子 C 状态数。
位 07 - 04：使用 MWAIT 支持的 C1* 子 C 状态数。
位 11 - 08：使用 MWAIT 支持的 C2* 子 C 状态数。
位 15 - 12：使用 MWAIT 支持的 C3* 子 C 状态数。
位 19 - 16：使用 MWAIT 支持的 C4* 子 C 状态数。
位 23 - 20：使用 MWAIT 支持的 C5* 子 C 状态数。
位 27 - 24：使用 MWAIT 支持的 C6* 子 C 状态数。
位 31 - 28：使用 MWAIT 支持的 C7* 子 C 状态数。

请注意，将 CPU 置于高于 C1 的状态也会禁用其他线程，因此触发监视器的写入必须来自其他代理。

其内在本质是void _mm_mwait(unsigned extensions, unsigned hints).

The monitor/mwait引入机制是为了帮助线程之间的同步，但它不太适合监视对内存范围的访问，因为触发条件包括频繁发生的事件。
之后mwait始终强制检查监视范围是否已写入。
有一个例子在这里 https://software.intel.com/en-us/articles/how-to-use-the-monitor-and-mwait-streaming-simd-extensions-3-instructions其中模式如下：

监视的结构使用特定值（例如 0）进行初始化。
The monitor/mwait使用对。
在稍后的某个时刻，另一个再次将特定值（例如 1）写入所监视的结构中。
监视器被触发并且mwait“返回”，将监视的结构值与 1（发生写入）进行比较，如果不相等，则执行跳回 2。

一些样本，untested伪代码可能是：

struct MonitoredType
{
  int (*event)(struct MonitoredType const* m);              /*Return 0 to keep monitoring*/
  struct AnyType data;                                /*Less, in size, than MIN_MONITOR_RANGE*/
  char padding[MAX_MONITOR_RANGE - sizeof(AnyType)];
};

void wait_for_write(struct MonitoredType const* m)
{
   /* This may miss a write if it happens before MONITOR, beware of race conditions if necessary */
   do
   {
     _mm_monitor(&m->data, 0, 0);
     _mm_mwait(0, 0);
   } while ( ! m->event(m));
}

必须注意确保退出条件mwait是一次写入，而不是其他事件之一。
这就是函数指针的原因event.

为了监视对线性地址的写入/读取，可以使用以下替代方法：调试寄存器.
参见第 17 章英特尔手册3 https://www.intel.com/content/www/us/en/architecture-and-technology/64-ia-32-architectures-software-developer-system-programming-manual-325384.html并检查操作系统文档以正确使用这些寄存器。

¹ Meaning: Execute cpuid with eax set to 01h and test the bit 3 of ecx afterward. Note that IA32_MISC_ENABLE allows the OS or the firmware to disable monitor/mwait.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

驱动程序如何使用 MONITOR 指令（_mm_monitor 内在函数）？的相关文章

从 DX:AX 寄存器转移到单个 32 位寄存器

我在添加 16 位乘法的乘积时遇到问题我想将一年例如 2015 年乘以 365 为此我 mov dx 0 to clear the register mov ax cx cx holds the year such as 2015
termios 库中如何表示标志？

我是 C 语言和驱动程序编程的新手目前我正在编写一个用户空间驱动程序以便使用 Debian 通过 USB 与 RS232 进行通信在研究时我遇到了以下代码 tty c cflag PARENB No Parity tty c cf
对将英特尔傲腾 DC SSD 用作 IMDT 的额外 RAM 感到困惑吗？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我对英特尔傲腾 DC 有点困惑我希望我的 Optane DC 能够同时充当 DRAM 和存储一方面我了解到只有英特尔傲腾 DC 持
比“add esp, 4”更小的指令

又是我我的程序中有很多 add esp 4 我正在尝试减小它的大小是否有任何更小的指令可以替代 add esp 4 pop edx 或者您不介意破坏的任何其他整数寄存器这就是现代编译器实际上所做的 https stackoverflo
为什么 mov %ax, %ds 汇编+反汇编为 mov %eax,%ds，与原来不一致？

test S text global start start xor ax ax mov ax ds mov ax ss mov ax es mov ax fs mov ax gs 我通过这样做得到了反汇编代码文件 x86 64 elf g
x86 asm 图形设置的分辨率高于 640x480？

我刚刚开始使用汇编语言感觉像学习新东西并且遇到了一些问题到目前为止我一直在浏览的所有教程都没有回答或者太旧而无法知道 1 我尝试了一些搜索也许我只是不知道正确的关键字但我找不到用于更改屏幕分辨率等的图形模式的更新列表我发现的
无法在 Windows 7 上安装 Android USB 驱动程序

所以我想使用我的新 Nexus 5 来调试我的应用程序我尝试通过以下方式安装 Android USB 驱动程序装置经理 http developer android com tools extras oem usb html Win7但我
如何使 gcc 为 -fpatchable-function-entry 发出多字节 NOP？

gcc确实有能力使用多字节用于对齐循环和函数的 NOP 然而当我尝试 fpatchable function entry option https gcc gnu org onlinedocs gcc Instrumentation Opt
x86：寄存器操作为内存内容和内存地址？

寄存器 gt 内存地址 gt 内存内容内存地址 gt 内存内容上面的模型正确吗而且如果是的话你能建议我是否认为正确吗 movl eax ebx gt 它将 eax 的内存地址移动到 ebx 这也会导致内容移动 movl eax e
跳转目的地太远：3 个字节

我的循环有问题其中包含的代码很长并且给了我错误jump destination too far by 3 byte s 当我删除时 mov edx offset str1 call writestring 这部分位于主过程下方它不会给出
如何使用 LOCK ASM 前缀来读取值？

我知道如何使用 LOCK 来线程安全地递增一个值 lock inc J 但是如何以线程安全的方式读取 J 或任何值 LOCK 前缀不能与 mov 一起使用如果我执行以下操作 xor eax eax lock add eax J mov J
如何使用存储在 x64 位置的 x64 内存地址进行跳转？

据我所知使用 64 位地址作为操作数的 jmp 是不可能的但我相信使用 x64 内存位置是来自here http www tptp cc mirrors siyobik info instruction JMP htmlJMP r m
给寄存器赋值并加减

我对此完全迷失了我需要使用寄存器来计算以下表达式的编程 varA varA varB varC varD 其中 varA varB 等是变量将整数值分配给上述变量的 EAX EBX ECX 和 EDX 寄存器这意味着您可以对输入进行
使用`esp*scale 时寻址内存时出错

内存寻址一般形式发现了here https stuff mit edu afs athena project rhel doc OldFiles 3 rhel as en 3 i386 memory html is base index
调用/返回/jmp等后x86代码执行？

我希望这个问题不会太愚蠢因为它看起来似乎很明显当我对缓冲区溢出进行一些研究时我偶然发现了一个简单的问题调用返回跳转后转到新指令地址后 CPU是否会执行该地址处的OP代码然后将一个字节移动到下一个地址并执行下一个OP代码依此类
MS-DOS - 是否可以对 24 位图形进行编程？

是否可以在 DOS 机器上以 24 位颜色深度进行编程我知道 VGA 支持 8 位色深但是有没有办法弄出 24 位色深谷歌的研究没有发现任何结果我正在 FreeDOS 而不是 MS DOS 上编程如果这会影响答案的话对的这是可
是否可以调用驻留在 exe 中的非导出函数？

我想调用驻留在第 3 方 exe 中的函数并获取其结果好像有should是一种方法只要我知道函数地址调用约定等但我不知道如何有谁知道我会怎么做我意识到任何解决方案都是非标准的黑客但有must成为一种方式我的非恶意用例我正在
如何检查docker中当前/默认的日志驱动程序？

我正在尝试检查已停止的 docker 容器的日志但是当我这样做时docker logs
汇编程序中的过程调用如何工作？

我刚刚开始摆弄 ASM 我不确定我对过程调用的理解是否正确假设代码中的某个时刻有一个过程调用 call dword ptr 123 该过程仅包含一个命令 ret ret 0004 该过程调用的效果是什么返回值将存储在哪里我在某处读到
我们可以使用 x86_64 CPU 原子在 PCI Express 上生成复合原子操作吗？

如您所知从2 0版本开始 PCI Express支持复合原子操作 FetchAdd Swap CAS https pcisig com sites default files specification documents ECN Ato

随机推荐

如何使用Javascript来操作模态内容？

我正在使用 bootstrap modals 和 Ruby on Rails 我能够很好地显示模式但在使用 Javascript 操作模式内容时遇到问题我不确定我做错了什么但我根本无法使用 Javascript 来影响模态的内容以至
Flutter - 使用正则表达式验证电话号码

在我的 Flutter 移动应用程序中我尝试使用以下方法验证电话号码regex 以下是条件电话号码必须包含 10 位数字如果我们使用国家代码它可以是 12 位数字示例国家代码 12 012 数字之间不允许有空格或字符简而言之这
Rbenv 未使用正确的版本

在我的 Rails 项目中当我尝试运行时bundle install 我收到以下错误 Your Ruby version is 2 3 7 but your Gemfile specified 2 5 3 然而当我跑步时ruby ver
quarkus-arc 不满足依赖问题

这是我的资源类带有存储库注入 Path posts Produces MediaType APPLICATION JSON Consumes MediaType APPLICATION JSON public class PostsRes
无法从资源 Books.hbm.xml 解析映射文档

当我尝试使用 hibernate 将对象保存在数据库中时为什么会出现 hibernate invalidmappingexception 书籍 hbm xml 在资源文件夹内
如何使用 Bower 安装仓库的最新（未标记）状态？

我有一个very小型仓库我在主分支中完成所有开发工作并使用标签作为历史中的稳定点我想默认情况下 Bower 似乎会获取最新的tagged回购协议的版本我正在尝试获取主分支中的最新提交我尝试过以各种可以想象的顺序运行所有这些 b
使用 CQRS 的读取端实现方法

我已经转移到积极使用 CQRS 事件源的项目乍一看它是按照所有这些书籍和博客来实现的但最后我意识到实现中到底有什么问题 Here is CQRS architecture 这张照片最初是我从here http cre8ivethough
Java 包和编译（为什么，而不是如何）

我正在 eclipse 中编写一些 Java 代码代码包含在一个名为Adder 在 Eclipse 中位于包中org processing 类文件中的第一件事是行 package org processing Q1 这条线到底在做什么为
如何在powershell中选择带有特殊字符的键？

我有一组来自 JSON 文件的键值对 p dependencies architect architect 5 7 0 architect functions 3 0 4 assert 1 4 1 bcrypt 3 0 6 find pa
无法加载资源：服务器响应状态为 404（未找到）

我无法解决我的链接问题你能帮忙链接 CSS 和 JS 文件吗 CSS JS Error Failed to load resource t
Python 是否有类似 PHP 中 getimagesize 的函数？

我搜索了一段时间有一个函数调用 get image dimensions 但是据我了解它适用于下载的或本地的图像那么有没有像 PHP 中的 getimagesize 这样的函数或解决方案我们可以通过 URL 而不是本地路径来获取
如何创建三角形背景？

如上图所示背景中有一些颜色相似但深浅不同的三角形我设法得到了相同的颜色 4C27B3 https codepen io JoyFulCoding pen EzXowL https codepen io JoyFulCoding pen
Spark：同时从具有不同内存/核心配置的单个 JVM 作业启动

问题解释假设您有带有独立管理器的 Spark 集群其中作业通过SparkSession在客户端应用程序中创建客户端应用程序在 JVM 上运行为了提高性能您必须使用不同的配置启动每个作业请参阅职位类型示例 below 问题是您无法
尝试使用 TeamCity 8 部署 SSDT 项目时文件名无效

我正在尝试使用 TeamCity 8 和 MSBuild Publish 任务将 Visual Studio 2012 SSDT 项目部署到 Sql Server 但部署失败当我查看 TeamCity 日志并在构建配置中使用 v diag
调整 UILabel 的高度以适合文本

我的 Cell 子类中有 UILabel 它应该有一个标题标题的大小可以是各种长度因此我需要调整 UILabel 的大小以适合文本并防止文本太长我还需要能够设置 maxHeight 宽度应该相同如何在 tableViewCell 子
了解 DART 中的递归函数

我无法理解这个递归函数的代码我是 DART 编程新手我了解递归函数的作用但我在理解编程语法时遇到问题 int sum List
具有通用签名的接口中的静态方法

从 Java 8 开始您可以在接口中实现默认或静态方法如下所示 public interface DbValuesEnumIface
numpy object_数组中最长的字符串

我使用 numpy object 数组来存储可变长度字符串例如 a np array hello world dtype np object 有没有一种简单的方法可以找到数组中最长字符串的长度而无需循环遍历所有元素 max a key
React Native 与 Context API 警告：“允许要求循环，但可能导致未初始化的值......”

当我在我的 Expo React Native 项目中使用 React 的 Context API 时收到此警告允许要求循环但可能会导致未初始化的值考虑重构以消除对循环的需要我在 App tsx 中创建一个上下文 import S
驱动程序如何使用 MONITOR 指令（_mm_monitor 内在函数）？

我正在探索使用MONITOR指令或等效的内在指令 mm monitor 尽管我找到了描述它们的文献但我找不到任何关于如何使用它的具体示例样本任何人都可以分享如何在驱动程序中使用该指令内在的示例吗本质上我想用它来观察内存范围 T

驱动程序如何使用 MONITOR 指令（_mm_monitor 内在函数）？

驱动程序如何使用 MONITOR 指令（_mm_monitor 内在函数）？ 的相关文章

随机推荐

热门标签

驱动程序如何使用 MONITOR 指令（_mm_monitor 内在函数）？的相关文章