我应该如何以非 root 身份读取 Linux 上的 Intel PCI 非核心性能计数器？

2024-05-27

我想要一个库，允许对 Linux 可执行文件的关键部分进行“自我分析”。就像人们可以使用一个部分计时一样获取当日时间() http://linux.die.net/man/2/gettimeofday or RDTSC http://www.strchr.com/performance_measurements_with_rdtsc我希望能够对分支未命中和缓存命中等事件进行计数。

有许多工具可以做类似的事情（perf https://perf.wiki.kernel.org/index.php/Main_Page, PAPI http://icl.cs.utk.edu/papi/, likwid https://code.google.com/p/likwid/）但我还没有找到任何符合我要找的东西。 Likwid 最接近，所以我主要在寻找修改它现有的方法标记API https://code.google.com/p/likwid/wiki/LikwidPerfCtr#Using_the_marker_API.

每个核心计数器的值存储在 MSR（型号特定寄存器）中，但对于当前的 Intel 处理器（Sandy Bridge 以后），“非核心”测量（内存访问和与 CPU 整体相关的其他内容）可通过以下方式访问： PCI。

通常采取的方法是使用 MSR 来读取msr内核模块 http://man7.org/linux/man-pages/man4/msr.4.html，并且 PCI 计数器（如果支持）是从sysfs-pci https://www.kernel.org/doc/Documentation/filesystems/sysfs-pci.txt等级制度。问题是，这两个或这些都要求阅读器以 root 身份运行并具有“setcap cap_sys_rawio”。这对于许多用户来说很困难（或不可能）。

它也不是特别快。由于目标是分析小段代码，因此使用系统调用读取每个计数器的“偏差”很大。事实证明，普通用户可以使用 RDPMC 读取 MSR 寄存器。我还没有一个很好的解决方案来读取 PCI 寄存器。

一种方法是通过以 root 身份运行的“访问服务器”来代理所有内容。这可以工作，但会比使用 /proc/bus/pci 更慢（因此不太准确）。我试图找出如何最好地使计数器的 PCI“配置”空间对非特权程序可见。

我想到的最好办法是让服务器以 root 身份运行，客户端可以在启动时通过 Unix 本地域套接字连接到该服务器。作为 root，服务器将打开相应的设备文件，并且将打开的文件句柄传递给客户端 http://www.lst.de/~okir/blackhats/node121.html。然后，客户端应该能够在执行期间自行进行多次读取。有什么理由这行不通吗？

但即使我这样做，我仍然会使用pread() 系统调用 http://man7.org/linux/man-pages/man2/pread.2.html（或类似的东西）每次访问，其中可能有数十亿次。如果尝试对小于 1000 个循环部分进行计时，这可能会产生太大的开销。相反，我想弄清楚如何访问这些计数器内存映射 I/O http://en.wikipedia.org/wiki/Memory-mapped_I/O.

也就是说，我希望对内存中地址表示的每个计数器进行只读访问，I/O 映射发生在处理器和 IOMMU 级别，而不涉及操作系统。这在英特尔架构软件开发人员第 1 卷第 16.3.1 节内存映射 I/O http://www.intel.com/content/dam/www/public/us/en/documents/manuals/64-ia-32-architectures-software-developer-vol-1-manual.pdf.

这似乎几乎是可能的。在 proc_bus_pci_mmap() 中/proc/bus/pci 的设备处理程序 https://github.com/mirrors/linux/blob/HEAD/drivers/pci/proc.c似乎允许映射配置区域，但仅限根用户，并且仅当我有 CAP_SYS_RAWIO 时。

static int proc_bus_pci_mmap(struct file *file, struct vm_area_struct *vma)
{
        struct pci_dev *dev = PDE_DATA(file_inode(file));
        struct pci_filp_private *fpriv = file->private_data;
        int i, ret;

        if (!capable(CAP_SYS_RAWIO))
                return -EPERM;

        /* Make sure the caller is mapping a real resource for this device */
        for (i = 0; i < PCI_ROM_RESOURCE; i++) {
                if (pci_mmap_fits(dev, i, vma,  PCI_MMAP_PROCFS))
                        break;
        }

        if (i >= PCI_ROM_RESOURCE)
                return -ENODEV;

        ret = pci_mmap_page_range(dev, vma,
                                  fpriv->mmap_state,
                                  fpriv->write_combine);
        if (ret < 0)
                return ret;

        return 0;
}

因此，虽然我可以将文件句柄传递给客户端，但它不能 mmap() 它，而且我想不出任何方法与非后代进程共享 mmap 区域。

（最后，我们进入问题！）

因此，假设我确实希望在非特权进程中拥有一个指针，每次都可以从 PCI 配置空间中读取数据，而无需内核的帮助，我的选择是什么？

1）也许我可以让根进程打开/dev/mem，然后将该打开的文件描述符传递给子进程，然后子进程可以映射它想要的部分。但我想不出任何方法可以保证远程安全。

2）我可以编写自己的内核模块，它看起来很像linux/drivers/pci/proc.c，但省略了对通常权限的检查。由于我可以将其锁定，使其只读并且仅用于我想要的 PCI 空间，因此它应该相当安全。

3）？？？（这就是你进来的地方）

也许答案有点晚了。答案是使用likwid。正如您所说，读取 MSR/sysfs-pci 必须由 root 完成。构建 likwid accessDaemon 并赋予其访问 MSR 的权限将绕过此问题。当然，由于某些进程间通信，性能值可能会有一些延迟。这个延迟不是很高。
（对于小代码段，性能计数器在某种程度上、以任何方式都是不精确的。）

Likwid 还可以处理非核心事件。最好的

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

我应该如何以非 root 身份读取 Linux 上的 Intel PCI 非核心性能计数器？的相关文章

我如何才能等待多个事情

我正在使用 C 11 和 stl 线程编写一个线程安全队列 WaitAndPop 方法当前如下所示我希望能够将一些内容传递给 WaitAndPop 来指示调用线程是否已被要求停止如果 WaitAndPop 等待并返回队列的元素则应返回
WCF RIA 服务 - 加载多个实体

我正在寻找一种模式来解决以下问题我认为这很常见我正在使用 WCF RIA 服务在初始加载时将多个实体返回给客户端我希望两个实体异步加载以免锁定 UI 并且我想利用 RIA 服务来执行此操作我的解决方案如下似乎有效这种方法会遇到
秒表有最长运行时间吗？

多久可以Stopwatch在 NET 中运行如果达到该限制它会回绕到负数还是从 0 重新开始 Stopwatch Elapsed返回一个TimeSpan From MSDN https learn microsoft com en us
Asp.NET WebApi 中类似文件名称的路由

是否可以在 ASP NET Web API 路由配置中添加一条路由以允许处理看起来有点像文件名的 URL 我尝试添加以下条目WebApiConfig Register 但这不起作用使用 URIapi foo 0de7ebfa 3a55
使用实体框架模型输入安全密钥

这是我今天的完美想法 Entity Framework 中的强类型 ID 动机比较 ModelTypeA ID 和 ModelTypeB ID 总是至少几乎错误为什么编译时不处理它如果您使用每个请求示例 DbContext 那么很
如何使用 ICU 解析汉字数字字符？

我正在编写一个使用 ICU 来解析由汉字数字字符组成的 Unicode 字符串的函数并希望返回该字符串的整数值五 gt 5 三十一 gt 31 五千九百七十二 gt 5972 我将区域设置设置为 Locale getJapan 并使用
关于 C++ 转换：参数 1 从“[some_class]”到“[some_class]&”没有已知的转换

我正在研究 C 并且遇到了一个错误我不知道确切的原因我已经找到了解决方案但仍然想知道原因 class Base public void something Base b int main Base b b something Base
将 VSIX 功能添加到 C# 类库

我有一个现有的单文件生成器位于 C 类库中如何将 VSIX 项目级功能添加到此项目最终目标是编译我的类库项目并获得 VSIX 我实际上是在回答我自己的问题这与Visual Studio 2017 中的单文件生成器更改 https s
C# 中通过 Process.Kill() 终止的进程的退出代码

如果在我的 C 应用程序中我正在创建一个可以正常终止或开始行为异常的子进程在这种情况下我通过调用 Process Kill 来终止它但是我想知道该进程是否已退出通常情况下我知道我可以获得终止进程的错误代码但是正常的退出代码是什
将多个表映射到实体框架中的单个实体类

我正在开发一个旧数据库该数据库有 2 个具有 1 1 关系的表目前我为每个定义的表定义了一种类型 1Test 1Result 我想将这些特定的表合并到一个类中当前的类型如下所示 public class Result public
WCF 中 SOAP 消息的数字签名

我在 4 0 中有一个 WCF 服务我需要向 SOAP 响应添加数字签名我不太确定实际上应该如何完成我相信响应应该类似于下面的链接中显示的内容 https spaces internet2 edu display ISWG Signe
控件的命名约定[重复]

这个问题在这里已经有答案了 Microsoft 在其网站上提供了命名指南 here http msdn microsoft com en us library xzf533w0 VS 71 aspx 我还有框架设计指南一书我找不到有关
垃圾收集器是否在单独的进程中运行？

垃圾收集器是否在单独的进程中启动例如如果我们尝试测量某段代码所花费的进程时间并且在此期间垃圾收集器开始收集它会在新进程上启动还是在同一进程中启动它的工作原理如下吗 Code Process 1 gt Garbage Collect
什么时候虚拟继承是一个好的设计？ [复制]

这个问题在这里已经有答案了 EDIT3 请务必在回答之前清楚地了解我要问的内容有 EDIT2 和很多评论有或曾经有很多答案清楚地表明了对问题的误解我知道这也是我的错对此感到抱歉嗨我查看了有关虚拟继承的问题 class B p
如何查看网络连接状态是否发生变化？

我正在编写一个应用程序用于检查计算机是否连接到某个特定网络并为我们的用户带来一些魔力该应用程序将在后台运行并执行检查是否用户请求托盘中的菜单我还希望应用程序能够自动检查用户是否从有线更改为无线或者断开连接并连接到新网络并执行魔
cmake 将标头包含到每个源文件中

其实我有一个简单的问题但找不到答案也许你可以给我指一个副本所以问题是是否可以告诉 cmake 指示编译器在每个源文件的开头自动包含一些头文件这样就不需要放置 include foo h 了谢谢 CMake 没有针对此特定用例的
混合 ExecutionContext.SuppressFlow 和任务时 AsyncLocal.Value 出现意外值

在应用程序中由于 AsyncLocal 的错误意外值我遇到了奇怪的行为尽管我抑制了执行上下文的流程但 AsyncLocal Value 属性有时不会在新生成的任务的执行范围内重置下面我创建了一个最小的可重现示例来演示该问题 pr
是否可以在 .NET Core 中将 gRPC 与 HTTP/1.1 结合使用？

我有两个网络服务 gRPC 客户端和 gRPC 服务器服务器是用 NET Core编写的然而客户端是托管在 IIS 8 5 上的 NET Framework 4 7 2 Web 应用程序所以它只支持HTTP 1 1 https le
IEnumreable 动态和 lambda

我想在 a 上使用 lambda 表达式IEnumerable
Windows 和 Linux 上的线程

我在互联网上看到过在 Windows 上使用 C 制作多线程应用程序的教程以及在 Linux 上执行相同操作的其他教程但不能同时用于两者是否存在即使在 Linux 或 Windows 上编译也能工作的函数您需要使用一个包含两者的实现

随机推荐

为什么我的查询在参数化后会中断？

我有 2 张桌子 Sales and Product Sales可以将产品存储为Idn or Name 传统设计和Type列指定实际type与之相关 Product等是连接的子集表into这个表来获取真实的数据在这个例子中 Produc
Facebook 分享不显示来自开放图元标签的图像

我正在尝试将 Facebook 共享按钮集成到我雇主的网站标题网址描述简介均显示正确但未附加任何图像当共享对话框打开时图像容器会闪烁然后消失就好像 facebook 正在尝试处理图像但失败一样我正在使用 og image
内容://短信/收件箱查询

我用的是安卓1 6 我想查询 content sms inbox 如何实施无论是否是 SDK 的一部分除了使用之外我看不到任何访问 SMS 数据的方法content sms inbox String folder content sm
从变量使用 OLE DB 源命令的 EzAPI 等效项是什么？

tl dr 使用来自变量的 SQL 命令数据访问模式的 OLE DB 源并分配变量的 EzAPI 代码是什么 Preamble 每月一次我们需要使用生产数据的子集刷新我们的公共测试站点我们已确定根据我们的需求 SSIS 解决方案最
SwiftUI 关闭多个模态表

我在用 sheet isPresented self showModal 在我的根视图中呈现一个模式在模态中我正在使用NavigationView引导用户浏览各个页面对于用户配置文件构建器在导航堆栈的最后一页中我正在使用 Envi
从 Google 电子表格中的列填充 HTML 下拉菜单

我是 gs 的新手所以这应该不难我有一个 Google 电子表格其中一列中有值假设 A 列我使用 gs 创建了一个自定义菜单用户将在其中选择一个选项单击其中一个选项新组件将出现一个弹出窗口其中包含一个下拉菜单用户应从其
下拉菜单将导航栏向下推。如何避免呢？

我是引导程序和网络开发的新手我想构建一个具有两个导航栏的网页并且根据屏幕尺寸仅显示一个导航栏对于屏幕尺寸 gt 768px 一切工作正常至少看起来对于较低的分辨率下拉菜单将导航栏向下推到内容上方如何避免这种情况任何形式的帮
在 MS word .docs 中插入 MathMl 、 Tex 或 LaTex 方程？

我一直在寻找 C 中 Net 的一些 dll 用于在 MS Word 中插入任何 MathMl Tex 或 LaTex 方程我尝试了一些类似 DocX 的工具但它们失败了你知道吗或任何提示如何做到这一点谢谢 Word 2007 可
当用户拒绝权限时，某些设备上的 onRequestPermissionsResult grantResults 返回空

In Shot In onRequestPermissionsResult某些设备上的 grantResults 返回空而某些设备上有一个值PackageManager PERMISSION DENIED当用户拒绝许可时我已经实现了一个
Python Ctypes：将返回的 C 数组转换为 python 列表，无需 numpy

我正在使用 Python Ctypes 来访问一些 C 库我连接到的函数之一返回const double 它实际上是一个双精度数组当我在Python中得到结果时如何将该数组转换为Python列表 C函数的签名 const double
可达性reachabilityWithAddress不起作用

我正在尝试使用以下代码确定 iPhone 是否可以连接到我的 IP 地址 struct sockaddr in server address server address sin len sizeof server address serv
如何使用 pandas.to_excel() 创建 Excel **表格**？

Need the achieve this programmatically from a dataframe https learn microsoft com en us power bi service admin troublesh
在父指令和子指令之间传递参数

我有导航菜单的父指令和菜单链接的子指令像这样的事情 menu menu
将此自定义 JQuery 工具提示脚本转换为 Jquery 插件

我在一些 stackoverflow 用户的帮助下使用 Jquery 和通用 Javascript 开发了这个工具提示脚本
基于多个类选择元素

我有一个样式规则我想在标签具有two类有没有办法不用 JavaScript 来执行此操作换句话说 li class left ui class selector 我想应用我的风格规则only if the li两者都有 left an
div 元素中的文本在 Firefox 中位于水平对齐的 span 元素之上

我正在编写一个 Web 应用程序其中支持票证显示为左侧的票证 ID 作为静态文本其余字段描述严重性持续时间状态报告者在右侧显示为固定文本中的滚动文本大小视口我从一个 span 包含票证 ID 和视口 div 包含第二个
如何在 makefile 中拥有正确的 .mod 顺序

我正在尝试用 Fortran 为我的项目创建一个 Makefile 并使其可在现在的项目中重用我经过多次尝试后得出的 Mkefile 如下问题是它在少数情况下工作正常但现在我有这个文件 main f90 初始 f90 参数 f90 函
Android MVVM - 如何使 LiveData 发出它拥有的数据（强制触发观察者）

我有这个ViewModel从网络获取一个列表然后我填充一个RecyclerView与数据 MyAvailabilityRepository返回一个MutableLiveData 这就是我使用的原因Transformations switc
Bootstrap，将带标签的输入与不带标签的按钮对齐，垂直形式/非水平形式

我想使用 bootstrap v3 和默认表单表单的垂直布局而不是水平布局将输入与标签对齐与没有标签的按钮对齐期望的效果 http screencast com t b2uwBopW9rW http screencast com
我应该如何以非 root 身份读取 Linux 上的 Intel PCI 非核心性能计数器？

我想要一个库允许对 Linux 可执行文件的关键部分进行自我分析就像人们可以使用一个部分计时一样获取当日时间 http linux die net man 2 gettimeofday or RDTSC http www strchr

我应该如何以非 root 身份读取 Linux 上的 Intel PCI 非核心性能计数器？

我应该如何以非 root 身份读取 Linux 上的 Intel PCI 非核心性能计数器？ 的相关文章

随机推荐

热门标签

我应该如何以非 root 身份读取 Linux 上的 Intel PCI 非核心性能计数器？的相关文章