OpenMP 和 NUMA 的关系？

2023-11-27

我有一台双路 Xeon E5522 2.26GHZ 机器（禁用超线程），在支持 NUMA 的 Linux 内核 3.0 上运行 ubuntu 服务器。架构布局为每个插槽 4 个物理核心。 OpenMP 应用程序在这台机器上运行，我有以下问题：

在 NUMA 机器 + 感知内核上运行时，OpenMP 程序是否会自动利用这一优势（即线程及其私有数据在执行过程中保留在 numa 节点上）？如果没有，可以做什么？
NUMA 和每线程私有 C++ STL 数据结构怎么样？

当前的 OpenMP 标准定义了一个布尔环境变量OMP_PROC_BIND控制 OpenMP 线程的绑定。如果设置为true, e.g.

shell$ OMP_PROC_BIND=true OMP_NUM_THREADS=12 ./app.x

那么 OpenMP 执行环境不应在处理器之间移动线程。不幸的是，关于如何绑定这些线程没有更多的说明，这正是 OpenMP 语言委员会中的一个特殊工作组目前正在解决的问题。 OpenMP 4.0 将附带新的环境变量和子句，允许您指定如何分配线程。当然，许多 OpenMP 实现都提供自己的控制结合的非标准方法.

大多数 OpenMP 运行时仍然不支持 NUMA。他们会很乐意将线程分派到任何可用的 CPU，并且您必须确保每个线程仅访问属于它的数据。在这个方向上有一些一般性的提示：

不使用dynamic并行调度for（C/C++）/DO（Fortran）循环。
尝试在稍后将使用它的同一线程中初始化数据。如果您运行两个单独的并行for具有相同团队规模和相同数量迭代块的循环，其中static调度两个循环的块 0 将由线程 0 执行，块 1 由线程 1 执行，依此类推。
如果使用 OpenMP 任务，请尝试初始化任务主体中的数据，因为大多数 OpenMP 运行时都实现任务窃取 - 空闲线程可以从其他线程的任务队列中窃取任务。
使用支持 NUMA 的内存分配器。

我的一些同事已经彻底评估了不同 OpenMP 运行时的 NUMA 行为，并专门研究了 Intel 实现的 NUMA 感知，但文章尚未发布，因此我无法为您提供链接。

有一个研究项目，叫做森林GOMP，旨在提供 NUMA 感知的直接替代品libgomp。也许你应该看一下。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenMP 和 NUMA 的关系？的相关文章

未提供参数时如何指定 C# System.Commandline 行为？

在我的控制台应用程序中当未提供控制台参数时将执行我指定列表在本例中为参数 3 的任何处理程序调用该处理程序时布尔参数设置为 false 但对我来说根本不调用它更有意义如何防止这种情况发生并显示帮助文本 using System
如何在c++中读取pcap文件来获取数据包信息？

我想用 C 编写一个程序来读取 pcap 文件并获取数据包的信息例如 len sourc ip flags 等现在我找到了如下代码我认为它会帮助我获取信息但是我有一些疑问首先我想知道应该将哪个库添加到我的程序中然后什么是 pca
如何将 protobuf-net 与不可变值类型一起使用？

假设我有一个像这样的不可变值类型 Serializable DataContract public struct MyValueType ISerializable private readonly int x private readon
在 DataView 的 RowFilter 中选择 DISTINCT

我试图根据与另一个表的关系缩小 DataView 中的行范围我使用的 RowFilter 如下 dv new DataView myDS myTable id IN SELECT DISTINCT parentID FROM myOthe
为什么在 CUDA 中启动 32 倍数的线程？

我参加了 CUDA 并行编程课程并且看到了许多 CUDA 线程配置的示例其中通常将所需的线程数四舍五入到最接近的 32 倍数我知道线程被分组为 warp 并且如果您启动 1000 个线程 GPU 无论如何都会将其四舍五入到 1024
在 LINQ 中按 Id 连接多表和分组

我想按categoryId显示列表产品的名称组这是我的代码我想要我的视图显示结果 Desktop PC HP Red PC Dell Yellow PC Asus Red SmartPhone Lumia 720 Blue 我的组模型
复制目录内容

我想将目录 tmp1 的内容复制到另一个目录 tmp2 tmp1 可能包含文件和其他目录我想使用C C 复制tmp1的内容包括模式如果 tmp1 包含目录树我想递归复制它们最简单的解决方案是什么我找到了一个解决方案来打开目录并读
在 C 中初始化变量

我知道有时如果你不初始化int 如果打印整数您将得到一个随机数但将所有内容初始化为零似乎有点愚蠢我问这个问题是因为我正在评论我的 C 项目而且我对缩进非常直接并且它可以完全编译 90 90 谢谢 Stackoverflow 但我想
如何在 32 位或 64 位配置中以编程方式运行任何 CPU .NET 可执行文件？

我有一个可在 32 位和 64 位处理器上运行的 C 应用程序我试图枚举给定系统上所有进程的模块当尝试从 64 位应用程序枚举 32 位进程模块时这会出现问题 Windows 或 NET 禁止它我认为如果我可以从应用程序内部重新启动
C# HashSet 只读解决方法

这是示例代码 static class Store private static List
等待进程释放文件

我如何等待文件空闲以便ss Save 可以用新的覆盖它吗如果我紧密地运行两次左右我会得到一个generic GDI error
“接口”类似于 boost::bind 的语义

我希望能够将 Java 的接口语义与 C 结合起来起初我用过boost signal为给定事件回调显式注册的成员函数这非常有效但后来我发现一些函数回调池是相关的因此将它们抽象出来并立即注册所有实例的相关回调是有意义的但我了解到的
如何设置 log4net 每天将我的文件记录到不同的文件夹中？

我想将每天的所有日志保存在名为 YYYYMMdd 的文件夹中 log4net 应该根据系统日期时间处理创建新文件夹我如何设置它我想将一天中的所有日志保存到 n 个 1MB 的文件中我不想重写旧文件但想真正拥有一天中的所有日志我该如
Repa 数组上的并行 mapM

在我最近的work https github com bgamari mixture model with Gibbs sampling 我一直在充分利用RVar http hackage haskell org packages arch
将 MQTTNet 服务器与 MQTT.js 客户端结合使用

我已经启动了一个 MQTT 服务器就像this https github com chkr1011 MQTTnet tree master例子该代码托管在 ASP Net Core 2 0 应用程序中但我尝试过控制台应用程序但没有成
为什么 gcc 抱怨“错误：模板参数 '0' 的类型 'intT' 取决于模板参数”？

我的编译器是gcc 4 9 0 以下代码无法编译 template
按 Esc 按键关闭 Ajax Modal 弹出窗口

我已经使用 Ajax 显示了一个面板弹出窗口我要做的是当用户按 Esc 键时关闭该窗口这可能吗如果有人知道这一点或以前做过这一点请帮助我 Thanks 通过以下链接您可以通过按退出按钮轻松关闭窗口 http www codepro
调用堆栈中的“外部代码”是什么意思？

我在 Visual Studio 中调用一个方法并尝试通过检查调用堆栈来调试它其中一些行标记为外部代码这到底是什么意思方法来自 dll已被处决外部代码意味着该dll没有可用的调试信息你能做的就是在Call Stack窗口中单
方法优化 - C#

我开发了一种方法允许我通过参数传入表字符串列数组字符串和值数组对象然后使用这些参数创建参数化查询虽然它工作得很好但代码的长度以及多个 for 循环散发出一种代码味道特别是我觉得我用来在列和值之间插入逗号的方法可以用不同的
WebSocket安全连接自签名证书

目标是一个与用户电脑上安装的 C 应用程序交换信息的 Web 应用程序客户端应用程序是 websocket 服务器浏览器是 websocket 客户端最后用户浏览器中的 websocket 客户端通过 Angular 持久创建并且

随机推荐

Resharper 格式化链式方法

R 中是否有设置将链接方法格式化为从实例化类的相同字符开始我想要的是 var foo new FooDataBuilder WithDate myDate WithBar myBar Build R 给了我什么 var foo new F
如何在 Windows 中注册自定义 URL 协议？

如何向 Windows 注册自定义协议以便在单击电子邮件或网页中的链接时打开我的应用程序并将 URL 中的参数传递给它 Go to Start然后在Find type regedit gt 它应该打开注册表编辑器 Click Right
ASP.NET MVC 获取视图的最后修改日期/文件信息

我需要在工作申请的每一页上注明最后修改日期我曾经通过在 WebForms 母版页底部包含对的引用来实现此目的该引用将返回当前 aspx 页面的上次修改日期我的代码甚至会检查关联的 aspx cs 文件比较上次修改日期并返回最近的
.Net枚举winforms字体样式？

我一直在寻找一种使用 Net 框架列出给定字体的有效字体样式的方法即使我必须 pinvoke gdi32 或其他一些 API 因为并非所有字体都属于 System Drawing FontStyle 枚举值粗体斜体常规删除线下划
自定义WPF窗口样式

我正在尝试制作自定义窗口样式目标是创建一个可以被我的应用程序中的每个窗口使用的模板模板包含工具栏标题和窗口将使用的区域问题是当我使用我的样式时我无法再添加网格和控件 App xaml
在 __init__ 上使用 scrapy 管道中的参数

我有一个 scrapy pipelines py 我想获得给定的参数在我的 Spider py 中它工作得非常完美 class MySpider CrawlSpider def init self host domain id args
从非托管代码调用托管 .NET 代码的最佳方法

我试图找到从非托管 C 代码调用托管 NET 代码的最佳执行方法我在我的 C 应用程序中找到了有关托管 NET 的信息并且我能够创建 pRuntimeHost 并毫无问题地启动它 ExecuteInDefaultAppDomain 似乎
如何让 iOS 上的 tesseract 运行得更快？

我在 ios 上的 tesseract ocr 上遇到了困难一切工作正常但速度真的很慢单行数字的识别时间为 2 3 秒我正在阅读视频流我正在使用 tesseract 3 01 以及针对我的字体的自定义训练文件这是我所做的设置
Rails 3 中控制器特定的样式表：继承

首先我是 Rails 的新手我正在 Rails 网站上工作它有三个控制器即application controller static pages controllers 和 users controller 它们在 app asse
在 Hibernate 验证期间执行 EntityManager 查询的正确方法

我是一个 Java EE EJB 菜鸟但从我收集的文档和其他帖子来看您无法在实体验证期间使用相同的实体管理器会话查询数据库一般来说可移植应用程序的生命周期方法不应调用 EntityManager 或查询操作访问其他实体实例或修改
Haskell 和惰性 Monads 评估

在使用 monad 时我经常遇到评估问题现在我了解了延迟求值的基本概念但我不明白如何在 Haskell 中延迟求值 monad 考虑下面的代码 module Main where import Control Monad impor
Django 删除文件字段

我正在 Django 中构建一个网络应用程序我有一个上传文件的模型但无法删除该文件这是我的代码 class Song models Model name models CharField blank True max length 1
Tomcat 引起：java.util.zip.ZipException：打开 zip 文件时出错

我有一个 spring mvc 项目但它抛出了Caused by java util zip ZipException error in opening zip file当我通过 Tomcat 运行它时如何确定哪个 jar 文件没有正确
如何在IIS7.5中启用ASP经典

我在 Windows 7 中运行 IIS 7 5 并且已经进入打开或关闭 Windows 功能并在 Internet 信息服务万维网服务应用程序开发功能中启用了 ASP 完成此操作后我开始收到 HTTP 404 错误由于扩展名
替换日期时间日期中的年份

我有一个带有一列的表 dateDT 格式为日期时间和年份的变量输入 selYear 在我的 Select 中格式为 int 如何使用变量输入替换表中日期中的年份并以日期时间格式返回结果在选择中我已尝试以下操作但这返回错误的日期年份
使用下划线 groupby 按颜色对一组汽车进行分组

我有一系列的汽车 car make nissan model sunny colour red 我将如何使用 underscore js 按颜色对数组进行分组我尝试了一些组合但我不太确定如何指定我的迭代器条件 var carsGroup
OSError：无法打开共享对象文件：即使文件位于文件夹中，也没有此类文件或目录

我已经为此奋斗了很长一段时间了我正在尝试安装 Yaafe 来提取音频特征我按照这里的说明操作 https github com Yaafe Yaafe 一切都安装得很好但是当我尝试运行测试文件 frames py 时出现以下错误 F
C - 在内存被释放（）后访问数据？

我读了很多关于标准 C 中的 malloc 和 free 的内容据我了解您malloc 只为了一次记忆然后你free 同样的记忆只有一次这可能是不好的做法但我明白在你之后malloc 内存您可以定义多个指向它的指针而一旦你f
酸洗 scipy interp1d 样条

我想知道有没有简单的腌制方法interp1dscipy 中的对象这种天真的方法似乎不起作用 import pickle import numpy as np from scipy interpolate import interp1d x
OpenMP 和 NUMA 的关系？

我有一台双路 Xeon E5522 2 26GHZ 机器禁用超线程在支持 NUMA 的 Linux 内核 3 0 上运行 ubuntu 服务器架构布局为每个插槽 4 个物理核心 OpenMP 应用程序在这台机器上运行我有以下问题在

OpenMP 和 NUMA 的关系？

OpenMP 和 NUMA 的关系？ 的相关文章

随机推荐

热门标签

OpenMP 和 NUMA 的关系？的相关文章