MPI Alltoallv 还是更好的单独发送和接收？（表现）

2024-05-04

我有许多进程（大约 100 到 1000 个），每个进程都必须将一些数据发送到其他一些进程（比如大约 10 个）。（通常，但并非总是必要，如果 A 发送到 B，B 也会发送到 A。）每个进程都知道它必须从哪个进程接收多少数据。

所以我可以用MPI_Alltoallv，许多或大部分消息长度为零。不过，我听说对于表现原因better to use several MPI_send and MPI_recv通讯而不是全球的MPI_Alltoallv。我不明白的是：如果一系列发送和接收调用比一个 Alltoallv 调用更有效，why is 全部不是 just 实施为 a 一系列的发送和接收？

对于我（和其他人？）来说，仅使用一个全局调用会方便得多。另外，我可能不得不担心不会遇到多个发送和接收的死锁情况（可以通过某种奇偶策略或更复杂的策略修复？或者通过使用缓冲发送/接收？）。

你同意吗MPI_Alltoallv是必要的slower比，比方说，10MPI_Send and MPI_Recv;如果是的话为什么以及多少？

通常，集体的默认建议是相反的：尽可能使用集体操作，而不是编写自己的代码。 MPI 库拥有的有关通信模式的信息越多，其内部优化的机会就越多。

除非有特殊的硬件支持，集体呼叫实际上是在发送和接收方面在内部实现的。但实际的通信模式可能不仅仅是一系列发送和接收。例如，使用树来广播一段数据可能比使用相同的等级将其发送到一堆接收器更快。优化集体沟通需要做很多工作，而且很难做得更好。

话说回来，MPI_Alltoallv有点不同。在 MPI 级别针对所有不规则通信场景进行优化可能很困难，因此可以想象一些自定义通信代码可以做得更好。例如，一个实现MPI_Alltoallv可能正在同步：它可能要求所有进程“签入”，即使它们必须发送 0 长度的消息。我认为这样的实现不太可能，但是这是野外的一个 http://www-01.ibm.com/support/docview.wss?uid=isg1IZ58190.

所以真正的答案是“这取决于”。如果库实现MPI_Alltoallv与任务不匹配，自定义通信代码将获胜。但在走这条路之前，请检查 MPI-3 邻居集合是否适合您的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MPI Alltoallv 还是更好的单独发送和接收？（表现）的相关文章

Android 7 GraphicBuffer 替代方案，用于直接访问 OpenGL 纹理内存

从移动设备具有 CPU 和 GPU 共享内存这一事实中获利的唯一方法是使用GrphicBuffer 但由于 Android 7 限制对私有本机库包括 gralloc 的访问因此无法再使用它问题是否有其他方法可以直接内存访问纹理的像素
并行何时会提高性能

我试图理解何时使用parallel会提高性能我用一个简单的代码对其进行了测试该代码运行了超过 100 000 个项目List
MySQL 性能 DELETE 或 UPDATE？

我有一个超过 10 7 行的 MyISAM 表向其中添加数据时我必须在最后更新 10 行删除它们然后插入新行更快还是更新这些行更快应更新的数据不是索引的一部分索引数据碎片怎么样 UPDATE到目前为止要快得多当你UPDATE
OpenGL：顶点越多，性能越慢

我正在开发一个程序的一部分其中给定 xyz 坐标集合制作 3D 模型我已经完成了这张图片所需的所有功能即平移旋转缩放但是给出的 xyz 坐标越多程序运行速度就越慢我的程序在处理 29 000 个坐标时运行得非常流畅但当我
读取大文件并制作字典

我有一个大文件我需要读取它并从中制作字典我希望这一切能够尽可能快然而我的Python代码太慢了这是一个显示问题的最小示例首先制作一些假数据 paste lt seq 20000000 lt seq 2 20000001 gt la
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
从 Golang 调用 C 函数

我想在 Golang 中编写控制器逻辑并处理 json 和数据库同时在 C 中使用我的数学处理模型在我看来调用 C 函数的开销必须尽可能低就像设置寄存器 rcx rdx rsi rdi 一样执行一些操作fastcall 并获取 r
AsyncTask的并行执行

An 异步任务单击时执行 List
调整 Oracle 数据库以加快启动速度（闪回）

我正在使用 Oracle 数据库 11 2 我有一个场景我发出FLASHBACK DATABASE经常似乎有一个FLASHBACK DATABASECycle 会重新启动数据库实例大约需要 1 分钟我的设置花了 7 秒数据库很小
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
如何加速我的 Perl 程序？

这确实是两个问题但它们非常相似为了简单起见我想我应该把它们放在一起 Firstly 给定一个已建立的 Perl 项目除了简单的代码优化之外还有哪些不错的方法可以加速它 Secondly 用Perl从头开始编写程序时有哪些好的方法
如何加快 Java VM (JVM) 的启动时间？

我正在运行启动多个 JVM 进程的测试与 JVM 内运行的实际测试时间相比 JVM 的总结启动时间非常重要我怎样才能加快速度我已经使用了 client 选项这确实有帮助但没有我想要的那么多还有其他方法吗比如预加载一堆 JVM
如何针对 IE 进行优化？

我有一个 JS 密集型应用程序它在 IE 中运行缓慢我将花费大约一周的时间来优化 IE 并且我想要一些关于尝试的方向我发现这个线程引用Drip https ieleak svn sourceforge net svnroot iele
有没有办法提高linux管道的性能？

我正在尝试使用 64 位将超高速数据从一个应用程序传输到另一个应用程序CentOS http en wikipedia org wiki CentOS6 我使用以下方法进行了基准测试dd发现阻碍我的是管道而不是程序中的算法我的目标是达到
频繁插入已排序的集合

我已经对集合列表进行了排序并且我需要始终保持其排序我目前在我的集合上使用 List BinarySearch 然后在正确的位置插入元素我也尝试过在每次插入后对列表进行排序但性能不可接受有没有一种解决方案可以提供更好的性能也许
由于内容不可压缩，谷歌浏览器中出现了新的复合层

当 chrome profiler 说图层是单独合成的因为它无法被挤压时它到底意味着什么我正在对我的 html 进行更改并在相对 div 内引入了一个固定位置 div 并给出了will change transform在上面完
我的 Delphi 11.1 调试器在 x64 项目上突然变得非常缓慢；大约一周前还可以。有什么想法吗？

更新拔掉网络电缆和wifi 会导致几乎恢复正常的调试速度已尝试禁用防火墙没有任何变化但没有网络恢复正常服务更新 2 所有 Windows x64 版本都存在缓慢问题而不仅仅是单个大型项目如果我构建并调试 32 位 Wind
如何使用 Java2D 创建硬件加速图像？

我正在尝试创建一个快速图像生成器它可以执行大量 2d 转换和形状渲染因此我尝试使用 BufferedImage 然后获取 Graphics2D 对象来执行所有绘图我现在主要关心的是 make 速度非常快所以我创建一个像这样的 Buf
Eclipse PTP：在本地计算机上运行并行（MPI）应用程序？

必须如何配置 eclipse PTP 才能在本地计算机上使用 OpenMPI 运行 MPI 应用程序使用添加资源管理器我可以选择 OpenMPI 并在连接名称中切换到本地主机但仍然要求我提供一些用户名和密码这是正确的方法吗 D
如何清除chrome性能条目或绕过其数量限制？

我使用 Google Chrome 来分析一些使用 Javascript 动态加载脚本和其他资源的网页的性能我用performance getEntries 方法但我注意到 Chrome 只记录前 150 个资源我找不到任何方法来获取

随机推荐

kubernetes 集群中 django 应用程序的 Nginx 配置

我在为部署在 kubernetes 中的 django 应用程序创建 nginx 配置文件时遇到困难 Nginx 和 app 是同一集群中的两个独立容器据我了解容器可以通过 127 0 0 1 XX 和主机名相互通信我为此使用 min
我如何在 ruby 中执行范围正则表达式，例如 awk /start/,/stop/

我想做一个 AWK 风格的范围正则表达式如下所示 awk hoststatus file 在 AWK 中这将打印文件中两个模式之间的所有行 hoststatus host name myhost modified attributes
如何在 Angular 4 材料的 Stepper 中提交表单

如何在角材料的步进器中提交表单数据我正在遵循角材料的示例https material angular io components stepper examples https material angular io components
如何将值与数据库值进行比较

我使用下面的代码在数据库中插入用户安装的应用程序包名称并且插入成功现在在日志中显示我想将系统安装的应用程序与此数据库值进行比较并仅显示数据集中的值那么我如何比较我在这个括号中写了什么 if p packageName equals
NoMethodError：未定义方法“needs_migration？”对于 ActiveRecord::Migrator:Class

我收到以下错误消息不知道如何解决它有人可以帮忙吗 NoMethodError 未定义方法 needs migration 为了 ActiveRecord 迁移器类这是 config ru 代码 require config envi
Xcode 的 Organizer 窗口中没有“Use for Development”

我今天注册了 Apple 的 99 美元 iOS 开发计划在 Xcode 中的证书标识符和配置文件下无论我单击什么它都会告诉我将您的设备连接到 Mac 然后在 Xcode 的管理器窗口中单击用于开发使用与您的 iOS 开发者计
切换到负载均衡器后，django 帖子收到 CSRF 验证失败

我有一个有效的登录模板可以发布帖子如下所示
根据列中的条件将 Pandas 数据框拆分为多个数据框

为了为 ML 任务正确准备数据我需要能够将原始数据帧拆分为多个较小的数据帧我想要获取上面的所有行包括 BOOL 列的值为 1 的行对于每次出现的 1 即 n 个数据帧其中 n 是 1 出现的次数数据样本 df pd DataFr
Webdriver - 等待在 Firefox 中不起作用

在我的应用程序中我有一个用于在屏幕上显示记录的元素所以在第一页上它会显示类似显示 2100 的 1 10 之类的内容这是该元素的 CSS 它适用于所有浏览器 span GridPagingInfo 在我位于 iframe 中的应用
以角度搜索输入字段？

这里我有folderObjs数组和该数组的控制台位于下面的代码中我将搜索输入字段放在搜索输入字段中我想按角度搜索该数组的folderName和folderSize 这怎么可能 HTML
有没有办法过滤掉 TortoiseSVN 日志中仅属性的更改？

SVN 的 mergeinfo 功能确实很有用但是当文件上的所有更改都是 svn 属性时它会在修订日志中放置一个日志条目而我们通常不希望看到这些有没有办法过滤掉 TortoiseSVN 日志中仅属性的更改拉起日志选择您要比较的两
我可以在不同的 Spring 控制器中使用不同参数的相同映射值吗？

有什么办法可以完成这样的事情我有一个用于导航的表单
为什么在 numpy 数组上使用 *= 会修改原始数组？

下面的代码演示了使用a 3修改原始数据集而a a 3才不是 data np array 1 0 3 4 a data 0 b data 1 a 3 b b 3 print data gives 3 0 3 4 the a 3语句修改了矩阵
PHP：将 UTC 时间更改为太平洋时间（PST/PDT）[重复]

这个问题在这里已经有答案了我有一个 Datetime 对象并通过以下方式获取时间 today date Y m d H i s temp date gt getTimeStamp 我希望能够将其转换为加利福尼亚州的当前时间但我需要考虑
如何使用 c 使用 libpng 更改 png 图像的 RGB 值？

更改 png 图像的 rgb 值的推荐方法是什么现在我正在使用示例代码来查看 libpng 的工作方式它只打开一个 png 图像并写入另一个 png 图像但是我想更改这个新图像的 RGB 值使其变为全蓝色绿色或红色无论我选择什么
将带有我的 URL 的 ExtensionInstallSources 首选项添加到 Chrome 首选项后，仍然不允许安装“.crx”打包应用程序

我添加了偏好设置ExtensionInstallSources 按照 http www chromium org administrators policy list 3 ExtensionInstallSources http www c
如何从 python 发布到 hipchat

我有一些 python 工具我想将它们的更新发送到 hipchat 房间我在其他地方使用 shell 脚本执行此操作因此我知道它在我们的环境中有效但我似乎无法将令牌推送到 hipchat API 一定是简单的事情首先这会正确进行
在 ASP.Net MVC 中向“View/Shared”文件夹添加子目录并调用视图

我目前正在使用 ASP Net MVC3 和 Razor 开发一个网站在 View Shared 文件夹中我想添加一个名为 Partials 的子文件夹我可以在其中放置所有部分视图为了更好地组织网站只要我在调用视图时始终引用 Pa
导入错误：无法导入名称 md5

真的不知道这里发生了什么我需要在弹性beanstalk上部署我的flask应用程序但不知何故改变了路径并且无法再运行python application py dotnet info NET Core SDK reflecting an
MPI Alltoallv 还是更好的单独发送和接收？（表现）

我有许多进程大约 100 到 1000 个每个进程都必须将一些数据发送到其他一些进程比如大约 10 个通常但并非总是必要如果 A 发送到 B B 也会发送到 A 每个进程都知道它必须从哪个进程接收多少数据所以我可以用MPI A

MPI Alltoallv 还是更好的单独发送和接收？ （表现）

MPI Alltoallv 还是更好的单独发送和接收？ （表现） 的相关文章

随机推荐

热门标签

MPI Alltoallv 还是更好的单独发送和接收？（表现）

MPI Alltoallv 还是更好的单独发送和接收？（表现）的相关文章