mpi4py 运行过程中出现Read -1, expected xxx, errno = 1 解决方案

2023-05-16

问题描述

代码1（串行）

代码2（并行）

代码2执行时所用指令

错误信息

解决方案

解决方案1

解决方案2

问题描述

今天正在学习使用mpi4py，在对比运行以下2个代码时疯狂报错：

代码1（串行）

import numpy as np
import time

np.random.seed(2)
size = 1000000

x1 = np.random.random(size)
x2 = np.random.random(size)
result = np.zeros(size, dtype=float)

since = time.time()
for i in range(size):
    result[i] = x1[i] + x2[i]
end = time.time()

print(end - since)

代码2（并行）

from mpi4py import MPI
import numpy as np
import time

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
nprocs = comm.Get_size()

size = 1000000
x1 = np.random.random(size)
x2 = np.random.random(size)

if rank == 0:

    ave, res = divmod(size, nprocs)

    count = [ave + 1 if p < res else ave for p in range(nprocs)]
    count = np.array(count)

    displ = [sum(count[:p]) for p in range(nprocs)]
    displ = np.array(displ)
else:
    sendbuf = None
    count = np.zeros(nprocs, dtype=np.int)
    displ = None

t0 = time.time()
comm.Bcast(count, root=0)

recvbuf1 = np.zeros(count[rank])
recvbuf2 = np.zeros(count[rank])

comm.Scatterv([x1, count, displ, MPI.DOUBLE], recvbuf1, root=0)
comm.Scatterv([x2, count, displ, MPI.DOUBLE], recvbuf2, root=0)

print('After Scatterv, process {} has data:'.format(rank), recvbuf1)
print('After Scatterv, process {} has data:'.format(rank), recvbuf2)

for i in range(recvbuf1.shape[0]):
    recvbuf1[i] += recvbuf2[i]

sendbuf2 = recvbuf1
recvbuf2 = np.zeros(sum(count))
comm.Gatherv(sendbuf2, [recvbuf2, count, displ, MPI.DOUBLE], root=0)

if comm.Get_rank() == 0:
    print('pi computed in {:.3f} sec'.format(time.time() - t0))
    print('After Gatherv, process 0 has data:', recvbuf2)

代码2执行时所用指令

# mpi_test.py是该代码存放的代码文件，代码是以root的权限执行的
mpirun -np 4 --allow-run-as-root python mpi_test.py

错误信息

这个错误是我第三次尝试解决，这次终于找到了解决方案，太不容易了，QAQ

解决方案

参考链接：

python - Possible buffer size limit in mpi4py Reduce() - Stack Overflow

链接中指出，出现这个错误的主要原因是由于

The issue comes from the Cross-Memory Attach (CMA) system calls process_vm_readv() and process_vm_writev() that the shared-memory BTLs (Byte Transfer Layers, a.k.a. the things that move bytes between ranks) of Open MPI use to accelerate shared-memory communication between ranks that run on the same node by avoiding copying the data twice to and from a shared-memory buffer. This mechanism involves some setup overhead and is therefore only used for larger messages, which is why the problem only starts occurring after the messages size crosses the eager threshold.

有以下两个解决方案：

解决方案1

在执行docker run时，带上参数

--cap-add=SYS_PTRACE

但是由于我拿到的是分好的docker，并不具备执行docker run指令的权限，所以只能选择解决方案2中的解决方法。

解决方案2

禁用CMA。

如果是Open MPI 1.8之前的版本，在执行mpirun时带上参数：

mpirun --mca btl_sm_use_cma 0 ...

如果是Open MPI 1.8之后的版本，执行mpirun时带上参数：

mpirun --mca btl_vader_single_copy_mechanism none

附上一个原网站的回答截图以备后续查阅：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mpi4py

read

Expected

xxx

Errno

mpi4py 运行过程中出现Read -1, expected xxx, errno = 1 解决方案的相关文章

ModuleNotFoundError: No module named 'XXX'的解决办法

类似问题一 ModuleNotFoundError No module named 39 captcha 39 pycharm打开的项目 xff0c 在虚拟环境里通过终端命令python manage py runserver运行pytho
__builtin_xxx指令学习【3】__builtin_popcount & __builtin_popcountll

builtin popcount是GCC和Clang编译器提供的一个内置函数 xff0c 用于计算一个整数中二进制位为1的个数该函数的使用背景是在一些位运算和计算机视觉等领域中 xff0c 需要对二进制数据进行处理和分析 xff0c 而二
服务器查看配额限制: OSError: [Errno 122] Disk quota exceeded

OSError Errno 122 Disk quota exceeded 是因为磁盘配额不够了 xff0c 即磁盘已满或超出了用户所能使用的配额上限可以通过如下命令查看配额限制和已经使用的配额 xff1a quota uvs usern
XXX事件的重载均与委托"System.EventHandler"不匹配

在给动态创建控件添加事件时容易遇到的一个错误就是 xff1a XXX事件的重载均与委托 34 System EventHandler 34 不匹配假设控件是MovePicBox xff0c 使用如下代码添加KeyPress事件 xff0c
《XXX重点项目质量保证措施》文档模板

质量保障措施研制过程中的质量控制在研制过程中 xff0c 不随意更改技术要求 xff0c 对任何技术要求更改 xff0c 都会与用户单位协商 xff0c 得到认可后方可实施在研制过程中 xff0c 对影响技术性能的关键指标需外协时 xf
解决Ubuntu“无法定位软件包 xxx”的问题

配置Ubuntu系统时发现有些东西无法安装 xff0c 可能是软件源出了问题 xff0c 需要重新配置目录 1 安装vim xff08 可跳过 xff09 2 备份软件源配置 3 配置软件源 4 重新获取软件源列表 1 安装vim xff
python stdout.read()阻塞_通过阅读python subprocess源码尝试实现非阻塞读取stdout以及非阻塞wait...

http blog chinaunix net uid 23504396 id 4661783 html 执行subprocess的时候 xff0c 执行不是问题最麻烦的是获取进程执行后的回显来确认是否正确执行 xff0c 还不能阻塞还
python popen.stdout.read阻塞解决办法

2019独角兽企业重金招聘Python工程师标准 gt gt gt 需求 xff1a 利用python的subprocess模块结合logging模块实现监控子程序运行情况代码如下程序阻塞在stdout readz这里 xff0c 日志
MDF does not reside in a read-only database or filegroup

错误信息 The file 34 MDF 34 is compressed but does not reside in a read only database or filegroup The file must be decompre
raise ValueError(‘Expected input batch_size ({}) to match target batch_size ({}).‘

raise ValueError Expected input batch size to match target batch size 记得在正向传播之前打印一下图片的尺寸 xff0c 这次没注意到图片其实都进来是 RGB 三通道的数据
错误 expected '}' before ' ' token

分享一下我老师大神的人工智能教程 xff01 零基础 xff0c 通俗易懂 xff01 http blog csdn net jiangjunshow 也欢迎大家转载本篇文章分享知识 xff0c 造福人民 xff0c 实现我们中华民族伟大
4. 事务隔离级别之Read Uncommitted

前面我们说过 xff0c 要获得最高的事务隔离性 xff0c 可以采取序列化串行的方式 xff0c 代价是严重影响系统处理事务的吞吐量就好像数据库是个多核CPU xff0c 事务串行后 xff0c 那么意味着我们总是在使用单核 xff0
5. 事务隔离级别之Read Committed

这篇我们学习事务隔离级别Read Committed xff0c 顾名思义 xff0c 就是读已提交 xff0c 一个事务只能看到其他并发的已提交事务所作的修改很显然 xff0c 该级别可以解决Read Uncommitted中出现的脏
变量键盘读取、数组与声明：read、array、declare

变量键盘读取数组与声明 read array declare 1 read root linux read pt variable 参数 p 后面可以接提示符 t 后面可以接等待的秒数范例一让用户通过键盘输入内容将该内容变成ate
Linux文件编程常用函数详解——read（）和write（）函数

read 函数 include
无法在 CentOS 7 上安装 mpi4py

我有 CentOS 7 并且已经安装了 mpicc 它可以在 C 语言中为 openmpi 工作和编译我也有 python 2 7 5 并且刚刚安装了 pip 我正在运行此命令并收到以下错误 sudo pip install mpi4py
mpi4py 尝试发送大数据时挂起

我最近在尝试使用 mpi4py 库中的发送命令在多个处理器之间共享大数据时遇到了问题即使是 1000x3 的 numpy float 数组也太大而无法发送有什么想法如何克服这个问题提前谢谢我找到了一个简单的解决方案将数据分成足
Python 初学者 - 没有名为“mpi4py”的模块

我是一名学生第一次使用Python 目前我在虚拟机上使用 Xubuntu 19 10 我检查了 python 和 mpi4py 安装我的并行编程教授给了我这个简单的 python 代码 from mpi4py import MPI
在 HPC 集群上使用 python 代码 (mpi4py) 提交作业

我正在工作带有 MPI 的 python 代码 mpi4py 我想在 HPC 集群的队列中跨多个节点每个节点有 16 个处理器实现我的代码我的代码结构如下 from mpi4py import MPI comm MPI COMM WO
哪种快速方法可以并行化 2D NumPy 数组的元素乘法？

我使用 NumPy 函数einsum https docs scipy org doc numpy reference generated numpy einsum html执行两个 2D NumPy 数组的逐元素乘法和求和 np eins

随机推荐

python语言print（）用法应用详解及格式化输出

目录一 print 函数概述 1 1print基本语法 xff1a 1 2 print参数的具体例子 1 2 1 objects基本语法 1 2 2 sep基本语法 1 2 3 end基本语法 1 2 4 file的基本语法二格式化输
数据容器(序列)的切片

目录 1 序列 2 序列的常用操作切片 2 1 基本语法 2 2 例子 3 序列的切片实践 1 序列序列是指 xff1a 内容连续有序 xff0c 可使用下标索引的一类数据容器列表 xff0c 元组 xff0c 字符串 xff0c
一、Win10+非英伟达显卡+Anaconda+Pytorch安装

目录一 Python 二显卡 2 1查看显卡类型 2 2显卡类型简介 2 2 1显示 2 2 2 呈现三安装Anaconda 3 1 安装Anaconda 3 2 创建pytorch环境四安装Pytorch 4 2镜像安装 xf
ssh: error while loading shared libraries: libcrypto.so.1.1: cannot open shared object file: No such

问题描述 xff1a ssh及ssl服务升级后普通用户使用scp及ssh命令报以下错误 xff1a ssh error while loading shared libraries libcrypto so 1 1 cannot open
搭建Swin-Transformer-Detection

前提条件 CUDA10 1Pytorch1 7 0python3 8 下载Swin Transformer Detection源码 git clone https github com cnpmjs org SwinTransformer
Python 创建目录（文件夹）/多层目录（文件夹）

Python 创建单层目录 span class token comment 导入内置os模块 span span class token keyword import span os span class token comment 创建
Windows中文账户名修改为英文

原理 xff1a 使用第三者管理员账户对当前中文名管理员账户的名称进行修改 1 创建新的管理员账户在Windows开始菜单处点击右键 xff0c 选择Windows PowerShell xff08 管理员 xff09 xff0c 输入以
[C语言]二维整型数组转置：1）编写transpose函数，使给定的一个3×3的二维整型数组转置，即行列互换。2）在main函数中输入数组元素，然后调用上述函数，最后输出转置后的二维数组。

输入输入包含三行 xff0c 为按照行列顺序输入的二维数组元素第一行到第三行每行均有3个整数 xff0c 相邻两项之间用一个空格隔开输出输出包含三行 xff0c 是转置后的矩阵每行均有3个整数 xff0c 相邻两项之间用一个空格隔
mpi4py.MPI.Exception: MPI_ERR_RANK: invalid rank 解决方案

问题描述今天在跟着mpi4py简单使用教程执行以下代码时 xff1a from mpi4py import MPI import numpy as np comm 61 MPI COMM WORLD rank 61 comm Get ra
python paramiko利用sftp上传目录到远程

网上大部分都是上传文件 xff0c 于是个人参照网上一些博客的内容 xff0c 写了一个把windows上目录上传到远程linux的一个小程序下面是代码 xff1a class ExportPrepare object def init
【iOS】UITableView的动态Cell高度（Masonry）

动态cell高度评论长度不同引出的问题实现评论长度不同引出的问题对于之前写的项目的评论部分 xff0c 由于评论文字字数的不同会导致label高度不同 xff0c 所以需要设定不同的cell高度来展示一开始使用了 CGSize la
关于谷歌 flutter 技术的看法

主观点 flutter 是一个好东西但是如果我们自己没有必然卡脖子的所以中国程序员最好不要依赖它中国必须尽快搞出自己的flutter 在浏览器内核上我们已经完全受限于国外了不要再落后了这几年我们有了自己的数据库操作系统 ca
Python pip更换国内源

Python pip更换国内源 pip国内的一些镜像阿里云 http mirrors aliyun com pypi simple 中国科技大学 https pypi mirrors ustc edu cn simple 豆瓣 douba
Linux（4）基础命令-软件包管理命令

1 yum yum命令是基于RPM的软件管理包 xff0c 它能够从指定的服务器上自动下载RPM包并且安装 xff0c 还可以自动处理软件之间的所以来的关系 xff0c 且能一次安装所有依赖的软件包 yum命令的语法格式如下 xff1a y
基于深度学习的图像超分辨率——综述

2021 Deep Learning for Image Super resolution A Survey 基本信息作者 xff1a Zhihao Wang Jian Chen Steven C H Hoi Fellow IEEE 期刊
几种拓展屏幕/控制的方式（笔记本作为副屏）

问题有一台台式机和一台笔记本和一台显示屏 xff0c 想把台式机作为主机 xff0c 笔记本作为副屏 xff0c 但是多数笔记本的视频接口都是HDMI输出口 xff0c 不支持视频信号输入 xff0c 如何解决呢 xff1f 本期博客分享
英伟达显卡不同CUDA支持的计算能力情况及不同算力对应显卡列表

如图所示 xff1a 不同CUDA支持的计算能力情况 https note youdao com yws api personal file WEBd456d8a83b247509bd4dd1b4d6776c24 method 61 dow
EDSR图像超分辨程序复现（踩坑及解决记录）

1 概述最近在跑超分辨算法EDSR xff0c 中间经理了一些Bug和情况 xff0c 浅浅记录一下 xff0c 希望能给遇到相似问题的朋友们一些参考在开头先说一下跑程序成功的配置 xff1a 系统 xff1a Ubuntu20 04显
【图像超分辨率重建】——EDSR论文精读笔记

2017 Enhanced Deep Residual Networks for Single Image Super Resolution EDSR 基本信息作者 xff1a Bee Lim Sanghyun Son Heewon Ki
mpi4py 运行过程中出现Read -1, expected xxx, errno = 1 解决方案

目录问题描述代码1 xff08 串行 xff09 代码2 xff08 并行 xff09 代码2执行时所用指令错误信息解决方案解决方案1 解决方案2 问题描述今天正在学习使用mpi4py xff0c 在对比运行以下2个代码时疯狂报

mpi4py 运行过程中出现Read -1, expected xxx, errno = 1 解决方案

问题描述

代码1（串行）

代码2（并行）

代码2执行时所用指令

错误信息

解决方案

解决方案1

解决方案2

mpi4py 运行过程中出现Read -1, expected xxx, errno = 1 解决方案 的相关文章

随机推荐

热门标签

mpi4py 运行过程中出现Read -1, expected xxx, errno = 1 解决方案的相关文章