MPI中可能会出现的错误

2023-05-16

1.p1_xxxxx:  p4_error: interrupt SIGSEGV: 11

这个错误可能是因为某个进程中出现了段错误引起的,
自己编程中曾出现过的错误:
1.只在一个进程中给指针申请空间,而在其他进程没有申请,所以在广播的时候出错
2.在一个进程中联接mysql数据库,而在所有的进程中断开数据库的联接

网上有个人说的很好:
"There are 2 things to check.
  * Run one of the test programs like pi3.f or cpi.c to see whether your cluster's OK.
  * if it is, the fault is in your code. See if you're exceeding array bounds or accessing memory which you haven't allocated, There's a SIGSEGV error - that's a segmentation violation. That might explain stuff like
                bm_list_21829:  p4_error: interrupt SIGINT: 2
Once you have a seg. violation, all the 4 processors are sent a signal to interrupt the process (SIGINT). Signals are defined in /usr/include/sys/signal.h (at least on the SGIs; might be
different on other systems). "

2. p1_10401:  p4_error: : 14
1 - MPI_BCAST : Message truncated
[1]  Aborting program !
[1] Aborting program!

这个也是由于mpi_bcast的接收空间不够引起的,要在mpi_bcast之前分配足够大的空间,这样就不会truncated了

3.p4_error: alloc_p4_msg failed:


p0_6773: (7.828703) xx_shmalloc: returning NULL; requested 1048616 bytes
p0_6773: (7.828762) p4_shmalloc returning NULL; request = 1048616 bytes

内存空间没分配足,可以通过设置环境变量P4_GLOBMEMSIZE (in bytes)来增大程序需要的内存空间
export P4_GLOBMEMSIZE=32000000 (for bash users) 
setenv P4_GLOBMEMSIZE 32000000 (for csh or tcsh users)
 
4.libcprts.so.5: cannot open shared object file: No such file or directory 
 
/home/jbrandt/tests/test.exe: error while loading shared libraries:
libcprts.so.5: cannot open shared object file: No such file or directory
p0_792: p4_error: Child process exited while making connection to remote
process on compute-0-0.local: 0
/opt/mpich/intel/bin/mpirun: line 1: 792 Broken pipe /home/jbrandt/tests/test.exe -
p4pg /home/jbrandt/tests/PI646 -p4wd /home/jbrandt/tes
 
没有用-static静态的连接,用-static重新编译就好了
 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

MPI中可能会出现的错误 的相关文章

  • MPI 发送数组的数组

    好的 所以我尝试通过 MPI 发送这样的结构 struct BColumns double B int offset 如果我只是像这样对数据进行一些BS分配 bSet offset myRank bSet B double calloc 2
  • Hadoop MapReduce 与 MPI(与 Spark、Mahout 与 Mesos) - 何时使用其中之一?

    我是并行计算新手 刚刚开始在 Amazon AWS 上尝试 MPI 和 Hadoop MapReduce 但我对何时使用其中一种而不是另一种感到困惑 例如 我看到的一个常见的经验法则可以总结为 大数据 非迭代 容错 gt MapReduce
  • MPI - Bsend 用法

    当我想在异步发送之后释放资源时 MPI Bsend 好吗 这会吗 MPI Bsend array 0 delete array 阻止我删除我想要发送的内存 问题是 当适当的recv打开时 数组可能已经被删除 UPD void RectMPI
  • MPI - 异步广播/收集

    我有一个项目 需要 n 个进程才能工作 直到问题得到解决 每个从属进程执行相同的代码 当某种情况出现时 该进程需要以非阻塞的方式通知所有其他进程 其他进程也需要以非阻塞的方式接收这个消息 有没有办法不用线程单独的循环 我已经有一段时间没有使
  • 来自未知来源的 MPI 接收

    我正在 MPI 中实现一个程序 其中主进程 等级 0 应该能够接收来自其他进程的请求 这些进程要求只有根才知道的变量值 如果我按等级 0 进行 MPI Recv 我必须指定向根发送请求的进程的等级 但我无法控制它 因为进程不按顺序运行 1
  • MPI_Bsend 的缺点?

    我最近遇到了一个死锁 我可以通过使用来解决MPI Bsend代替MPI Send 如果我理解正确的话 MPI Bsend 是一个非阻塞发送 并且可以安全地修改我发送的内容 而不必担心发送操作何时完成 所以 double x 1 MPI Bs
  • 如何释放 boost::mpi::request?

    我正在尝试让 MPI 断开通信器 这是一件很棘手的事情 我在下面整理了一个演示 我有相同想法的两个版本 侦听 int 一个使用 MPI IRecv 另一个使用 boost mpi request 您会注意到 在此程序上使用 mpiexec
  • 如何在python中将MPI信息传递给ctypes

    我的动机是将 MPI 信息有效地从 python 传递到通过 ctypes 调用的 C 函数 我在 python 中使用 mpi4py 进行 MPI 绑定 我想通过一个用 C 编写并通过 python 中的 ctypes 调用的简单示例 M
  • 使用 mpi4py 接收多个发送命令

    如何修改以下代码 改编自http materials jeremybejarano com MPIwithPython pointToPoint html http materials jeremybejarano com MPIwithP
  • MPI+p 线程。程序卡在 MPI_Ssend 和 MPI_Recv 上

    我已经调试了这个程序2周了 它只有 93 行 但我仍然找不到错误 请帮我 这个程序在我的笔记本电脑上运行正常 但是当我在我的实验室 上海超算中心和济南超算中心的集群上运行时 就卡住了 这个程序的逻辑非常简单 有 2 个 MPI 进程 一个是
  • 使用 MPI 派生数据类型

    我正在学习 Fortran 中的 BCASTing 数据类型 并且有一个代码可以从终端获取两个值并将它们显示在每个进程上 对于整数 整数和整数 实数类型的组合 value1 value2 这是有效的 但是对于整数 实数 8 的组合 它会失败
  • MPI 是否提供预处理器宏?

    MPI 标准是否提供了预处理器宏 因此如果我的 C C 代码由支持 MPI 的编译器编译 它可以分支吗 就像是 OPENMPOpenMP 的宏 根据MPI标准 http www mpi forum org docs mpi 3 0 mpi3
  • MPI 矩阵向量乘法返回有时正确有时奇怪的值

    我有以下代码 Start MPI MPI Init argc argv int size atoi argv 1 int delta 10 int rnk int p int root 0 MPI Status mystatus MPI C
  • MPI+CUDA 与纯 MPI 相比有何优势?

    加速应用程序的常用方法是使用 MPI 或更高级别的库 例如在幕后使用 MPI 的 PETSc 并行化应用程序 然而 现在每个人似乎都对使用 CUDA 来并行化他们的应用程序或使用 MPI 和 CUDA 的混合来解决更雄心勃勃 更大的问题感兴
  • 无法使用 conda 安装 mpi4py 并指定预安装的 mpicc 路径

    我已经尝试安装mpi4py with env MPICC path to openmpi bin mpicc conda install c anaconda mpi4py 但我收到这样的消息 The following NEW packa
  • MPI Alltoallv 还是更好的单独发送和接收? (表现)

    我有许多进程 大约 100 到 1000 个 每个进程都必须将一些数据发送到其他一些进程 比如大约 10 个 通常 但并非总是必要 如果 A 发送到 B B 也会发送到 A 每个进程都知道它必须从哪个进程接收多少数据 所以我可以用MPI A
  • 通过 mpi 发送 c++ std::vector

    我知道存储一个std vector
  • MPI 中的等级和进程有什么区别?

    MPI 中的等级和进程有什么区别 Here http www netlib org utk papers mpi book mpi book html是我学习所有 MPI 的资源 您可能会发现它很有用 至于你的问题 流程是正在运行的程序的实
  • MPI 中可变大小的消息

    是否有库调用允许使用 MPI 发送 接收可变大小的消息 解决方法是在第一条消息中发送数据大小 并在其后面加上实际的有效负载 但我想知道是否有一个约定来组合这两个单独的消息 提供给 MPI Recv 的计数只是一个上限 MPI Get cou
  • 如何编写 PMPI 库来包装 MPI 函数

    我正在尝试编写 PMPI 库 但不确定正确的步骤 库和链接的新手 我编写了一个包装 MPI Send 函数的基本文件 假设它是一个名为 lib c 的文件 我应该执行哪些步骤 以便当我使用 MPI Send 运行 c 代码时 我的包装器代码

随机推荐

  • Windows Server2012 主副AD域控部署

    介绍 xff1a 部署主域控和辅域控 server2012跟server2008同样能够实现 部署额外域控制器 xff0c 指的是在域中部署第二个甚至更多的域控制器 xff0c 每个域控制器都拥有一个 Active Directory 数据
  • AD辅域控制器升级为主域控制器(图形界面操作)

    环境介绍 Active Directory域控制器已经搭建好主域控和辅域控 xff0c 主域控故障 xff0c 手动升级辅域控为主 主域控 xff1a 2012DC1 xff0c ip xff1a 192 168 15 1 辅域控 xff1
  • macOS的Chrome安装插件提示 程序包无效

    感谢 xff1a 完美解决Mac系统下Chrome插件安装时程序包无效 CRX HEADER INVALID 下载好插件crx文件后 xff0c 不要直接拖拽到扩展页面进行添加先把插件crx文件的后缀改成zip xff0c 再拖入到chro
  • Windows server 2008远程桌面会话主机和远程桌面授权(解决120天过期问题)

    一 系统环境 部署RemoteAPP是加入域控管理的 xff0c 这样可以方便授权管理 xff0c 域部署查看 xff1a https blog csdn net tladagio article details 80464833 二 远程
  • KMS激活报错0x8007000D

    一 错误显示 在执行kms的批处理激活office的时候 xff0c 显示报错 xff1a 0x8007000D 原因 xff1a 这台机器之前是使用其他KMS服务器序列号激活的系统 xff0c 现在使用批处理文件激活office的的KMS
  • win7无法访问局域网共享,错误代码0x80070043找不到网络名

    一 故障 xff1a win7无法访问局域网共享文件 xff0c ping网络正常 故障提示如图 类似错误代码还有可能是0x80070035 xff0c 提示找不到网络路径 二 解决 1 在控制面板找到网络连接 2 点击本地连接右键属性 3
  • 在github上搭建个人独立博客

    这篇文章会给大家分享利用github pages搭建我的个人独立博客的过程 xff0c 希望能帮助到一些想搭建独立博客的朋友 本文操作中所使用的操作系统为MacOS 一 工具准备 1 下载nodejs https nodejs org zh
  • hexo博客如何绑定个人域名

    我利用hexo在github上搭建了自己的独立博客 如果要打开这个博客 xff0c 我们则需要输入GitHub下的二级域名username github io xff0c 这里面的username就是你注册GitHub账户时的用户名 但是为
  • PX4的控制与输出

    文章目录 前言控制器部分输出部分控制组混控器混控器的启动信号输出 前言 这篇记录一下自己分析PX4从位置控制 gt 速度控制 gt 姿态控制 gt 角速度控制 gt 电机输出的源码框架的阅读与理解 xff0c 便于之后自己修改控制器 在这个
  • ML302 OpenCPU系列(5)---Log工具的使用

    ML302 OpenCPU系列 xff08 5 xff09 Log工具的使用 一 使用串口助手抓取Log二 使用Coolwatcher抓取AP Log三 查看死机现场 工欲善其事 xff0c 必先利其器 Log是嵌入式开发中最重要的调试手段
  • Lottie简单使用

    一 简介 Lottie 是Airbnb开源的一个面向 iOS Android React Native 的动画库 xff0c 能分析 Adobe After Effects 导出的动画 xff0c 并且能让原生 App 像使用静态素材一样使
  • Xshell显示图形化界面

    前言 很久没用过图形化界面了 xff0c 都忘记怎么使用了 依据以往的经验都是由环境变量DISPLAY设置 xff0c 然后就能连接了 xff0c 每天也是匆匆忙忙的就过了一天 xff0c 都不知道干了啥 xff0c 分配的时间也少 xff
  • 2017--就业分享之IT校招现状和面试经历

    在介绍自己整个春季和夏季实习求职经历之前 xff0c 先给大家公布一则新闻 2017届互联网校招薪酬报告 xff1a 先说下对 16 年 17 届校招的总体看法 xff1a 本该是个不大不小的年 xff0c 结果被华为一己之力搞成了个大年
  • docker常见命令

    文章目录 0 删除重建容器1 打包一个镜像并在另一个服务器上使用 0 删除重建容器 如果觉得镜像被自己搞坏了 xff0c 重启没啥用 xff0c 就要考虑基于之前的镜像重新建立一个新的容器了 span class token comment
  • python代码获取远程电脑IP

    实时的使用邮箱发送IP地址到指定邮箱 使用python代码封装好的软件 xff1a 链接 xff1a https pan baidu com s 1Flz7HHtZM0w3HGDeF 4BhQ pwd 61 yxy2 提取码 xff1a y
  • Collections.singleton();

    span class token comment 删除list某个元素 span List span class token operator lt span Integer span class token operator gt spa
  • 一个程序员所应该具备的精神

    所谓障碍都是主观上的 如果你想研发什么新的技术 xff0c 只需要在冰箱里放满食物和饮料 xff0c 再有一台便宜的计算机 xff0c 和以之献身的决心 xff0c 你即可拥有任何你想拥有的编程深度 xff01 John Carmack
  • Java把字符串中的数字删除的方法和判断字符串里面是否有汉字的方法

    1 把数字删除 String testStr 61 34 大幅度要栽夺工地奇巧地厅革dfdsfdsafd32123313 34 System out println testStr replaceAll 34 0 9 34 34 34 2
  • 氧化还原反应

  • MPI中可能会出现的错误

    1 p1 xxxxx p4 error interrupt SIGSEGV 11 这个错误可能是因为某个进程中出现了段错误引起的 自己编程中曾出现过的错误 1 只在一个进程中给指针申请空间 而在其他进程没有申请 所以在广播的时候出错 2 在