OS X 10.8 上的 PyCuda / 多处理问题

2024-05-22

我正在开发一个项目，将计算任务分配给多个 python 进程，每个进程都与其自己的 CUDA 设备关联。

生成子进程时，我使用以下代码：

import pycuda.driver as cuda

class ComputeServer(object):
    def _init_workers(self):
        self.workers = []
        cuda.init()
        for device_id in range(cuda.Device.count()):
            print "initializing device {}".format(device_id)
            worker = CudaWorker(device_id)
            worker.start()
            self.workers.append(worker)

CudaWorker在另一个文件中定义如下：

from multiprocessing import Process
import pycuda.driver as cuda

class CudaWorker(Process):
    def __init__(self, device_id):
        Process.__init__(self)
        self.device_id = device_id

    def run(self):
        self._init_cuda_context()
        while True:
            # process requests here

    def _init_cuda_context(self):
        # the following line fails
        cuda.init()
        device = cuda.Device(self.device_id)
        self.cuda_context = device.make_context()

当我在 Windows 7 或 Linux 上运行此代码时，没有任何问题。在装有 OSX 10.8.2、Cuda 5.0 和 PyCuda 2012.1 的 MacBook Pro 上运行代码时，出现以下错误：

Process CudaWorker-1:
Traceback (most recent call last):
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/multiprocessing/process.py", line 258, in _bootstrap
    self.run()
  File "/Users/tombnorwood/pymodules/computeserver/worker.py", line 32, in run
    self._init_cuda_context()
  File "/Users/tombnorwood/pymodules/computeserver/worker.py", line 38, in _init_cuda_context
    cuda.init()
RuntimeError: cuInit failed: no device

我在运行 PyCuda 脚本时没有任何问题，无需在 Mac 上创建新进程。我仅在生成新进程时遇到此问题。

以前有人遇到过这个问题吗？

这实际上只是根据我的经验进行的有根据的猜测，但我怀疑 CUDA（或可能 PyCuda）的 OS X 实现依赖于一些 API，这些 API 在使用后无法安全使用fork，而 linux 实现则不然。* 由于 POSIX 实现multiprocessing uses fork没有exec创建子进程，这可以解释为什么它在 OS X 上失败而不是在 Linux 上。（在 Windows 上，有is no fork，只是一个spawn等价的，所以这不是问题。）

最简单的解决方案是删除multiprocessing。如果 CUDA 和 PyCUDA 是线程安全的（我不知道它们是否是），并且您的代码不受 CPU 限制（只是 GPU 限制），那么您也许可以直接加入threading.Thread代替multiprocessing.Process并完成它。或者您可以考虑其他并行处理库之一，它们提供类似的 APImultiprocessing。（有少数人使用pp只因为它总是execs…)

然而，它很容易被破解multiprocessing to exec/spawn一个新的 Python 解释器，然后以 Windows 风格而不是 POSIX 风格执行所有操作。（得到every正确使用案例很困难，但正确使用一个特定用例却很容易。）

或者，如果你看一下错误#8713 http://bugs.python.org/issue8713，为了使这项工作总体上正常进行，我们正在做一些工作。并且有工作补丁。这些补丁适用于 3.3，而不是 2.7，因此您可能需要一些调整，但应该不会太多。所以就cp $MY_PYTHON_LIB/multiprocessing.py $MY_PROJECT_DIR/mymultiprocessing.py，修补它，使用mymultiprocessing代替multiprocessing，并在执行其他操作之前添加适当的调用来选择 spawn/fork+exec/最新补丁中调用的任何模式。

* OP 说他也怀疑同样的事情，所以我可能不需要向他解释这一点，但对于未来的读者：这不是关于 Darwin 和其他 Unix 之间的差异，而是关于 Apple 发布了很多非-Unix-y 中级库，如 CoreFoundation.framework、Accelerate.framework 等，使用不安全的分叉后功能（或者只是断言它们在分叉后不会被使用，因为苹果不想放入在他们说“从 10.X 开始，Foo.framework 在 fork 后是安全的”之前，需要进行严格的测试）。另外，如果比较 OS X 和 Linux 处理图形和其他硬件的方式，就会发现 OS X 中的每个进程用户空间中存在更多的中级内容。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OS X 10.8 上的 PyCuda / 多处理问题的相关文章

Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
在Python中重置生成器对象

我有一个由多个yield 返回的生成器对象准备调用该生成器是相当耗时的操作这就是为什么我想多次重复使用生成器 y FunctionWithYield for x in y print x here must be something t
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

是否可以使用 GitHub Action 和 GitHub FTP Deploy 将 Laravel Web 应用程序部署到共享托管？

是否可以deploy the Laravel网络应用程序到共享主机使用 GitHub Action 和 GitHub FTP 部署如果可能的话我应该如何更改 github workflows master yml on push bran
如何在对象的多个方法上使用 functools.partial 并无序冻结参数？

我发现 functools partial 非常有用但我希望能够无序地冻结参数您想要冻结的参数并不总是第一个并且我希望能够将其应用于多个一次在类上使用方法以创建一个代理对象该对象具有与底层对象相同的方法除了它的一些方法参数被冻结
链接器错误无法在库中找到符号名称

g GCC 4 7 2 3 7 6 201 fc18 x86 64 1 SMP Mon Feb 4 15 54 08 UTC 2013 x86 64 x86 64 x86 64 GNU Linux Fedora release 18 Sph
如何重写 Django 中的 model.Manager.create() 方法？

我有很多Hardware模型有一个HardwareType具有各种特征就像这样 models py from django db import models class HardwareType model Models name mod
计算元组中与模式匹配的元素

我有一个矩阵m我想计算零的数量 m 2 0 2 2 4 4 5 4 0 9 4 8 2 2 0 0 我当前的代码如下 def zeroCount M return item for row in M for item in row coun
在 OpenGL 中只使用纹理的 Alpha 通道？

嘿我正在尝试将恒定颜色绘制到帧缓冲区并使用 RGBA 纹理中的 Alpha 通道将其混合我一直在研究 glBlendFunc 和 glBlendColor 但似乎无法找到忽略纹理中的 RGB 值的方法我想我必须自己提取 alpha
像matlab一样在python中连接数组而不知道输出数组的大小

我正在尝试在 python 中连接数组类似于 matlab array1 zeros 3 500 array2 ones 3 700 array array1 array2 我在 python 中做了以下操作 array1 np zero
R 和系统调用

我过去曾使用 R 对命令行进行非常基本的调用例子可以找到here https stackoverflow com questions 3284301 command line in r code 这一次我希望模仿这段从 Windows
使用反向传播算法实现感知器

我正在尝试实现一个具有反向传播的两层感知器来解决奇偶校验问题该网络有 4 个二进制输入第一层有 4 个隐藏单元第二层有 1 个输出我在用this http page mi fu berlin de rojas neural chap
在 Tensorflow 中使用 tf.while_loop 更新变量

我想更新 Tensorflow 中的变量因此我使用 tf while loop 例如 a tf Variable 0 0 0 0 0 0 dtype np int16 i tf constant 0 size tf size a def
理解 Scanf - 处理格式化输入

我正在尝试弄清楚究竟如何scanf作品如果我编写这样的代码 scanf s d f name age wage 输入此作为标准输入 james 20 34000 25 然后分别打印出姓名年龄和工资我得到的正是人们所期望的与我输入标准
通过 WebStart 运行时 Java 7 更新 55 JacORB 错误

自从更新到 Java 7 update 55 以来我无法运行我的 WebStart java 应用程序当通过 WebStart 启动时该应用程序在 Java 7 update 51 下运行良好当在 WebStart 之外启动时它还
文件是通过 Visual Studio 下载的，但不是通过 .exe 下载的

当我尝试下载 a 时出现以下错误 pdf通过我的网址从文件 exe file 服务器违反了协议部分响应头详细信息 CR 后必须跟 LF 但当我尝试从 Visual Studio 调试代码时也会下载同样的内容我完全迷失了不知道发生
Python/curve_fit：无法通过初始化猜测传递数组

我有这个函数来计算某种多项式 def pipoly df pj n np size pj p pj 0 for j in range 1 n p pj j df j return p pj应该是一个包含多项式系数的初始猜测的数组因此多项
在实体框架 6 中使用 SqlQuery>

我正在尝试在 EF 6 中执行 SQL 查询 select查询返回两个字符串列例如select a b 并且可以有任意数量的行我想将结果映射到字典但我无法摆脱以下错误错误 1 无法将类型 System Data Entity Inf
如何使角度表单只读并可使用编辑按钮进行编辑？

有没有办法让整个 Angular 表单只读然后在单击编辑时可编辑您可以按照当前答案评论中的建议单独禁用所有表单元素也可以将所有表单元素包装在 fieldset 更多信息 https developer mozilla org en
Gitolite git 克隆错误

我正在尝试在我的服务器 Macos 服务器上设置 gitolite 我按照此处找到的安装文档中的说明进行操作 http sitaramc github com gitolite doc 1 INSTALL html http sitara
解压文件的简单方法

有没有一种简单的方法可以用 Go 解压文件现在我的代码是 func Unzip src dest string error r err zip OpenReader src if err nil return err defer r Cl
使用 lapply、Reduce 和 union 折叠 data.table 中的行

我有一个 data table 示例 JACcar 它应该使用下面的代码根据 ID 折叠成一行但是我不明白为什么它不会折叠少于 2 行我还尝试通过将列限制为仅包含 NA 以外的值的列来验证我的输出因为原始数据中有 123 列有人可
OS X 10.8 上的 PyCuda / 多处理问题

我正在开发一个项目将计算任务分配给多个 python 进程每个进程都与其自己的 CUDA 设备关联生成子进程时我使用以下代码 import pycuda driver as cuda class ComputeServer obje

OS X 10.8 上的 PyCuda / 多处理问题

OS X 10.8 上的 PyCuda / 多处理问题 的相关文章

随机推荐

热门标签

OS X 10.8 上的 PyCuda / 多处理问题的相关文章