如何选择带有CUDA的GPU？

2023-12-05

我有一台带有 2 个 GPU 的计算机；我编写了一个 CUDA C 程序，我需要以某种方式告诉它我只想在 2 个显卡中的 1 个上运行它；我需要输入什么命令以及如何使用它？我相信这与cudaSetDevice但我真的不知道如何使用它。

应该很清楚的文档cudaSetDevice，但让我提供以下代码片段。

bool IsGpuAvailable()
{
    int devicesCount;
    cudaGetDeviceCount(&devicesCount);
    for(int deviceIndex = 0; deviceIndex < devicesCount; ++deviceIndex)
    {
        cudaDeviceProp deviceProperties;
        cudaGetDeviceProperties(&deviceProperties, deviceIndex);
        if (deviceProperties.major >= 2
            && deviceProperties.minor >= 0)
        {
            cudaSetDevice(deviceIndex);
            return true;
        }
    }

    return false;
}

这就是我迭代所有可用 GPU 的方式（cudaGetDeviceCount）寻找计算能力至少为 2.0 的第一个。如果找到这样的设备，那么我使用cudaSetDevice因此所有 CUDA 计算都在该特定设备上执行。不执行cudaSetDevice你的 CUDA 应用程序将在第一个 GPU 上执行，即带有deviceIndex == 0但具体是哪个 GPU 取决于哪个 GPU 位于哪个 PCIe 插槽中。

EDIT:

在评论中澄清您的问题后，在我看来，您应该适合根据设备名称来选择设备。如果您不确定实际的 GPU 名称，请运行以下代码，该代码会将所有 GPU 的名称打印到控制台中：

int devicesCount;
cudaGetDeviceCount(&devicesCount);
for(int deviceIndex = 0; deviceIndex < devicesCount; ++deviceIndex)
{
    cudaDeviceProp deviceProperties;
    cudaGetDeviceProperties(&deviceProperties, deviceIndex);
    cout << deviceProperties.name << endl;
}

之后，选择要用于计算的 GPU 的名称，假设它是"GTX XYZ"。从您的系统中调用以下方法main方法，多亏了它，所有 CUDA 内核都将在具有名称的设备上执行"GTX XYZ"。您还应该检查返回值 -true如果找到具有该名称的设备，false否则：

bool SetGPU()
{
    int devicesCount;
    cudaGetDeviceCount(&devicesCount);
    string desiredDeviceName = "GTX XYZ";
    for(int deviceIndex = 0; deviceIndex < devicesCount; ++deviceIndex)
    {
        cudaDeviceProp deviceProperties;
        cudaGetDeviceProperties(&deviceProperties, deviceIndex);
        if (deviceProperties.name == desiredDeviceName)
        {
            cudaSetDevice(deviceIndex);
            return true;
        }
    }

    return false;
}

当然你必须改变的值desiredDeviceName变量到期望值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

GPU

如何选择带有CUDA的GPU？的相关文章

大型跨平台软件项目的技巧/资源

我将开始一个大型软件项目涉及跨平台 GUI 和大量的数字运算我计划用 C 和 CUDA 编写大部分应用程序后端并用 Qt4 编写 GUI 我计划使用 Make 作为我的构建系统这将是一个只有两名开发人员的项目一旦我相对深入地了解它
cuda 文件组织的有效方式：.cpp .h .cu .cuh .curnel 文件

cuda最容易理解最高效的代码组织是什么经过一番调查后我发现 cuda 函数声明应位于 cuh 文件中实现位于 cu 文件中内核函数实现位于 curnel 文件中其他 C 内容通常在 cpp 和 h 文件中最近我发布了一个问题
有没有好的 GLSL 哈希函数？

所以我对这个问题的古老评论仍然得到了支持 GLSL rand 这一行代码的起源是什么 https stackoverflow com questions 12964279 whats the origin of this glsl rand
在没有 SurfaceView 的 Android 上获取 GPU 信息

在Android上有没有一种方法可以在不创建SurfaceView的情况下获取GPU信息我不想使用 OpenGL 绘制任何内容但我只需要获取硬件信息例如供应商 OpenGL ES 版本可用扩展等抱歉我不知道如何在 Androi
Tensorflow：Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

我正在从源安装tensorflow 文档 https www tensorflow org versions r0 10 get started os setup html installing from sources Cuda驱动版本
CUDA Thrust 的多 GPU 使用

我想使用我的两张显卡通过 CUDA Thrust 进行计算我有两张显卡在单卡上运行对于两张卡都适用即使我在 std vector 中存储两个 device vector 也是如此如果我同时使用两张卡循环中的第一个周期将起作用并且不
CUDA NSight 未随 Windows 8 上的 CUDA 5.0 安装文件一起安装？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案据我所知 Nvidia 网站上没有 Nsight Eclipse 的下载链接它说它将由 CUDA 5 安装本机安装但并没有随CUDA安装一起安装
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
OpenCV 2.4.3rc 和 CUDA 4.2：“OpenCV 错误：没有 GPU 支持”

我在这张专辑中上传了几张截图 https i stack imgur com TELST jpg https i stack imgur com TELST jpg 我正在尝试在 Visual Studio 2008 中的 OpenCV 中
CUDA 8 编译错误 -std=gnu++11

我正在尝试转换一些代码以使用 CUDA 并且我认为我遇到了兼容性问题我们使用CMake 这些是我使用的 gcc 和 CUDA 版本 gcc version gcc Ubuntu 5 4 0 6ubuntu1 16 04 5 5 4 0 2
GPU上动态分配内存

是否可以在内核内的 GPU 全局内存上动态分配内存我不知道我的答案有多大因此我需要一种方法为答案的每个部分分配内存 CUDA 4 0 允许我们使用 RAM 这是一个好主意还是会降低速度可以在内核中使用 malloc 检查以下内容摘自
CUDA-Kernel 应该根据块大小动态崩溃

我想做稀疏矩阵密集向量乘法假设用于压缩矩阵中条目的唯一存储格式是压缩行存储 CRS 我的内核如下所示 global void krnlSpMVmul1 float data mat int num nonzeroes unsigned
如何从C++头文件调用CUDA文件？

我知道从 c 文件调用 cu 文件的方法但现在我想从 C 头文件调用 cu 文件有可能做到吗如果是这样我应该如何设置我的项目请帮忙这是一个有效的例子 file1 h int hello file2 h include
Tensorflow新Op CUDA内核内存管理

我已经使用 GPU CUDA 内核在 Tensorflow 中实现了一个相当复杂的新 Op 该操作需要大量动态内存分配这些变量不是张量并且在操作完成后被释放更具体地说它涉及使用哈希表现在我正在使用cudaMalloc and cu
如何强制tensorflow使用所有可用的GPU？

我有一个 8 GPU 集群当我运行Kaggle 的一段 Tensorflow 代码 https www kaggle com keegil keras u net starter lb 0 277 scriptVersionId 2164
为什么使用 boost::none 无法通过 nvcc 编译？

我正在尝试编译以下代码 include
如何降级cuda版本

我目前使用的是 cuda 版本 4 2 但我需要将其更改为 3 1 是否可以卸载当前版本 4 2 版然后安装以前的版本 3 1 版编辑请参阅我的操作系统是linux ubuntu 10 04 64位编辑我找到了如何获取 3 1 版
Mxnet - 缓慢的数组复制到 GPU

我的问题我应该如何在 mxnet 中执行快速矩阵乘法我的具体问题数组复制到 GPU 的速度很慢对此我们能做些什么呢我创建随机数组将它们复制到上下文中然后相乘 import mxnet as mx import mxnet nd
针对“CUDA 驱动程序版本不足以满足 CUDA 运行时版本”该怎么办？

当我去 usr local cuda samples 1 Utilities deviceQuery并执行 moose pc09 usr local cuda samples 1 Utilities deviceQuery sudo mak
与 CUDA 占用计算器不同的实验结果

我研究CUDA架构我在如下环境中编写了一些并行处理代码 GPU GTX580 CC为2 0 每块线程 16x16 256 每线程寄存器 16 每块共享内存 48 字节我通过编译选项知道寄存器的数量和共享内存的大小 ptxas optio

随机推荐

Java中Json反序列化 /w Jackson 混合类型，包含在一个数组中

考虑以下从公共 API 获取的 json anyObject attributes name anyName value anyValue name anyName value key anyKey
如何使用 Objective-c 从视频电影文件中获取元数据？

有什么帮助吗现在可以获得 NSSize 持续时间及其所有内容您几乎可以完全使用 Spotlight 的元数据来完成此操作例如我在我的一个应用程序中执行以下操作 MDItemRef fileMetadata MDItemCreate
如何在 Python 3 中使用过滤器、映射和归约

这就是我习惯的方式filter map and reduce在 Python 2 中工作 gt gt gt def f x return x 2 0 and x 3 0 gt gt gt filter f range 2 25 5 7 11
运行使用 scrapy 和 selenium 创建的解析器时出现问题

我用Python scrapy结合selenium写了一个scraper来抓取一些titles来自网站这css selectors我的刮刀中定义的内容是完美的我希望我的抓取工具继续点击下一页并解析每个页面中嵌入的信息它在第一页上做得很
如何使用TIdTCPServer持续发送消息？

我需要创建一个delphi应用程序当它启动时服务器也会启动并立即开始发送消息但我还没有找到示例或教程并且近5000页的Indy手册并没有让我清楚我如何可以做到这一点此示例使用带有主窗体的 Delphi 2009 VCL 应用程序
如果链接不存在，如何跳过测试用例并转到机器人框架中的下一个链接

设想主页有5个链接链接1 链接2 链接3 链接4 链接5 上面每个环节都是单独的测试用例所以一共有5个测试用例根据要求所有链接可能不会出现在所有站点中所以我需要写一个机器人框架对所有站点动态工作的测试用例例如 1 个站点可能有
如何在java中使用JSlider增加/减少图像的亮度？

我正在使用java swing技术在netbeans平台上制作应用程序我想对捕获的图像进行图像处理该图像是由X射线枪捕获的之后我想使用JSlider增加减少图像的亮度我使用paintComponent完成此操作图g 法但我想在
可以在我们的活动中查看 Log.i 的 logcat 结果吗？

我想在我的应用程序中显示 Log i 结果是否可以如果是这样我该怎么办这是一个blogpost这正是您需要它做的事情它有一个关于如何显示 Logcat 日志内容的完整代码示例这是代码 import java io Buffere
当前会话的 IDENT_CURRENT 等效值

我需要严格获取当前会话的特定表中最后插入的行我不能使用 IDENTITY and SCOPE IDENTITY 因为它们将返回任何表的最后插入的标识问题在于IDENT CURRENT是它将返回特定表但任何会话的记录的最后插入标识这对我
动态链接服务器查询

是否可以为链接服务器构造动态查询如果可以如何构造例如 linkedServer varchar 50 var1 varchar 10 var2 varchar 10 select from openquery linkedServer
如果 python 中的列之间存在任何 NaN 值，如何处理脚本

我正在尝试处理一个脚本我正在尝试查找列之间的月份该脚本工作正常但每当任何字段为空时它就会出错如果任何 NaN 值介于两者之间则它必须跳过并移动到下一行如何解决该错误输入数据 Month1 Month2 Month list
如何获取 UITabBarController 中超过 5 个项目的选定 UITabBarItem 的标签？

在我创建的故事板中UITabBarController与另一个视图控制器有 6 个关系所以现在我有6个UITabBarItems 我将它们标记为0 to 5 这就是为什么我检测到什么UITabBarItem由用户选择 NOTE 我无法使用
Spring Security 3.1.4 taglib 授权/身份验证不适用于 Tomcat 7 上的 JSF 2.2 中的角色层次结构

对于通过 http 命名空间定义为拦截 URL 的 Web 安全表达式会考虑角色层次结构但在使用 JSP 授权标签库的表达式中则不会我已经读了很多东西了 ref1 ref2 ref3 ref4 ref5 ref6 编辑 Ref1 和
为什么 DBContext 放入 IMemoryCache 后会被释放（.NET Core / EF Core）

我试图将 db data 的子集放入 IMemoryCache 中但第二次调用该应用程序时出现错误 ObjectDisposeException 无法访问已处置的对象导致此错误的一个常见原因是处置从依赖项注入解析的上下文然后尝试在应
目录 api 的 gsuite 服务帐户返回 http 400 错误：请求错误/输入无效

我已经开始开发一些 api 来在我的 G suite 目录中创建用户我跟着服务帐户教程随着目录教程对于蟒蛇我的代码非常简单只是为了测试它如何工作 from google oauth2 import service account fr
有没有办法在链接时设置 elf NEEDED 字段？

给定一个可执行文件 gt objdump x someprog grep c NEEDED libstdc so 6 我想将要求更改为完整版本包括次要版本和补丁级别 gt objdump x someprog grep c NEEDED
根据半径计算从正方形中心到边缘的矢量

给定一个正方形由 x y 宽度高度描述和一个角度以弧度为单位我需要计算一个向量该向量源自正方形中心并终止于以给定角度与正方形边缘碰撞的点我真的对它的碰撞点最感兴趣所以如果这会使计算更有效请告诉我这可以推广到矩形吗一般而
函数中的动态选择表达式[重复]

这个问题在这里已经有答案了我正在尝试编写一个函数来转换此数据框 library dplyr library rlang library purrr df lt data frame obj c 1 1 2 2 3 3 3 4 4 4 S1
更改 IE 中禁用的文本框的字体颜色

我注意到您可以更改文本框中文本的颜色这些颜色在 Firefox 中应用一个简单的类被禁用但在 IE 6 7 中无法找到方法有没有人有一个优雅的解决方案来实现这一目标我注意到您可以更改在 Firefox 中禁用的文本框中文本的颜色我
如何选择带有CUDA的GPU？

我有一台带有 2 个 GPU 的计算机我编写了一个 CUDA C 程序我需要以某种方式告诉它我只想在 2 个显卡中的 1 个上运行它我需要输入什么命令以及如何使用它我相信这与cudaSetDevice但我真的不知道如何使用它应该很

如何选择带有CUDA的GPU？

如何选择带有CUDA的GPU？ 的相关文章

随机推荐

热门标签

如何选择带有CUDA的GPU？的相关文章