如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值？

2023-12-01

较新版本的 CMake（3.18 及更高版本）“了解”CUDA 代码编译目标的 CUDA 架构的选择。目标有一个CUDA_ARCHITECTURES属性，设置后会生成适当的-gencode arch=whatever,code=whatever为您提供编译选项。如果您不设置此值，您甚至会收到警告：

CMake Error in CMakeLists.txt:
  CUDA_ARCHITECTURES is empty for target "my_cuda_app".

默认情况下，该目标属性被初始化为CMAKE_CUDA_ARCHITECTURES. But CMAKE_CUDA_ARCHITECTURES其本身未初始化为任何内容（！）

我们如何让 CMake 自动检测适当的值CUDA_ARCHITECTURES或全球CMAKD_CUDA_ARCHITECTURES？也就是说，使用系统上安装的 GPU 的架构？

在即将推出的 CMake 3.24 中，您将能够编写：

set_property(TARGET tgt PROPERTY CUDA_ARCHITECTURES native)

这将建立目标tgt用于配置时系统上可用的 GPU 的（具体）CUDA 架构。

对于较新版本的 CUDA（11.5 及更高版本），将通过native到 nvcc 和其他可执行文件；对于旧版本，它将自动检测哪些架构是“本机”架构。

Caveat:这实际上并没有为您提供架构列表（例如，在您的 CMake 代码中进行迭代。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CMake

CUDA

NVIDIA

buildautomation

computecapability

如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值？的相关文章

为什么 cudaGLSetGLDevice 失败，即使它是在 main 函数的第一行中调用的

我想使用 OpenGL 和 CUDA 之间的互操作性我知道正如一些教程所说第一步是选择设备但是当我在主函数的第一行中调用 cudaGLSetGLDevice 0 时程序退出并显示信息 cudaSafeCall 运行时 API 错
在 Cuda 中简单添加两个 int，结果始终相同

我开始了学习Cuda的旅程我正在玩一些 hello world 类型的 cuda 代码但它不起作用我不知道为什么代码非常简单取两个整数并将它们添加到 GPU 上并返回结果但无论我将数字更改为什么我都会得到相同的结果如果数学那
Perl 构建、单元测试、代码覆盖率：一个完整的工作示例

我找到的关于 Perl 构建过程单元测试和代码覆盖率的大多数 Stackoverflow 答案都只是将我指向 CPAN 那里的文档指向 CPAN 模块绝对没有任何问题因为完整的文档应该位于此处不过在很多情况下我很难找到完整的工作
CMAKE - 运行时库隐藏文件

我正在运行 Linux Redhat 我安装了 Anaconda 并且我正在尝试使用安装程序 libspimage CMAKEamd 我收到以下警告错误 src CMakeLists txt 74 ADD LIBRARY 处的 CMake
使用推力来处理 CUDA 类中的向量？

我对 C 类的推力的适用性有疑问我正在尝试实现一个类对象该对象接收顶点的 x y z 坐标作为 ver1 ver2 和 ver3 然后分配给一个三角形并计算面积和法向量然而我不太明白如何创建一类推力向量这是我从文件中读取的顶点坐
使用 CMake 编译时更改头文件位置会导致缺少 vtable 错误

对于一个大型 C 项目我需要从 qmake 过渡到 CMake 但是在处理一个玩具示例时我遇到了一些我不理解的行为示例代码具有单个头文件当该头文件移动到子目录中时我收到 MainWindow 类缺少 vtable 的错误 CMak
布尔实现的atomicCAS

我想弄清楚是否存在错误答案 https stackoverflow com a 57444538 11248508 现已删除关于Cuda like的实现atomicCAS for bool是答案中的代码重新格式化 static inl
编译器标志的 cmake list 附加会产生虚假结果？

我需要向 CMake 文件 CMake 2 8 10 2 中的 C 和 C 编译行添加各种标志我看到有些人使用add definitions但据我所知这是用于预处理器标志的 D 我有一些标志不想传递给预处理器所以我一直在尝试修改CMA
cudaMalloc使用向量>进行管理 > C++ - NVIDIA CUDA

我正在通过 NVIDIA GeForce GT 650M GPU 为我创建的模拟实现多线程为了确保一切正常工作我创建了一些辅助代码来测试一切是否正常在某一时刻我需要更新变量向量它们都可以单独更新这是它的要点 device int
CUDA 中的 JPEG 库

我正在尝试在 CUDA 中压缩和解压缩图像到目前为止我已经找到了这个库 http sourceforge net projects cuj2k source navbar http sourceforge net projects cuj
了解流式多处理器 (SM) 和流式处理器 (SP)

我正在尝试了解 GPU 的基本架构我已经阅读了很多材料包括这个非常好的答案 https stackoverflow com a 2213744 2386113 但我仍然很困惑无法得到一个好的图片我的理解 GPU 包含两个或多个流式多
如何转储所有 NVCC 预处理器定义？

我想达到同样的效果 gcc dM E lt dev null 如所描述的here https stackoverflow com q 2224334 1593077 但对于 nvcc 也就是说我想转储所有 nvcc 的预处理器定义唉 n
CMakeLists.txt:30（项目）处的 CMake 错误：找不到 CMAKE_C_COMPILER

我正在尝试使用 CMake 制作 Visual Studio 解决方案来编译最新版本的 aseprite 并且 CMake 不断向我提供 No CMAKE C COMPILER could be found No CMAKE CXX COM
goto 指令对 CUDA 代码中扭曲内发散的影响

对于CUDA中简单的warp内线程发散我所知道的是SM选择一个重新收敛点 PC地址并在两个多个路径中执行指令同时禁用未采用该路径的线程的执行效果例如在下面的代码中 if threadIdx x lt 16 A do someth
cmake 将标头包含到每个源文件中

其实我有一个简单的问题但找不到答案也许你可以给我指一个副本所以问题是是否可以告诉 cmake 指示编译器在每个源文件的开头自动包含一些头文件这样就不需要放置 include foo h 了谢谢 CMake 没有针对此特定用例的
如何使用 Clang 编译器和 CMake 进行分析

Question 1 What output我应该期待当我想使用进行分析时clang编译器 2 我该怎么办profiling for a C project它使用clang作为编译器andCMake 作为构建工具重新分析我所使用的内容 1
为什么 CUDA 内存复制速度会这样，有一些恒定的驱动程序开销？

在我的旧 GeForce 8800GT 上使用 CUDA 内存时我总是会遇到奇怪的 0 04 毫秒开销我需要将 1 2K 传输到设备的常量内存中处理其中的数据并从设备中仅获取一个浮点值我有一个使用 GPU 计算的典型代码 alloc
CMake 链接 glfw3 lib 错误

我正在使用 CLion 并且正在使用 glfw3 库编写一个程序 http www glfw org docs latest http www glfw org docs latest 我安装并正确执行了库中的所有操作我有 a 和 h 文
使用 QWT 构建时出错

我收到一个错误 undefined reference to QwtPlot QwtPlot QWidget 当我尝试构建我的项目时即使设置中一切看起来都很好在我的 CmakeLists txt 中我有 include director
如何使用 Git 子模块和 CMake 处理传递依赖冲突？

我们有许多 Git 存储库有些包含我们自己的代码有些包含稍作修改的第三方库代码简化的依赖图如下所示 executable A v library B v v library C 所以可执行文件有两个依赖项library C 一种是直接

随机推荐

Angular $http.delete CORS 错误（预检请求）

我有一个 Angular 应用程序 v1 13 15 和 Express js v4 12 4 作为后端我的后端有一个 DELETE 方法并且我已为其启用了 CORS 支持但是当我使用 Angular http delete 时我
手风琴表格单元格 - 用于展开和折叠 ios

我正在尝试以手风琴单元格模式展开折叠表格视图单元格这样当用户点击该行时他们将通过扩展行高来获得单元格内所选行的详细描述我有 2 个数组 array 和 detailarray 分别用于在 cell textLabel text 和
检查哈希表集合中是否存在键/值对

我有急速的 Hashtable hash new Hashtable hash Add a 1 hash Add b 2 hash Add c 3 hash Add c 4 现在我需要检查 Key c 和 value 3 组合是否已存在于哈
如何实现我创建的需要从文件读入的函数？

我有这个功能 errorLim 0 3 def getQMulti ppm errorLim x ppm peakAvg errorLim q getQ x x0 2 0 q0 getQ x0 QMulti 1 0 q math abs q
Microsoft.AspNetCore.Identity.UserManager：警告：用户验证失败：InvalidUserName;InvalidEmail

我需要创建一个具有用户名名字姓氏和电子邮件字段的用户我正在使用 Mysql 数据库和 Pomelo 包迁移和数据库更新工作正常此代码会导致失败 public async Task
Java Math.pow() 舍入误差

我遇到了我怀疑是舍入错误的问题我有一根绳子 0 686357E 01 我正在尝试将其转换为双精度我已经能够使用将其拆分Pattern split 函数我正在捕获基数和指数值然而一旦我尝试将它们适当相乘我得到的结果是 0 06
滚动时，推送列中的 Bootstrap Affix 菜单与 Safari 中的主要内容重叠

这可能是 Bootstrap 本身的一个错误但我仍然有兴趣看看是否有人可以提出修复或至少提供一些帮助要直接跳到问题所在请在 Safari 中打开此 jsfiddle 并开始向下滚动页面 http jsfiddle net davere
PreferredStatusBarStyle var 在 iOS12 中不起作用？

Adding application statusBarStyle lightContent 我的 AppDelegate didFinishLaunchingWithOptions 方法未添加 override var preferred
从我的 VB.NET 2008 项目访问 MySQL 数据库

我用VB NET开发了一个项目在这个项目中我想使用驻留在我的 WEB 服务器中的 MySQL 中的数据我可以与本地主机的 MySQL 服务器通信但无法与 WEB 服务器通信在我的 CPanel 中我添加了主机远程数据库访问但我
Delphi Xpath XML 查询

我正在尝试找到的值在以下 XML 文件中使用XPath query
查找具有所有公共中介的节点

我正在创建一个我们匹配的系统orders to staff 从概念上讲一个order是对人做一些工作的请求并且staff是一个能够完成这项工作的人一个order可以有一个或多个requirements 即对谁可以做这项工作的限制以及
Ghostscript 灰度转换仍然包含颜色？

如果 pdf 确实包含颜色我需要将其转换为灰度为此我找到了一个脚本可以确定 pdf 是否已经处于灰度状态 convert source pdf colorspace RGB unique colors txt 2 gt dev nu
将 $_POST 与文本区域一起使用时出现问题

我在网站上有一个简单的联系表单有 2 个文本字段 1 个文本区域和 1 个隐藏字段由于某种原因除文本区域之外的所有字段都 POST 到 PHP 脚本我以前已经这样做过一千次了但从来没有遇到过这个问题这是我的 HTML
在没有 Office 365 订阅的情况下使用 Azure 多租户应用程序来访问用户日历信息

我们编写了一个服务应用程序该应用程序从组织租户的多个日历中读取 Office 365 日历信息并对条目进行一些分析为此我们使用 Office 365 REST API 我们有多个客户组织租户需要此功能因此我已按照以下步骤操
在大型数据库中如何优化数据库这个查询？

Query SELECT id FROM user tmp WHERE code 9s5xs1sy AND go NOT REGEXP http www xxxx example com aflam http xx example com
使用特定字符在 Python 中拆分字符串

我正在尝试按特定字符分割输入的文档我需要在和处将它们分开但我很难弄清楚这一点 def main for x in docread words x split for word in words doclist append word
如何使用GAE访问GCE上的mongodb

我已经在 GAE 上部署了我的演示应用程序并且与 mLab 一起正常工作但是当我尝试在 GCE MongoDB Google Click to Deploy 上部署 mongodb 时部署成功但我不知道如何设置 URI我的应用程序在
找不到我的实体框架数据库

我对代码优先实体框架数据库有点困惑我创建了一个新的 DbContext 和类将其存储在该上下文中如下所示 namespace MyProject Subproject Something public class MyItem pub
Android sqlite / BLOB 性能问题

自从我将数据从 ArrayList 移动到 Android 上的 sqlite 数据库后我的性能出现了严重下降没有打开的游标可能会导致这种情况因此我怀疑问题出在我存储在 BLOB 字段中的图像该应用程序创建Cards有一个字段卡位图
如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值？

较新版本的 CMake 3 18 及更高版本了解 CUDA 代码编译目标的 CUDA 架构的选择目标有一个CUDA ARCHITECTURES属性设置后会生成适当的 gencode arch whatever code whateve

如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值？

如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值？ 的相关文章

随机推荐

热门标签

如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值？的相关文章