cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法

2023-11-19

初学CUDA，使用的NVIDIA显卡是Tesla K80, 安装的是cuda8.0

写了一个简单的测试程序，使用nvcc编译，指令如下： nvcc cudaPrintDeviceInfo.cu -o cudaPrintDeviceInfo

本以为会很顺利地生成执行文件。但还是出现了warning:

nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).

查阅了一些资料，发现这只是提示build target 2.0, 2.1被弃用了。

如果不想让这些提示出现，只需要在编译时加上一个参数，表示基于自己显卡的计算能力选择build target即可。

Tesla K80支持CUDA compute ability 3.7, 因此在编译时使用如下命令：

nvcc -arch=sm_35 cudaPrintDeviceInfo.cu -o cudaPrintDeviceInfo

即可解决问题。

可参考： http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#warp-examples-broadcast

其中Application Compatibility部分有如下解释：

YES！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

nvcc warning

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法的相关文章

CUDA 估计 2D 网格数据的每块线程数和块数

首先我要说的是我已经仔细阅读了所有类似的问题确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
Nvcc 的版本与 CUDA 不同

我安装了 cuda 7 但是当我点击 nvcc version 时它打印出 6 5 我想在 GTX 960 卡上安装 Theano 库但它需要 nvcc 7 0 我尝试重新安装cuda 但它没有更新nvcc 当我运行 apt get i
如何在 CUDA 中执行多个矩阵乘法？

我有一个方阵数组int M 10 以便M i 定位第一个元素i th 矩阵我想将所有矩阵相乘M i 通过另一个矩阵N 这样我就收到了方阵数组int P 10 作为输出我看到有不同的可能性分配不同元素的计算M i 到不同的线程例如我
CUDA 常量内存是否应该被均匀地访问？

我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化如果是如何确保所有线程同时访问同一地址既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化是的这缓存本身每
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
如何在cmake中添加cuda源代码的定义

我使用的是 Visual Studio 2013 Windows 10 CMake 3 5 1 一切都可以使用标准 C 正确编译例如 CMakeLists txt project Test add definitions D WINDOW
TensorRT 多线程

我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它其中 Cuda 上下文与所有线程一起使用在单个线程中一切正常我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和
cuda中内核的并行执行

可以说我有三个全局数组它们已使用 cudaMemcpy 复制到 GPU 中但 c 中的这些全局数组尚未使用 cudaHostAlloc 分配以便分配页面锁定的内存而不是简单的全局分配 int a 100 b 100 c 100 cu
cudaMemcpy() 与 cudaMemcpyFromSymbol()

我试图找出原因cudaMemcpyFromSymbol 存在似乎 symbol func 可以做的所有事情 nonSymbol cmd 也可以做 symbol func 似乎可以轻松移动数组或索引的一部分但这也可以使用 nonSymbo
具有 Cuda Thrust 的多个 GPU？

如何将 Thrust 与多个 GPU 一起使用这只是使用 cudaSetDevice deviceId 的问题吗然后运行相关的 Thrust 代码使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
如何在CUDA应用程序中正确应用线程同步？

一般来说我在应用程序中偶尔会使用线程同步因为我并不经常需要此功能我并不是真正的高级 C C 程序员但我也不是初学者我开始学习 CUDA C 对当今 GPU 与 CPU 的能力相比感到兴奋我意识到 CUDA 编程主要是关于并行线程
摆脱异步 cuda 流执行期间的忙等待

我正在寻找一种方法如何摆脱以下代码中主机线程中的忙等待不要复制该代码它仅显示我的问题的想法它有许多基本错误 cudaStream t steams S N for int i 0 i lt S N i cudaStreamCreat
Cuda：最小二乘求解，速度较差

最近我使用Cuda编写了一个名为正交匹配追踪的算法在我丑陋的 Cuda 代码中整个迭代需要 60 秒而 Eigen lib 只需 3 秒在我的代码中矩阵 A 是 640 1024 y 是 640 1 在每一步中我从 A 中
如何安装libcusolver.so.11

我正在尝试安装 Tensorflow 但它要求 libcusolver so 11 而我只有 libcusolver so 10 有人可以告诉我我做错了什么吗这是我的 Ubuntu nvidia 和 CUDA 版本 uname a Lin
如何在没有 nvcc 的情况下在编译时获取 CUDA 工具包版本？

我在 cpp 文件中对 cuSPARSE 库进行了一些调用这些调用在旧工具包中不可用为了支持使用旧工具包的系统我想使用编译器指令编译不同的代码部分特别是我想使用旧工具包的 CSR 格式矩阵和新工具包的 BSR 格式矩阵来求解稀疏三
CUDA-Kernel 应该根据块大小动态崩溃

我想做稀疏矩阵密集向量乘法假设用于压缩矩阵中条目的唯一存储格式是压缩行存储 CRS 我的内核如下所示 global void krnlSpMVmul1 float data mat int num nonzeroes unsigned
完全禁用 NVCC 优化

我正在尝试测量 GPU 上的峰值单精度触发器为此我正在修改 PTX 文件以在寄存器上执行连续的 MAD 指令不幸的是编译器正在删除所有代码因为它实际上没有做任何有用的事情因为我没有执行任何数据的加载存储是否有编译器标志或编译指
CUDA 代码会损坏 GPU 吗？

在测试包含内存错误的 CUDA 时我的屏幕被冻结了重新启动后我无法再检测到显卡我的代码是否有可能物理损坏该卡这发生在 Ubuntu 14 04 下我不知道该卡的型号因为我无法检测到它但我记得它是一张相当新的卡感谢所有的评论我
cudaMalloc使用向量>进行管理 > C++ - NVIDIA CUDA

我正在通过 NVIDIA GeForce GT 650M GPU 为我创建的模拟实现多线程为了确保一切正常工作我创建了一些辅助代码来测试一切是否正常在某一时刻我需要更新变量向量它们都可以单独更新这是它的要点 device int
如何降级cuda版本

我目前使用的是 cuda 版本 4 2 但我需要将其更改为 3 1 是否可以卸载当前版本 4 2 版然后安装以前的版本 3 1 版编辑请参阅我的操作系统是linux ubuntu 10 04 64位编辑我找到了如何获取 3 1 版

随机推荐

linux下安装中文输入法及vim支持中文的方法

最近折腾Ubuntu 之前一直是用英文显示系统输入法也是Ubuntu14默认的拼音一开始也没觉得不好可是在vim编辑文档时需要添加注释这就显得十分不方便所以花点时间来解决这个问题一开始是想找vim如何支持中文的方法网络上的各
Springboot Maven显示缺少org.junit.jupiter.api

原因 spring boot 2 2 之前使用的是 Junit4 而后续的使用的是Junit5 导致缺少包解决方法导入包
C语言-多选题

C语言多选题 1 若有字符串char string和缓冲区char buf MAX LEN string非空并且缓冲区长度MAX LEN大于string的长度则将字符串string复制到缓冲区buf 下列做法正确的是 AB A spri
CentOS 7查看磁盘空间

CentOS如何查看硬盘大小 CentOS是一种基于Linux的操作系统主要用于服务器端应用在服务器管理中硬盘大小是一个非常重要的指标查看硬盘大小可以帮助系统管理员有效地管理硬盘空间和避免硬盘满了的情况方法一使用df命令 df命
Unity 用脚本操作常用UI控件（上）

控件介绍在界面系统的术语中将一个具有独立状态外观和操作的对象称为控件例如常用的交互控件有按钮输入框滑动条等常见的非交互式控件有文本标签图片等 Unity采用了父子物体和组件的设计思想其每个界面控件往往也是由游戏物体挂载
虚拟内存的最大容量与实际容量区别

虚拟内存的最大容量与实际容量区别 1 概念介绍虚拟内存的最大容量是计算机的地址结构 CPU寻址范围决定的虚拟内存的实际容量是内存与外存之和 CPU寻址范围两者的最小值 2 例题介绍某计算机的地址结构是64位按字节编址内存大小51
找准边界，吃定安全

潜在的网络威胁网络安全挑战层出不穷如何确保网络安全山石云景赋能中小企业安全运营让安全更有效找准边界吃定安全往期文章从访问控制谈起再看零信任模型威胁情报加持泛边界下的全局主动防御体系如何着手流量剧增看山石网科如何打
UWB与蓝牙AOA定位技术简要对比

1 UWB基本原理 UWB 超宽带技术是基于IEEE802 15 4a z标准的利用纳秒级窄脉冲进行数据传输的无线通信技术主要服务于微位置 micro location a person s placement to within a
java中如何将Long类型转为Integer类型

注意不能直接在前面加个 int 而是将Long型转换为int型这里的Long型是包装类型 Long a 10 int b a intValue 即long intValue
Hx711调试过程

1 体重板子最开始出现的问题无法下载程序指示灯不亮解决办法检查电源复位晶振发现晶振还有 boot键坏了 2 问题下载进程序以后板子通过串口发到电脑上的数据不变解决办法先是查了关于HX711的各种资料了解到 HX711芯片
pycharm内存不足时如何修改设置？

Help gt Find Action gt type VM Options gt Click Edit Custom VM Options Pycharm 2016 2 will open the appropriate vmoption
MFC中操作Word文档

首先我们需要导入word类库电脑上需要安装了word 左击项目点击类向导添加类 C 选择类型库中的MFC类本文章案例可点击下载然后选择文件位置选择从office安装目录中找到MSWORD OLB文件然后点击 gt gt 添加所
源码探索-ArrayList

ArrayList 继承与实现关系数组的相关属性 ArrayList底层是一个Object 数组既然是数组那么底层的工具类大多是会用到Arrays工具类去实现函数探索来看看构造函数有三个构造函数分别对应不同的生成内容来看看添
linux 2.6.30 内核编译提示 ‘make[1]: *** [arch/x86/vdso/vdso.so.dbg] Error 1’ 错误

linux 2 6 30 编译出现如下错误解决方案打开 linux 2 6 30 arch x86 vdso Makefile 文件 1 修改28行将 m elf x86 64 修改为 m64 2 修改72行将 m elf i386
语音识别学习记录 [再谈频率混叠（定量分析、离散采样后频谱的周期延拓）]

前几天在语音识别学习记录传说中的频率混叠和Nyquist定理定性理解中简单理解了一下频率混叠的原因但是也发现了很多不明白的问题 1 为什么信号经过傅里叶变换后在频域是关于y轴对称的这个问题的回答已经写在语音识别学习记录信号经傅里
vue的指令

Vue 的指令一 Vue 的指令 1 指令的概念指令 Directives 是 vue 为开发者提供的模板语法用于辅助开发者渲染页面的基本结构 vue 中的指令按照不同的用途可以分为如下 6 大类内容渲染指令属性绑定指令事件绑定
SQL 查询指定行数的数据。

今天遇到一个关于查询指定行数的数据的sql查询语句问题突然发现以前没怎么接触过刚才想起来了赶紧看了下文档又上网搜了下有了下面的东西不知道有没有什么地方不对 oracle 先看一下文档中关于any和all的例子很不错噢 An
Pytorch 深度强化学习模型训练速度慢

最近一直在用Pytorch来训练深度强化学习模型但是速度一直很慢 Gpu利用率也很低一起初开始在训练参数 batch size 200 graph size 40 epoch size 100000 训练速度一个epoch要4h 人麻
node学习openai库入门及使用（一）

第一章 node学习openai库入门及使用一文章目录第一章 node学习openai库入门及使用一前言一 node js的openai库是什么二使用步骤 1 引入库 2 发送请求总结前言众所周知目前chatgpt已
cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法

初学CUDA 使用的NVIDIA显卡是Tesla K80 安装的是cuda8 0 写了一个简单的测试程序使用nvcc编译指令如下 nvcc cudaPrintDeviceInfo cu o cudaPrintDeviceInfo 本以为

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法 的相关文章

随机推荐

热门标签

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法的相关文章