ubuntu16.04+GTX1650 安装cuda,驱动会自动安装!+安装cudnn

2023-05-16

补充一句

只是做深度学习跑模型的话,装完驱动后就可以了,不需要额外按照NVIDIA官网的教程配置CUDA和CUDNN!!
我们的代码实际用到的是python环境下的包。比如我用anaconda配置环境,直接在python环境下安装pytorch cudatoolkit就好了。
目前网上的教程提到配环境,几乎都是装完驱动再装cuda和cudnn,实际上后面两个步骤对AI研究者来说,并不必要!
直接在anaconda里配置环境就好了!

按照官网教程安装pytoch cudatoolkit等,cudnn 已经内置在pytorch 中。

conda list
cudatoolkit               11.3.1               h2bc3f7f_2    defaults
pytorch                   1.10.0          py3.7_cuda11.3_cudnn8.2.0_0    file:///home/xiu/Downloads/packages

使用 PyTorch 查看 CUDA 和 cuDNN 版本:

import torch
print(torch.__version__)

print(torch.version.cuda)
print(torch.backends.cudnn.version())

conda安装pytorch后没有找到cudnn

安装CUDA,自动安装驱动

网上一大堆通过runfile来安装的范例,但个人尝试后all not work,最后通过官网教程得以成功安装,并意外发现直接安装cuda是会自动安装显卡驱动的!!(deb文件会自动安装,网上其他案例里选择runflie的话好像是可以选择是否要安装驱动)
以下是一些成功安装的经历。

直接从官网找对应的CUDA Toolkit,点击进行下载。
在这里插入图片描述
根据自己电脑配置对应选择,安装类型我选择了deb(local)。按照官方给出的指令进行下载。
在这里插入图片描述

按照官方给出的指令执行后,在安装过程中自动安装了对应的显卡驱动!!!早知道就不折腾上网找驱动的安装教程了,直接安装cuda,自动安装驱动的方式不好吗!!

安装NVIDIA驱动教程,试了一圈都没用:
https://tensorflow-notes.readthedocs.io/zh_CN/latest/nv-driver.html
Ubuntu16.04下安装cuda和cudnn的三种方法(亲测全部有效

安装完成后reboot,独显可以正常显示了!!
在这里插入图片描述
在这里插入图片描述
内心沸腾!!!

nvcc -V不显示问题

但此时输入 nvcc -V显示没用安装,

xiu@xiu:~$ nvcc -V
The program 'nvcc' is currently not installed. You can install it by typing:
sudo apt install nvidia-cuda-toolkit

网上搜索,原来是环境变量没有设置,
打开~/.bashrc ,添加环境变量export PATH=$PATH:/usr/local/cuda/bin
重新执行nvcc -V,输出显示cuda版本为11.1.
(参考:解决nvcc找不到的问题)

xiu@xiu:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Oct_12_20:09:46_PDT_2020
Cuda compilation tools, release 11.1, V11.1.105
Build cuda_11.1.TC455_06.29190527_0

大功告成!

安装cudnn

参考:
cuDNN的安装(版本选择, Runtime 还是 Developer)

Ubuntu16.04下安装cuda和cudnn的三种方法(亲测全部有效

官方教程

官方下载地址:https://developer.nvidia.com/rdp/cudnn-archive

文件选择cuDNN Library for Linux 即可。
在这里插入图片描述

安装cudnn:
在这里插入图片描述

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/
 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

查看cudnn版本:

#给笔记本装的cuda11.1 cudnn版本记录在cudnn_version.h里
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
#or 给台式机装的cuda9.2 cudnn版本记录在在cudnn.h里
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ubuntu16.04+GTX1650 安装cuda,驱动会自动安装!+安装cudnn 的相关文章

  • CUDA 矩阵加法时序,按行与按行比较按栏目

    我目前正在学习 CUDA 并正在做一些练习 其中之一是实现以 3 种不同方式添加矩阵的内核 每个元素 1 个线程 每行 1 个线程和每列 1 个线程 矩阵是方阵 并被实现为一维向量 我只需用以下命令对其进行索引 A N row col 直觉
  • cudaSetDevice() 对 CUDA 设备的上下文堆栈有何作用?

    假设我有一个与设备关联的活动 CUDA 上下文i 我现在打电话cudaSetDevice i 会发生什么 Nothing 主上下文取代了堆栈顶部 主上下文被压入堆栈 事实上 这似乎是不一致的 我编写了这个程序 在具有单个设备的机器上运行 i
  • 有没有一种有效的方法来优化我的序列化代码?

    这个问题缺乏细节 因此 我决定创建另一个问题而不是编辑这个问题 新问题在这里 我可以并行化我的代码吗 还是不值得 https stackoverflow com questions 17937438 can i parallelize my
  • CUDA 中指令重放的其他原因

    这是我从 nvprof CUDA 5 5 获得的输出 Invocations Metric Name Metric Description Min Max Avg Device Tesla K40c 0 Kernel MyKernel do
  • 如何运行和理解CUDA Visual Profiler?

    我已经设置了 CUDA 5 0 并且我的 CUDA 项目运行良好 但我不知道如何使用 Visual Profiler 分析我的 CUDA 项目 如何运行它 我还需要安装更多吗 又该如何做呢 我的电脑使用Window 7 64位 CUDA 5
  • 具有 Cuda Thrust 的多个 GPU?

    如何将 Thrust 与多个 GPU 一起使用 这只是使用 cudaSetDevice deviceId 的问题吗 然后运行相关的 Thrust 代码 使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
  • CUDA:获取数组中的最大值及其索引

    我有几个块 每个块在整数数组的单独部分上执行 举个例子 块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么 示例块一 a 0 到 a 10 具有以下
  • CUDA 5.0错误LNK2001:cuda方法无法解析的外部符号

    我的链接器有错误 1 gt ManifestResourceCompile 1 gt All outputs are up to date 1 gt kernel cu obj error LNK2001 unresolved extern
  • PyInstaller 是否包含 CUDA

    我正在开发一个Python脚本 我使用Python 3 7 3 它使用tensorflow gpu 1 14 0 并使用PyInstaller 3 5将此脚本转换为可执行文件 我使用的是 CUDA 10 0 和 cuDNN 7 6 1 我的
  • Tensorflow:导入错误:libcudnn.so.7:无法打开共享对象文件:没有这样的文件或目录

    我最近使用 pip 安装了tensorflow gpu 但是当我导入它时 出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
  • CUDA NSight 未随 Windows 8 上的 CUDA 5.0 安装文件一起安装? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 据我所知 Nvidia 网站上没有 Nsight Eclipse 的下载链接 它说它将由 CUDA 5 安装本机安装 但并没有随CUDA安装一起安装
  • CUDA Thrust 库中counting_iterators 的用途和用法

    我很难理解counting iterator在 CUDA 的推力库中 它的目的是什么以及如何使用 它在其他编程语言 例如 C 中也可用吗 计数迭代器只是一个迭代器 它从每次迭代器递增时前进的序列中返回下一个值 最简单的例子是这样的 incl
  • GPU上动态分配内存

    是否可以在内核内的 GPU 全局内存上动态分配内存 我不知道我的答案有多大 因此我需要一种方法为答案的每个部分分配内存 CUDA 4 0 允许我们使用 RAM 这是一个好主意还是会降低速度 可以在内核中使用 malloc 检查以下内容 摘自
  • 将内核链接到 PTX 函数

    我可以使用 PTX 文件中包含的 PTX 函数作为外部设备函数 将其链接到另一个应调用该函数的 cu 文件吗 这是另一个问题CUDA 将内核链接在一起 https stackoverflow com questions 20636800 c
  • 使用推力来处理 CUDA 类中的向量?

    我对 C 类的推力的适用性有疑问 我正在尝试实现一个类对象 该对象接收顶点的 x y z 坐标作为 ver1 ver2 和 ver3 然后 分配给一个三角形并计算面积和法向量 然而 我不太明白如何创建一类推力向量 这是我从文件中读取的顶点坐
  • 布尔实现的atomicCAS

    我想弄清楚是否存在错误答案 https stackoverflow com a 57444538 11248508 现已删除 关于Cuda like的实现atomicCAS for bool是 答案中的代码 重新格式化 static inl
  • cudaMalloc使用向量>进行管理 > C++ - NVIDIA CUDA

    我正在通过 NVIDIA GeForce GT 650M GPU 为我创建的模拟实现多线程 为了确保一切正常工作 我创建了一些辅助代码来测试一切是否正常 在某一时刻 我需要更新变量向量 它们都可以单独更新 这是它的要点 device int
  • 一维纹理内存访问比一维全局内存访问更快吗?

    我正在测量标准纹理和 1Dtexture 内存访问之间的差异 为此 我创建了两个内核 global void texture1D float doarray int size int index calculate each thread
  • 将 cuda 数组传递给 Thrust::inclusive_scan

    我可以对 cpu 上的数组使用包容性扫描 但是否可以对 gpu 上的数组执行此操作 注释是我知道有效但我不需要的方式 或者 是否有其他简单的方法可以对设备内存中的数组执行包含扫描 Code include
  • ubuntu 20.04 上无法获取卷积算法错误~tensorflow-gpu

    我有一个 NVIDIA 2070 RTX GPU 我的操作系统是 Ubuntu20 04 我已经使用 conda 安装了tensorflow gpu 包 我有not安装了 CUDA toolkit 我相信它还会安装 CUDA toolkit

随机推荐

  • 小觅相机SDK安装与报错解决

    目录 安装小觅相机SDK1 下载SDK2 准备依赖3 编译代码出现问题 xff1a 报错 xff1a 原因 xff1a 解决方案 xff1a 4 编译安装ROS版本ROS的安装 5 配置 bashrc文件6 运行相机 最后顺利完成SDK安装
  • 基于51单片机和物联网的智能家居系统(ESP8266物联网模块)

    前言 该智能家居系统以 STC89C52单片机为控制核心 xff0c 结合 LCD1602 液晶显示屏 L298N电机驱动模块 光敏电阻 xff0c ESP8266WiFi模块 xff0c DS18B20温度计设计并实现了自动感光窗帘与居室
  • aarch64-linux-gnu-gcc交叉编译链工具

    aarch64 linux gnu gcc交叉编译工具链 安装编译可执行文件交叉编译 自己记录学习所用 安装 按下 CTRL 43 ALT 43 T打开控制台 xff0c 输入如下指令安装 span class token comment
  • CMakeLists.txt的创建和基本使用

    文章目录 1 简单介绍2 一个简单的例子3 将主函数及库函数一起编译4 带上外部库 学习记录所用 1 简单介绍 CMakeLists txt文件的编写比MakeFile文件的编写更加简单和容易理解 CMakeLists txt通过cmake
  • linux线程切换怎么实现

    Linux线程切换的实现涉及到操作系统的调度 和线程上下文 的切换 线程上下文包括程序计数器 xff08 PC xff09 和寄存器值 xff0c 以及线程的堆栈和堆栈指针等 操作系统通过调度器决定哪个线程将获得CPU时间片来执行 当一个线
  • PID实时无线调参

    今天实现了PID参数的实时无线整定 xff0c 记录一下历程 1 将CRC h CRC c usart2 c usart2 h等文件添加到STM32工程中 如下图 xff1a 2 其中 xff0c CRC h CRC c用于数据包的校验 x
  • 海康威视工业相机SDK二次开发(VS+Opencv+QT+海康SDK+C++)(一)

    最近在做一个项目 xff0c 涉及到工业相机 xff0c 需要对其进行二次开发 相机方面选择了海康威视 xff0c 网上关于海康威视工业相机SDK的开发资料很少 xff0c 官方文档里面虽然写的是支持C 43 43 开发的 xff0c 但其
  • FFmpeg源码分析:写音视频帧av_write_frame()

    FFmpeg在libavformat模块提供音视频的muxer封装与demuxer解封装 其中muxer封装文件包括avformat write header av write frame 和av write trailer 本文主要探讨a
  • 海康威视工业相机SDK二次开发(VS+Opencv+QT+海康SDK+C++)(二)

    本文接上次的博客海康威视工业相机SDK二次开发 xff08 VS 43 Opencv 43 QT 43 海康SDK 43 C 43 43 xff09 xff08 一 xff09 xff0c 上个博客中并未用到QT xff0c 本文介绍项目内
  • 单目相机标定(使用Matlab)

    内容 一 单目视觉成像原理1 理想情况下相机成像模型1 1 世界坐标系 gt 相机坐标系1 2 相机坐标系 gt 图像坐标系1 3 图像坐标系 gt 像素坐标系1 4 总结 xff1a 世界坐标系 gt 像素坐标系 二 考虑畸变情况下相机成
  • 三菱PLC与上位机进行通讯

    三菱PLC与上位机串口通信 一 三菱Fx系列PLC编程口通讯协议地址算法1 DEVICE READ xff08 读出软设备状态值 xff09 2 DEVICE WRITE xff08 向PLC 软设备写入值 xff09 3 位设备强制置位
  • 关于相机的一些参数计算(靶面、视野等)

    1 靶面尺寸和芯片尺寸 比如我使用的是上面这个相机 xff0c 一直不懂1 1 8 39 是什么意思 span class token number 1 1 span 英寸 靶面尺寸为宽 span class token number 12
  • 面试问题总结——关于OpenCV

    整理了一下网上和我面试中遇到的关于OpenCV相关的问题 其中因为我的简历中有个项目用到了特征点检测相关的知识 xff0c 所以整理了SIFT SURF和FLANN 有些知识点也不深入 xff0c 对于写的不对的地方 xff0c 欢迎指正
  • 全排列(C++)

    递归法实现全排列 全排列就是指n个元素随机组合 xff0c 且不重复的所有排列方式 比如 1 xff0c 2 xff0c 3 xff0c 就有123 xff0c 132 xff0c 213 xff0c 231 xff0c 312 xff0c
  • 海康威视工业相机IP设置说明

    整理电脑文件时翻到的 xff0c 记录下来方便以后查阅 第一步 先修改本机IP步骤如下 xff1a 1 打开本地连接 2 点击属性 3 选择协议 gt gt 点击属性 4 选择使用下面IP地址 5 自己设置IP地址 xff0c 然后点击确认
  • 关于Aruco标记的理解并对其进行姿态估计的可视化显示

    目录 1 什么是ArUco标记1 1 Marker和字典 2 通过使用OpenCV生成ArUco标记图3 检测Aruco标记4 一些API的介绍getPredefinedDictionary drawMarker estimatePoseS
  • 关于手眼标定的误差计算

    之前做的眼在手上的手眼标定 xff0c 流程结束后 xff0c 会得到相机坐标系到机械臂末端坐标系的变换关系T cam2end 我一般直接量取机械臂末端到相机的直线距离来校对z轴方向的距离 xff0c 但只是做个估算 xff0c 并未进行精
  • 在Ubuntu 16.04上安装和配置VNC

    目录 1 VNC客户端配置2 VNC服务端配置2 1 本机远程连接服务器2 2 更新依赖包2 3 安装Xfce桌面环境2 4 安装tightvncserver 3 客户端VNC连接服务端4 关于VNC的一些指令5 设置VNC开机自启动 1
  • ffmpeg中av_find_best_stream()函数的使用

    av find best stream xff08 xff09 函数就是要获取音视频对应的stream index span class token macro property span class token directive has
  • ubuntu16.04+GTX1650 安装cuda,驱动会自动安装!+安装cudnn

    补充一句 只是做深度学习跑模型的话 xff0c 装完驱动后就可以了 xff0c 不需要额外按照NVIDIA官网的教程配置CUDA和CUDNN 我们的代码实际用到的是python环境下的包 比如我用anaconda配置环境 xff0c 直接在