ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

2023-05-16

一、安装nvidia_driver

1、在  软件和更新  中选择一个可用的驱动

2.1首先我们需要添加源

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

2.2选择一个版本安装即可(如1,我选择安装510)

sudo apt install nvidia-driver-510

2.3 重启电脑后终端输入

nvidia-smi

查看驱动信息

二、安装CUDA

1、官网找到自己的版本(如2.3版本信息中,我510驱动对应的cuda_11.6)

CUDA Toolkit Archive | NVIDIA Developer    选择runfile格式的CUDA文件下载

2、选择环境,并根据官网步骤安装

3、下载完成后,解压,并运行上图中的命令,会有条款,接受即可。

3.1注意安装CUDA的时候不要安装驱动(因为在第一步我们已经安装过了)

3.2添加环境变量

sudo gedit ~/.bashrc

 在打开的txt文件末尾加

export CUDA_HOME=/usr/local/cuda 
export PATH=$PATH:$CUDA_HOME/bin 
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存,退出。终端执行

source ~/.bashrc

3.3  验证cuda

3.3.1    

11.6版本cuda的安装目录/usr/local/cuda-11.6/samples里只有一个txt文件,大致意思是告诉你新版本的cuda,samples中内容需要自己在github下载。

由于github下载过慢,在此放上gitee链接

git clone https://gitee.com/liwuhaoooo/cuda-samples.git

在samples文件夹下打开终端执行上述语句。

大概率无权访问,此时在cuda-11.6文件夹下打开终端

su
输入密码切换超级用户
chmod 777 samples

再次执行git clone 就可以了。

3.3.2

进入/usr/local/cuda-11.6/samples/cuda-samples/Samples

cd /usr/local/cuda/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery

输出

则安装成功。

三、安装cuDNN

1、

进入NVIDIA cuDNN | NVIDIA Developer注册,并选择合适的版本下载(cuDNN Library for Linux),然后解压;

2、

并进入到/home/lwh/Downloads/cudnn-11.3-linux-x64-v8.2.1.32目录,运行以下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda-11.6/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.6/lib64
sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

若无权访问,像3.3.1一样,分别更改include和lib64文件夹权限。

四、验证GPU可用

import torch
print(torch.cuda.is_available())

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x 的相关文章

  • 最小化 MC 模拟期间存储的 cuRAND 状态数量

    我目前正在 CUDA 中编写蒙特卡罗模拟 因此 我需要生成lots使用随机数cuRAND图书馆 每个线程处理一个巨大的元素floatarray 示例中省略 并在每次内核调用时生成 1 或 2 个随机数 通常的方法 参见下面的示例 似乎是为每
  • 如何运行和理解CUDA Visual Profiler?

    我已经设置了 CUDA 5 0 并且我的 CUDA 项目运行良好 但我不知道如何使用 Visual Profiler 分析我的 CUDA 项目 如何运行它 我还需要安装更多吗 又该如何做呢 我的电脑使用Window 7 64位 CUDA 5
  • 具有 Cuda Thrust 的多个 GPU?

    如何将 Thrust 与多个 GPU 一起使用 这只是使用 cudaSetDevice deviceId 的问题吗 然后运行相关的 Thrust 代码 使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
  • 大型跨平台软件项目的技巧/资源

    我将开始一个大型软件项目 涉及跨平台 GUI 和大量的数字运算 我计划用 C 和 CUDA 编写大部分应用程序后端 并用 Qt4 编写 GUI 我计划使用 Make 作为我的构建系统 这将是一个只有两名开发人员的项目 一旦我相对深入地了解它
  • cudaDeviceScheduleBlockingSync 和 cudaDeviceScheduleYield 之间有什么区别?

    正如这里所说 如何减少 CUDA 同步延迟 延迟 https stackoverflow com questions 11953722 how to reduce cuda synchronize latency delay 等待设备结果有
  • OpenCV 2.4.3rc 和 CUDA 4.2:“OpenCV 错误:没有 GPU 支持”

    我在这张专辑中上传了几张截图 https i stack imgur com TELST jpg https i stack imgur com TELST jpg 我正在尝试在 Visual Studio 2008 中的 OpenCV 中
  • C 中的 CUDA:如何使用 cudaMemcpyAsync 修复错误 11

    我目前正在尝试使用 CUDA 运行一个简单的多 GPU 程序 它的基本作用是将一个包含一些虚拟数据的大型数组复制到 GPU GPU 进行一些数学计算 然后将结果数组复制回来 我在 VS2017 的输出中没有收到任何错误 但我设置的一些错误消
  • GPU上动态分配内存

    是否可以在内核内的 GPU 全局内存上动态分配内存 我不知道我的答案有多大 因此我需要一种方法为答案的每个部分分配内存 CUDA 4 0 允许我们使用 RAM 这是一个好主意还是会降低速度 可以在内核中使用 malloc 检查以下内容 摘自
  • Cuda:最小二乘求解,速度较差

    最近 我使用Cuda编写了一个名为 正交匹配追踪 的算法 在我丑陋的 Cuda 代码中 整个迭代需要 60 秒 而 Eigen lib 只需 3 秒 在我的代码中 矩阵 A 是 640 1024 y 是 640 1 在每一步中 我从 A 中
  • 使用 Cuda 并行读取多个文本文件

    我想使用 CUDA 在多个文件中并行搜索给定字符串 我计划使用 pfac 库来搜索给定的字符串 问题是如何并行访问多个文件 示例 我们有一个包含 1000 个文件的文件夹 需要搜索 这里的问题是我应该如何访问给定文件夹中的多个文件 应该动态
  • 直接在主机上访问设备向量元素的最快方法

    我请您参考以下页面http code google com p thrust wiki QuickStartGuide Vectors http code google com p thrust wiki QuickStartGuide V
  • 对 CUDA 操作进行计时

    我需要计算 CUDA 内核执行的时间 最佳实践指南说我们可以使用事件或标准计时函数 例如clock 在Windows中 我的问题是使用这两个函数给出了完全不同的结果 事实上 与实践中的实际速度相比 事件给出的结果似乎是巨大的 我实际上需要这
  • 如何从C++头文件调用CUDA文件?

    我知道从 c 文件调用 cu 文件的方法 但现在我想从 C 头文件调用 cu 文件 有可能做到吗 如果是这样 我应该如何设置我的项目 请帮忙 这是一个有效的例子 file1 h int hello file2 h include
  • cudaMalloc使用向量>进行管理 > C++ - NVIDIA CUDA

    我正在通过 NVIDIA GeForce GT 650M GPU 为我创建的模拟实现多线程 为了确保一切正常工作 我创建了一些辅助代码来测试一切是否正常 在某一时刻 我需要更新变量向量 它们都可以单独更新 这是它的要点 device int
  • 了解流式多处理器 (SM) 和流式处理器 (SP)

    我正在尝试了解 GPU 的基本架构 我已经阅读了很多材料 包括这个非常好的答案 https stackoverflow com a 2213744 2386113 但我仍然很困惑 无法得到一个好的图片 我的理解 GPU 包含两个或多个流式多
  • CUDA cutil.h 在哪里?

    有谁知道包含 cutil h 的 SDK 工具包在哪里 我尝试了 CUDA toolkits3 2 和 toolkits5 0 我知道这个版本已经不支持 cutil h 我还注意到一些提到的如何在 Linux 中包含 cutil h htt
  • 将数据从 GPU 复制到 CPU - CUDA

    我在将数据从 GPU 复制到 CPU 时遇到问题 一开始我在 GPU 空间中创建变量 device float gpu array 在此 GPU 函数中 我想将数据从 od fS gi 值 0 43 复制到 gpu array global
  • nvidia GPU 上的内核真的有超时吗?

    寻找为什么我的内核产生奇怪的错误消息或仅 0 结果的答案我发现了这个answer https stackoverflow com questions 3988645 cl out of resources for 2 millions fl
  • 如何使用 Visual Studio 2008 调试 CUDA 内核代码?

    嘿 我正在使用带有 CUDA 3 2 的 Visual Studio 2008 我正在尝试调试具有此签名的函数 MatrixMultiplication Kernel lt lt
  • 获取微过滤器驱动程序中的文件路径

    我使用了下面的代码 但它给了我文件路径的结果 status FltGetFileNameInformation Data FLT FILE NAME OPENED FLT FILE NAME QUERY ALWAYS ALLOW CACHE

随机推荐

  • 用51单片机IIC协议OLED显示汉字

    接线如下 xff1a IIC协议 xff1a xff08 IIC全称Inter Integrated Circuit 集成电路总线 xff09 由PHILIPS公司在80年代开发的两线式串行总线 xff0c 用于连接微控制器及其外围设备 I
  • Linux中的open()、write()与read()函数,超详细

    open xff08 xff09 函数 xff1a int open const char pathname int flags mode t mode 使用open函数需要的头文件 xff1a include lt sys types h
  • C语言结构体对齐,超详细,超易懂

    结构体对齐规则 结构体的第一个成员总是存放在结构体变量开辟的空间的起始地址其它成员变量要存储在一个名叫对齐数的整数倍的地址结构体总大小为最大对齐数的整数倍 xff0c 结构体内每一个变量都会产生一个对齐数 xff0c 取其最大的对齐数如果是
  • 51单片机之串口通信、WiFi模块、蓝牙模块、4G模块

    目录 串口通信 全双工通信 xff08 打电话 xff09 TTL电平 UART 字节帧 串口相关的寄存器 串口的工作模式 蓝牙模块HC 08 HC 08的AT指令 编辑 WiFi模块ESP8266 配置WiFi模块作为客户端连入当前局域网
  • STM32单片机之温湿度检测系统(DTH11、OLED、LCD1602)

    LCD1602 LCD1602引脚 第 1 脚 VSS 为电源地 第 2 脚 VDD 接 5V 正电源 第 3 脚 VL 为液晶显示器对比度调整端 接正电源时对比度最弱 xff0c 接地时对比度最高 xff0c 对比度过高时会产生 鬼影 x
  • C_records

    1 include inlcude lt file h gt include file h lt gt 从编译器指定目录查找 从当前目录查找 xff0c 未发现再从指定目录查找 2 enum enum TYPE A B C 注意内部 xff
  • STM32之智能小车,手把手从0到1,模块化编程

    小车介绍 本博文将会从0到1实现一个智能小车 xff0c 该小车实现功能 xff1a 1 摇头避障模式 2 跟随模式 3 循迹模式 4 小车测速并显示在OLED屏幕 5 语音控制小车等等 硬件组成 STM32F103开发板 小车套件 L91
  • STM32之增量式编码器电机测速

    STM32之增量式编码器电机测速 编码器编码器种类按监测原理分类光电编码器霍尔编码器 按输出信号分类增量式编码器绝对式编码器 编码器参数分辨率精度最大响应频率信号输出形式 编码器倍频 STM32的编码器模式编码器模式编码器的计数方向仅在TI
  • STM32之MPU6050获取欧拉角

    STM32之MPU6050获取欧拉角 MPU6050MPU6050特点MPU6050电路图以及框图MPU6050框图MPU6050电路图 MPU6050相关寄存器电源管理寄存器1 xff08 0x6B xff09 陀螺仪配置寄存器 xff0
  • Postman(接口测试工具)

    目录 一 基本介绍 1 Postman 是什么 2 Postman 快速入门 2 1快速入门需求说明 二 Postman 完成 Controller 层测试 需要的代码 xff1a Java类 request jsp success jsp
  • QT网络编程TCP/UDP开发流程 制作网络调试助手

    目录标题 一 开发基础知识1 QT的网络编程 TCP和UDP2 网络编程接口1 listen2 connect 二 TCP编程1 TCP服务端实现流程2 TCP客户端实现流程 三 UDP编程四 源码1 TCP服务端2 TCP客户端3 UDP
  • Vscode 运行C++文件无法显示输出

    一 情况是 xff1a 运行简单的HelloWodld cpp程序能在终端显示结果 xff0c 如下 xff1a include lt iostream gt using namespace std int main cout lt lt
  • Jetson nx或其他aarch64 使用anaconda虚拟环境构建GPU版本的Pytorch cuda可用的前提下完整教程

    一 Anaconda 下载安装包 首先 xff0c 到anaconda官网下载安装包 xff0c 注意不是下载平常linux系统所用的安装包 xff0c 而是下载ARM架构的安装包 xff0c 若使用其他的版本会提示版本不符合无法安装 安装
  • 11-C语言对寄存器的封装

    1 xff1a 仅通过指针进行封装 xff1a 编译可能出错 xff0c 这个地方只是表示思路 在基地址基础上加上偏移地址 define GPIOF BASE 0x40021400 define GPIOF BASE 0x40021400
  • 13-寄存器编写程序入门

    与51单片机对比 xff0c 32单片机控制寄存器要复杂的多 xff1b 在51单片机中 xff0c 可以直接控制端口的高低电平 xff1b 然而32单片机却不可以 xff0c 因为32为了减小功耗 xff0c 默认情况下这些时钟都是关闭的
  • C++两个类头文件互相包含

    在构造自己的类时 xff0c 有可能会碰到两个类之间的相互引用问题 xff0c 例如 xff1a 定义了类A类B xff0c A中使用了B定义的类型 xff0c B中也使用了A定义的类型 class A int i B b class B
  • 【手拉手 带你准备电赛】April Tag标记跟踪(3D定位)详解

    目录 关于April Tag April Tag介绍 April Tag分类 April Tag标记跟踪原理 April Tag标记跟踪代码分析 April Tag标记跟踪测试结果 相关内容解惑 梯度图像 关于April Tag April
  • VS 无法打开源文件<WinSock2.h> <stdio.h> 等

    一 重装SDK 1 在开始菜单栏打开 VS installer xff1b 在出现的页面中选择 修改 2 修改SDK 注意左侧左侧红色方框中的内容不要点 在右侧 安装详细信息 一栏找到 使用C 43 43 桌面开发 取消勾选已安装的SDK
  • error: #error PCL requires C++14 or above

    运行带有PCL库的文件时报错 error PCL requires C 43 43 14 or above 解决办法 xff1a 找到工程里所有依赖于PCL的功能包 xff0c 改它们对应的CMakelists txt文件 具体修改方法 x
  • ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

    一 安装nvidia driver 1 在 软件和更新 中选择一个可用的驱动 2 1首先我们需要添加源 sudo add apt repository ppa graphics drivers ppa sudo apt update 2 2