本地ubuntu22.04装cuda11.7+torch2.0.1流程记录

2023-10-31

想要更新cuda11.7,需要的驱动最低版本515.65.01,而我的电脑原驱动为470,需要更新。

1. 卸载原驱动

使用了命令:

sudo apt-get purge nvidia-*
sudo apt-get autoremove

用以下命令检查是否卸载干净:

sudo dpkg --list | grep nvidia-*

发现有ii文件残留,当时没管。

2. 安装新驱动

(1)系统自带安装(出问题)

通过设置中的软件更新-附加驱动,选择了NVIDIA-535版本点击下载,装完重启电脑,好家伙,图形界面没有了,nvidia-smi显示device no found,显然这个驱动装得有问题,我又卸。

通过那个检查命令发现,刚刚的535相关的ii文件也残留了。似乎得把它们删除干净才行。我取残留文件名的开头+*,用apt-get purge命令删了个干净:

sudo apt-get purge libnvidia*
sudo apt-get purge linux-objects-nvidia-470-5.15.0*
sudo apt-get purge linux-signatures-nvidia-5.15.0*

删完图形界面立刻出现了。

(2)cuda安装程序装驱动(成功)

既然已经没有驱动了,是不是可以用cuda安装程序安一个它以来的驱动上去呢?

结果接连报了许多错,根据提示到/var/log/nvidia-installer.log中查看报错信息。

(a)报错: 正在使用显卡

“An NVIDIA kernel module ‘nvidia-drm‘ appears to already be loaded in your kernel...”

参考这位博主的博客,停止使用GPU显示:An NVIDIA kernel module ‘nvidia-drm‘ appears to already be loaded in your kernel..._nvidia-drm appears_子燕若水的博客-CSDN博客

——也许是我的图形界面恢复,正占用着显卡的锅。

具体地:

sudo -i
systemctl isolate multi-user.target
modprobe -r nvidia-drm
logout

执行完第二行,我显示屏上的图形界面被关闭了;执行第三行报了个缺失。我没管,继续跑cuda的安装程序。

(b)报错:没有kernel source tree

"ERROR: Unable to find the kernel source tree for the currently running kernel..."

参考博客:Ubuntu18.04 + RTX 2080 Ti 安装NVIDIA显卡驱动的一些坑_ubuntu安装显卡驱动提示unable to find the_qian99的博客-CSDN博客

sudo apt-get install linux-headers-`uname -r` 

用这一行命令解决了问题,继续跑cuda安装程序。

(c)报错:gcc版本不符合

Warning: Compiler version check failed:

The major and minor number of the compiler used to
compile the kernel:

x86_64-linux-gnu-gcc (Ubuntu 11.3.0-1ubuntu1~22.04) 11.3.0, GNU ld (GNU Binutils for Ubuntu) 2.38

does not match the compiler used here:

cc (Ubuntu 9.5.0-6ubuntu2) 9.5.0
Copyright (C) 2017 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.


It is recommended to set the CC environment variable
to the compiler that was used to compile the kernel.

因此需要更新gcc到需要的版本:

sudo apt install gcc-11
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 40
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 50

然后就不再报错,成功安装了cuda11.7与驱动515.65.01。

3. 配置系统环境,切换cuda

查看软链接:

stat /usr/local/cuda

已链接到新的cuda11.7,但再用nvcc -V显示的是原有的cuda11.3,说明要修改要实现多cuda切换需要改我原本的系统路径:

vim ~/.bashrc

将原本的CUDA_HOME=/usr/local/cuda-11.3改为了cuda 

 然后更新配置:

source ~/.bashrc

再用nvcc -V检查,妥了。 

4.下载cudnn

 在官网:cuDNN Archive | NVIDIA Developer​​​​​​

下载了目前最新的用于cuda11.x的cudnn

 解压tar.xz文件并复制对应文件到cuda下:

tar -xf cudnn-linux-x86_64-8.9.2.26_cuda11-archive.tar.xz
sudo cp cudnn-linux-x86_64-8.9.2.26_cuda11-archive/include/cudnn.h /usr/local/cuda-11.7/include
sudo cp cudnn-linux-x86_64-8.9.2.26_cuda11-archive/lib/libcudnn* /usr/local/cuda-11.7/lib64
sudo chmod a+r /usr/local/cuda-11.7/include/cudnn.h /usr/local/cuda-11.7/lib64/libcudnn*

5. 安装pytorch

在官网选择版本:Start Locally | PyTorch

我用conda命令装完不知道为什么得到的是pytorch1.12.1?用pip命令安装不出错。

检查torch是否安装好:

import torch
print(torch.__version__)
print(torch.cuda.is_available())

版本对、cuda可用即可。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

本地ubuntu22.04装cuda11.7+torch2.0.1流程记录 的相关文章

  • 阿里云2核4G服务器优惠价格30元3个月?小心坑

    2024年阿里云2核4G服务器优惠价格30元3个月 活动 https t aliyun com U bLynLC 配置为云服务器ECS经济型e实例ecs e c1m2 large 3M固定带宽 系统盘为40GB ESSD Entry 活动打
  • 服务器OS是什么意思?

    一 什么是服务器操作系统 服务器不仅仅是由高性能硬件组成 并且是要求客户端操作系统 如Windows和Mac OS 服务器还需要一个称为服务器操作系统的操作系统 二 与客户端OS的区别 无论是Windows还是Mac OS 家庭或办公室使用
  • 第二节课内容学习

    监听远程端口 并映射到本地 先配置ssh的公私钥非对称加密 假设远程开放的端口为33090 在本地计算机终端执行 ssh CNg L 6006 127 0 0 1 6006 root ssh intern ai org cn p 33090
  • 如何使用内网穿透实现iStoreOS软路由公网远程访问局域网电脑桌面

    文章目录 简介 一 配置远程桌面公网地址 二 家中使用永久固定地址 访问公司电脑 具体操作方法是 简介 软路由 是PC的硬件加上路由系统来实现路由器
  • “性能压测揭密:关键指标分析!“

    在进行全链路压测和性能测试时 需要关注多个关键性能指标 KPIs 来评估系统的性能表现 以下是一些常见的性能测试指标 1 吞吐量 Throughput 系统在单位时间内能够处理的请求数量或事务数量 通常以每秒请求数 RPS TPS 来衡量
  • 虚拟主机操作系统 Windows、Linux

    操作系统将直接影响服务器的性能 安全性和可用性 因此确保选择合适的操作系统对于成功运行您的网站或应用程序至关重要 以下是一些考虑因素 可帮助您选择适合您需求的虚拟主机操作系统 1 熟悉度和技术支持 如何选择操作系统应该考虑您的经验水平和熟悉
  • 服务器超线程的好处

    服务器超线程的好处 1 提高性能 超线程通过提高整体系统吞吐量显着提高服务器性能 通过允许多个线程在单个物理内核上同时执行 超线程减少了空闲时间并最大限度地利用了可用资源 这会加快任务执行速度并缩短应用程序的响应时间 尤其是在多线程工作负载
  • 数据采集才是MES系统的核心内容

    一 数据采集在MES管理系统中的应用 1 设备数据采集 MES管理系统通过与生产设备的连接 可以实时采集设备运行状态 产量 质量等相关数据 这有助于企业及时掌握设备运行状况 优化设备资源配置 提高设备利用率 2 工艺数据采集 MES管理系统
  • CTF之逆向入门

    逆向工程 Reverse Engineering 又称反向工程 是一种技术过程 即对一项目标产品进行逆向分析及研究 从而演绎并得出该产品的处理流程 组织结构 功能性能规格等设计要素 以制作出功能相近 但又不完全一样的产品 逆向工程源于商业及
  • Linux 软件安装以及管理

    本篇主要记录常用的软件安装和管理方式 主要是 yum rpm dnf apt pip 大致都是一样的 主要是部分软件提供了解决依赖的功能 内容不包括源码安装 源码安装情况相对比较复杂 后续有时间再补充 约定 案例所用模板软件均为 pytho
  • 自定义编写zabbix_agent脚本

    vi usr lib systemd system zabbix agent servicce Unit Description Zabbix Agent After syslog target After network target S
  • centos系统有什么好处?

    CentOS是一种基于开源代码的Linux操作系统 它有以下几个优势 1 稳定性 CentOS是一种非常稳定的操作系统 它的代码经过了严格的测试和审查 因此它非常适合作为服务器操作系统使 用 2 安全性 由于CentOS是基于开源代码的操作
  • 基于java的物业管理系统设计与实现

    基于java的物业管理系统设计与实现 I 引言 A 研究背景和动机 物业管理系统是指对物业进行管理和服务的系统 该系统需要具备对物业信息 人员信息 财务信息等进行管理的能力 基于Java的物业管理系统设计与实现的研究背景和动机主要体现在以下
  • 一台java服务器可以跑多少个线程?

    一台java服务器可以跑多少个线程 一台java服务器能跑多少个线程 这个问题来自一次线上报警如下图 超过了我们的配置阈值 打出jstack文件 通过IBM Thread and Monitor Dump Analyzer for Java
  • Vue 如何使用WebSocket与服务器建立链接 持续保持通信

    WebSocket 浏览器通过JavaScript向服务器发出建立WebSocket链接的请求 链接建立后 客户端和服务器端就可以通过TCP链接直接交互数据 WebSocket链接后可以通过 send 方法来向服务器发送数据 并通过 onn
  • 服务器VPS是什么意思?一文了解其含义与重要性

    在今天的数字时代 服务器扮演着至关重要的角色 它们是网站 应用程序和在线业务的基石 但是 你是否听说过VPS 本文将深入探讨什么是服务器VPS 以及为什么它在今天的互联网世界中如此重要 什么是服务器VPS 服务器的基本概念 在我们深入探讨V
  • 短信系统搭建主要因素|网页短信平台开发源码

    短信系统搭建主要因素 网页短信平台开发源码 随着移动互联网的快速发展 短信系统已成为企业和个人进行信息传递的重要工具 建立一个高效可靠的短信系统对于企业来说非常重要 下面我们将介绍一些影响短信系统搭建的主要因素 1 平台选择 在搭建短信系统
  • UI自动化测试之Jenkins配置

    背景 团队下半年的目标之一是实现自动化测试 这里要吐槽一下 之前开发的测试平台了 最初的目的是用来做接口自动化测试和性能测试 但由于各种原因 接口自动化测试那部分功能整个废弃掉了 其中和易用性有很大关系 另外 也和我们公司的接口业务也有关
  • 网工内推 | 上市公司同程、科达,五险一金,年终奖,最高12k*15薪

    01 同程旅行 招聘岗位 网络工程师 职责描述 1 负责职场 门店网络规划 建设 维护 2 负责网络安全及访问控制 上网行为管理和VPN设备的日常运维 3 负责内部相关网络自动化和系统化建设 4 优化与提升网络运行质量 制定应急预案 人员培
  • 【安全-SSH】SSH安全设置

    今天发现自己的公有云服务器被攻击了 在这里插入图片描述 https img blog csdnimg cn direct cafdca04646f4b8b838400ec79ac282f png 然后查看了登录日志 如上图 ls sh va

随机推荐

  • 手把手教你用PyTorch从零搭建图像分类模型

    https zhuanlan zhihu com p 38236978 过去的这几年 陆陆续续出现了不少深度学习框架 而在这些框架中 Facebook 发布的 PyTorch 相对较新且很独特的一个 由于灵活 迅速 简单等特点 PyTorc
  • 【sklearn】线性回归、最小二乘法、岭回归、Lasso回归

    文章目录 机器学习的sklearn库 一 回归分析 lt 1 1 gt 线性回归 1 1 1 Python实现线性回归 lt 1 2 gt 最小二乘法 1 2 1 MATLAB实现最小二乘法 1 2 2 MATLAB实现最小二乘法 矩阵变换
  • 五个阶段,了解产品设计流程

    谈到产品设计流程 其实是在谈论最符合当前环境 已有资源下的产品创造模式 从这个角度来说 产品设计流程必然是从已有经验提炼出来的核心知识体系 结合自己UI设计 前端开发 产品经理三个维度的实践经验 尝试将产品设计流程大致分为五个阶段 认知分析
  • 面向对象(多态)

    面向对象 多态 一 多态 同一个对象具有多种形态 二 作用 核心在于方法的重写 覆写 使多种数据类型进行统一 让程序具有超强的扩展性 三 模拟人物进行网络游戏 类图 创建游戏父类 public class Game public void
  • 一个使用MongoDB和Fuse开发的虚拟文件系统

    https sourceforge net projects gridfs fuse files source navbar 以前基于这个Demo开发了一个文件系统 记录一下
  • idea 找不到tomcat、Application Servers配置

    idea 找不到tomcat Application Servers配置 在网上找到的解决方式是File Settings Plugins 中搜索tomcat 如上图显示 我本地已经安装tomcat插件了 又在网上找到说File Setti
  • PAL制搜台

    PAL电视制式 PAL电视制式 Phase Alternating Line 采用625线制式 视讯制式采用PAL B G PAL D K PAL I等 PAL电视不像NTSC制式有中心频点 它采用宽带的频率范围进行电视信号的调制和传输 P
  • Windows在命令行中直接使用conda虚拟环境以及一些实用的conda命令

    在命令行中输入conda env list 可以查看当前已有的全部conda虚拟环境 如下图 输入conda create n name python version可以创建指定python版本的名称为name的虚拟环境 输入conda c
  • Linux常用命令-2

    为了掌握本关知识 你需要掌握 Linux文件操作之创建文件 删除文件 Linux文件夹操作之创建文件夹 删除文件夹 文件和文件夹拷贝 移动 重命名 Linux文件操作 Linux系统中最常用的文件操作有创建 删除文件等 创建文件 linux
  • 【LaTeX Workshop】VS Code 与 SumatraPDF 双向链接配置方法

    TeX Live 2021 Sumatra PDF v3 4 6 64 bit VS Code v1 62 3 system setup LaTeX Workshop v8 22 0 SumatraPDF 配置 安装 SumatraPDF
  • luckysheet使用——导出并下载excel数据及钩子函数的使用等

    这里记录一些常用的API 包括对于获取整个在线excel的数据 使用钩子函数等 获取Excel数据luckysheet getAllSheets 可以将获取到的数据传递到后端通过JSONArray来获取 它是一个一个的sheet页对象的数组
  • C语言基础入门48篇_15_条件运算符(expr1?expr2:expr3,三元运算符,

    条件运算符是C语言中唯一的三元运算符 其基本形式为 expr1 expr2 expr3 一个条件运算符它需要三个表达式 如果expr1的值为非0 则整个条件表达式的值为expr2 如果expr1的值为0 则整个条件表达式的值为expr3 1
  • java和c++区别

    java string类写在heap中 无法修改 c 放在text区 可以修改 java 的块内镶嵌的块不允许变量名重复 c 允许 实行就近法则 转载于 https www cnblogs com bloomingFlower p 1161
  • saltstack之系统初始化状态编写

    saltstack之系统初始化状态编写 1 目录结构 2 关闭selinux 3 关闭防火墙 4 时间同步 chrony 5 内核优化与文件描述 6 ssh服务优化 7 精简开机系统服务 8 历史记录优化 设置终端超时时间 9 yum源 1
  • 数据库基础知识(MySQL入门)

    数据库基础知识 MySQL入门 文章目录 数据库基础知识 MySQL入门 一 基本概念 二 特点 一 基本概念 Information 信息是对客观世界中各种事物的运动状态和变化的反映 是数据的含义 Data 数据用来记录信息的可识别符号
  • java基本语法题目_JAVA的语法基础 练习题

    1 编写Java程序 声明两个int型变量 运用三元运算符判断两个变量是否相等 若不相等 求出两个数中较大的 public class 练习题 public static void main String args int a 10 int
  • 验证集准确率上不去_经验之谈|处理不平衡数据集的7个技巧

    作者 Ye Wu Rick Radewagen编译 ronghuaiyang 介绍 具体的领域中的数据集是什么样的 银行中的欺诈检测 市场中的实时投标 网络中的入侵检测 常见吗 这些领域中的数据 常常只有不到1 的少数 但是 有兴趣 的事件
  • jmeter 固定定时器

    固定定时器 Constant Timer 是一个定时器元件 可以在线程组中的每个线程之间添加固定的延迟时间 固定定时器会对每个线程的执行进行一定的暂停 聊一下和线程组中的调度器对线程组执行时长的影响 相同 都会影响线程组的运行时长 不同 固
  • 加载动态库失败(loadLibrary返回为空 GetLastError126)解决办法 dll有依赖的dll缺失

    问题 加载动态库失败 loadLibrary返回为空 排除 64位也对 平台相同 错误 至少找不到一个必需的隐式或转发依赖项 这个不影响 SmartPay PGL dll下的四个dll 则是他所依赖的四个dll 因为我这里有缺失 显示黄色的
  • 本地ubuntu22.04装cuda11.7+torch2.0.1流程记录

    想要更新cuda11 7 需要的驱动最低版本515 65 01 而我的电脑原驱动为470 需要更新 1 卸载原驱动 使用了命令 sudo apt get purge nvidia sudo apt get autoremove 用以下命令检