【详细】摸索了三次后总结的安装CUDA的方法，一气呵成使用GPU跑代码

2023-05-16

第一次安装的时候真的是纯小白，各种概念都不懂，只知道使用GPU跑代码需要安装CUDA。弯路走了不少，前前后后被虐了一周，安装的非常艰辛，且混乱；

第二次安装是在同学电脑上，又绕了些弯路，不过这次只花了半天时间，当时非常自豪来着。

这次是第三次安装，有了第二次的经验，安装的非常非常顺利，可谓一气呵成。现在把过程发过来，是我的第一篇CSDN。有点点激动。

步骤简述：

1.确认有Nvidia GPU

2.升级驱动程序

3.安装CUDA

4.安装GPU版Pytorch

关键：版本一定要对应，各个地方版本都要对应。最好经常查看与确认版本。

详细过程：

1.确认有GPU

在任务管理器-性能中，看GPU1中的型号。（GPU1是独显，GPU0是集显）

2.升级驱动程序：

官网下载，教程可参考：(51条消息) Windows更新NVIDIA显卡驱动_nvidia安装选显卡驱动还是图形驱动_振华OPPO的博客-CSDN博客

之后检查版本号。在NVIDIA控制面板，这里的版本显示472.84.

3.安装CUDA。

查看对应CUDA版本：

看这张表即可。（下图的表中能找到就行，可以不看原网址：CUDA 12.0 Release Notes — cuda-toolkit-release-notes 12.0 documentation (nvidia.com)）

如刚刚版本472.84，在表中对应一下，发现＞＝452.39，可以安装CUDA11.8x。

官网下载对应CUDA：CUDA Toolkit Archive | NVIDIA Developer

注意点击与刚刚匹配的版本。这里是CUDA11.8。

下载完双击安装即可。

检查是否安装成功：

搜索栏输入cmd回车（进入cmd），输入nvidia-smi

即可得到如图所示。这里显示的CUDA是11.8，即安装成功。

4.安装GPU版torch。注意一定要下载对应版本！

确认CUDA型号与python版本，在下面的网址下载GPU版torch。（我之前官网下的有问题，推荐从这个网址下）

（另外，在这一步想查看torch版本的，可以在python中pip下载torch，然后终端print版本，如x.xx.x+cpu，则说明是cpu版本的torch。安装好GPU版torch后，再重复这个步骤会显示x.xx.x+cu118）

去网址 https://download.pytorch.org/whl/torch/ 下载gpu版本。在里面仔细找一下，名称中cu118代表cuda11.8，cp39代表python3.9.（另外：上面链接只有torch，需要torchvision或者torchaudio的可以在这里找：https://download.pytorch.org/whl/torch_stable.html）

下载完gpu版torch后，在python中pip安装

pip install .\torch-1.13.0+cu116-cp39-cp39-win_amd64.whl （注意，名称要换成刚刚下载的版本）

安装好后，可以在终端pip list 在列表中找寻并查看torch安装的版本。

最后，在终端

import torch,print(torch.__version__),print(torch.version.cuda),print(torch.cuda.is_available())

显示true则大功告成~

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【详细】摸索了三次后总结的安装CUDA的方法，一气呵成使用GPU跑代码的相关文章

TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
如何运行和理解CUDA Visual Profiler？

我已经设置了 CUDA 5 0 并且我的 CUDA 项目运行良好但我不知道如何使用 Visual Profiler 分析我的 CUDA 项目如何运行它我还需要安装更多吗又该如何做呢我的电脑使用Window 7 64位 CUDA 5
OS X 10.8 上的 PyCuda / 多处理问题

我正在开发一个项目将计算任务分配给多个 python 进程每个进程都与其自己的 CUDA 设备关联生成子进程时我使用以下代码 import pycuda driver as cuda class ComputeServer obje
cuda-gdb 错误消息

我尝试使用 cuda gdb 调试我的 CUDA 应用程序但遇到了一些奇怪的错误我设置了选项 g G O0构建我的应用程序我可以在没有 cuda gdb 的情况下运行我的程序但没有得到正确的结果因此我决定使用 cuda gdb 但
有没有好的 GLSL 哈希函数？

所以我对这个问题的古老评论仍然得到了支持 GLSL rand 这一行代码的起源是什么 https stackoverflow com questions 12964279 whats the origin of this glsl rand
XGBoostError：[10：10：03] /workspace/src/tree/updater_gpu_hist.cu：1407：gpu_hist 中的异常：NCCL 失败

PROJECT Nvidia 开发者项目 https developer nvidia com blog gradient boosting decision trees xgboost cuda 在 Google Colab 环境中 MY
CUDA Thrust 的多 GPU 使用

我想使用我的两张显卡通过 CUDA Thrust 进行计算我有两张显卡在单卡上运行对于两张卡都适用即使我在 std vector 中存储两个 device vector 也是如此如果我同时使用两张卡循环中的第一个周期将起作用并且不
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
CUDA计算能力2.0。全局内存访问模式

CUDA 计算能力 2 0 Fermi 全局内存访问通过 768 KB L2 缓存进行看起来开发人员不再关心全局内存库但全局内存仍然非常慢因此正确的访问模式很重要现在的重点是尽可能多地使用重用 L2 我的问题是如何我将感谢一
CUDA 添加矩阵的行

我试图将 4800x9600 矩阵的行加在一起得到一个 1x9600 的矩阵我所做的是将 4800x9600 分成 9 600 个矩阵每个矩阵长度为 4800 然后我对 4800 个元素进行缩减问题是这真的很慢有人有什么建议吗
NVCC 警告级别

我希望 NVCC 将以下警告视为错误 warning calling a host function foo from a host device function bar NVCC 文档 NVIDIA CUDA 编译器驱动程序 NVCC
使用 GPU 进行 Matlab 卷积

我用gpuArray尝试了matlab的卷积函数conv2 convn 例如 convn gpuArray rand 100 100 10 single gpuArray rand 5 single 并将其与 cpu 版本 convn ra
将内核链接到 PTX 函数

我可以使用 PTX 文件中包含的 PTX 函数作为外部设备函数将其链接到另一个应调用该函数的 cu 文件吗这是另一个问题CUDA 将内核链接在一起 https stackoverflow com questions 20636800 c
我们如何在每次运行时使用不同的种子在 CUDA C 中生成随机数？

我正在研究一个随机过程我想在每次运行程序时在 CUDA 内核中生成不同的系列随机数这类似于我们在 C 中声明种子时间空接下来是 srand 种子和兰特我可以通过内核将种子从主机传递到设备但是这样做的问题是我必须将整个种子
布尔实现的atomicCAS

我想弄清楚是否存在错误答案 https stackoverflow com a 57444538 11248508 现已删除关于Cuda like的实现atomicCAS for bool是答案中的代码重新格式化 static inl
完全禁用 NVCC 优化

我正在尝试测量 GPU 上的峰值单精度触发器为此我正在修改 PTX 文件以在寄存器上执行连续的 MAD 指令不幸的是编译器正在删除所有代码因为它实际上没有做任何有用的事情因为我没有执行任何数据的加载存储是否有编译器标志或编译指
如何从C++头文件调用CUDA文件？

我知道从 c 文件调用 cu 文件的方法但现在我想从 C 头文件调用 cu 文件有可能做到吗如果是这样我应该如何设置我的项目请帮忙这是一个有效的例子 file1 h int hello file2 h include
一维纹理内存访问比一维全局内存访问更快吗？

我正在测量标准纹理和 1Dtexture 内存访问之间的差异为此我创建了两个内核 global void texture1D float doarray int size int index calculate each thread
如何强制tensorflow使用所有可用的GPU？

我有一个 8 GPU 集群当我运行Kaggle 的一段 Tensorflow 代码 https www kaggle com keegil keras u net starter lb 0 277 scriptVersionId 2164
goto 指令对 CUDA 代码中扭曲内发散的影响

对于CUDA中简单的warp内线程发散我所知道的是SM选择一个重新收敛点 PC地址并在两个多个路径中执行指令同时禁用未采用该路径的线程的执行效果例如在下面的代码中 if threadIdx x lt 16 A do someth

随机推荐

ROS学习笔记（六）：TF坐标变换

ROS学习笔记 xff08 六 xff09 xff1a TF坐标变换 TF的基本知识TF工具tf monitortf echostatic transform publisherview framesrqt tf tree 各坐标系及其关系
String, Int 和 Byte数组

1 Bytes amp String 1 1 Bytes 61 gt String Python byte array span class token operator 61 span span class token builtin b
嵌入式如何学习与职业规划

前言 xff1a 本笔记为百问网7天物联网智能家居训练营学习总结如何学习与职业规划仔细观察一下周围的电子设备 xff0c 比如包里的手机 xff0c 戴着的手环 xff0c 开着的空调家里的洗衣机扫地机器人监控摄像头智能电视
逻辑盘（lvm）扩容

1 已经创建lvm 2 扩容目的 xff1a 把sdb容量扩给目录 2 1 xff1a dev sdb 分区格式化 span class token function fdisk span dev sdb 命令 span class t
整一篇整一篇，python3实现自动重启路由器的上的花生壳（selenium）

python3实现自动重启路由器的上的花生壳 xff08 selenium xff09 需求介绍 xff1a 我路由器上绑定的花生壳总是失效 xff0c 解决办法是重启动一下就正常了所以使用python3的selenium来实现 xff0
运维面试题库收集

运维面试题库收集 mysql主从同步原理主库打开binlog日志 xff0c 每当有从库连接到主库的时候 xff0c 主库都会创建一个线程然后发送binlog内容到从库对于每一个即将发送给从库的sql事件 xff0c binlog输出
Ubuntu 20.04 安装Arkime流量分析工具

Ubuntu 20 04 安装Arkime流量分析工具 1 安装ES span class token hvariable apt span span class token operator span span class token h
数据误删除，恢复工具之R-STUDIO

数据误删除恢复下载地址 xff1a https download csdn net download weixin 43606975 85475091 打开软件工具R STUDIO如图 xff1a 找到对应的硬盘分区 xff0c 点击2次
k8s 1.23.1 部署 prometheus 钉钉推送自定义监控配置 promql基础语法

k8s环境安装 xff1a https blog csdn net weixin 43606975 article details 119947061 spm 61 1001 2014 3001 5502 部署prometheus v0 1
docker-compose 安装部署rancher 添加已有k8s集群并管理

docker compose 安装部署 xff1a https blog csdn net weixin 43606975 article details 121159745 spm 61 1001 2014 3001 5502docker
jenkins动态节点添加配置和使用方式为docker in docker

jenkins动态节点添加配置和使用安装docker模块配置 mounts内容解释 xff1a span class token builtin type span span class token operator 61 span bi
k8s elk之logtash日志数据筛选、合并、字段匹配、索引区分

申明 xff1a 我想把我收集的日志中不需要的数据 xff0c 在kibana上不展示我想索引名字按照日志中某个字段定义名称我想把日志几行合并为一行在kibana上展示 1 安装基础环境安装es span class token com
KubeEdge 二进制安装

1 准备工作角色IP组件k8s master192 168 3 34kube apiserver xff0c kube controller manager xff0c kube scheduler xff0c docker etcd x
手动搭建VUE开发环境

1 搭建webpack基础环境 1 1初始化项目 npm init 此时会生成一个webpack json文件 xff0c 主要是生成项目的基础信息 1 2安装webpack及手脚架 npm install webpack webpack
k8s部署Pyroscope并分析golang性能瓶颈

Pyroscope是什么 Pyroscope是一种开源的应用程序性能分析工具 xff0c 它可以帮助我们发现和解决应用中的性能问题 Pyroscope支持多种编程语言并提供了丰富的性能数据 xff0c 可以帮助我们跟踪应用程序的执行情况 x
Jetson TX2上配置archiconda、Yolov5、tensorrtx环境问题记录

文章目录前言本文主要记录在Jetson TX2上配置archiconda Yolov5 tensorrtx环境中遇到的问题以及解决方法以及一些包的分享一 Jetson TX2刷机二安装archiconda三安装torch和torc
二进制信号量和互斥信号量的区别

二进制信号量和互斥信号量的区别互斥量用于线程的互斥 xff0c 信号量用于线程的同步这是互斥量和信号量的根本区别 xff0c 也就是互斥和同步之间的区别互斥 xff1a 是指某一资源同时只允许一个访问者对其进行访问 xff0c 具有唯
如何用xmanager启动Linux上的图形界面程序

对于无法直接进入服务器桌面化的同学来说 xff0c 安装oracle等需要调用图形化简便安装的软件着实有些困难 xff0c 接下来我就说说如何通过xmanager调用远程桌面在自己桌面展示 1 首先下载xmanager并安装 xff1b 2
C51单总线时序图分析与底层编程配置（DS18B20为例）

系列文章目录提示 xff1a 这里可以添加系列文章的所有文章的目录 xff0c 目录需要自己手动添加提示 xff1a 写完文章后 xff0c 目录可以自动生成 xff0c 如何生成可参考右边的帮助文档文章目录系列文章目录前言一场景
【详细】摸索了三次后总结的安装CUDA的方法，一气呵成使用GPU跑代码

第一次安装的时候真的是纯小白 xff0c 各种概念都不懂 xff0c 只知道使用GPU跑代码需要安装CUDA 弯路走了不少 xff0c 前前后后被虐了一周 xff0c 安装的非常艰辛 xff0c 且混乱 xff1b 第二次安装是在同学电脑上

【详细】摸索了三次后总结的安装CUDA的方法，一气呵成使用GPU跑代码

【详细】摸索了三次后总结的安装CUDA的方法，一气呵成使用GPU跑代码 的相关文章

随机推荐

热门标签

【详细】摸索了三次后总结的安装CUDA的方法，一气呵成使用GPU跑代码的相关文章