我正在尝试使用 CUDA 安装 PyTorch。
我按照中提到的说明(使用 conda 安装)进行操作https://pytorch.org/get-started/locally/
conda 安装 pytorch torchvision torchaudio cudatoolkit=11.3 -c
火炬
conda install 命令运行时不会出现任何错误:
康达名单显示以下内容:
# Name Version Build Channel
cudatoolkit 11.3.1 h2bc3f7f_2
pytorch 1.11.0 py3.9_cuda11.3_cudnn8.2.0_0 pytorch
pytorch-mutex 1.0 cuda pytorch
torch 1.10.2 pypi_0 pypi
torchaudio 0.11.0 py39_cu113 pytorch
torchvision 0.11.3 pypi_0 pypi
但是当我检查 PyTorch 是否启用并访问 GPU 驱动程序和 CUDA 时
torch.cuda.is_available()
返回假。
在安装 Pytorch 之前,我检查并确认了中提到的先决条件
https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#system-requirements
https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#pre-installation-actions
这是我的 ubuntu 服务器详细信息:
环境:
Ubuntu 18.04.6 LTS(GNU/Linux 4.15.0-154-通用 x86_64)
表下脚注:表 1. CUDA 11.6 中的本机 Linux 发行版支持
提及
对于 x86-64 上的 Ubuntu LTS,服务器 LTS 内核(例如 4.15.x
18.04)在 CUDA 11.6 中受支持。
gcc (Ubuntu 7.5.0-3ubuntu1~18.04) 7.5.0
ldd(Ubuntu GLIBC 2.27-3ubuntu1.5)2.27
GPU
GeForce GTX 1080 Ti
内核头文件和开发包
$ uname -r
4.15.0-176-generic
据我了解,使用 CUDA 安装 conda pytorch 也会安装 CUDA 驱动程序。
我不知道我哪里出错了。
提前致谢。
EDIT:
$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85
nvcc
显示 CUDA 版本 9.1
whereas
$ nvidia-smi
Wed May 11 06:44:31 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.104 Driver Version: 410.104 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:05:00.0 Off | N/A |
| 25% 40C P8 11W / 250W | 18MiB / 11177MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... Off | 00000000:06:00.0 Off | N/A |
| 25% 40C P8 11W / 250W | 2MiB / 11178MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 2 GeForce GTX 108... Off | 00000000:09:00.0 Off | N/A |
| 25% 35C P8 11W / 250W | 2MiB / 11178MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 4119 G /usr/lib/xorg/Xorg 9MiB |
| 0 4238 G /usr/bin/gnome-shell 6MiB |
+-----------------------------------------------------------------------------+
nvidia-smi
显示 CUDA 版本 10.0
https://varhowto.com/check-cuda-version/本文提到 nvcc 指的是 CUDA-toolkit,而nvidia-smi
指 NVIDIA 驱动程序。
Q1:这是否表明在系统范围内有两种不同的 CUDA 安装?
Nvidia Cudatoolkit 与 Conda Cudatoolkit我在 conda 环境中安装的 CUDA 工具包(版本 11.3.1)与作为系统范围级别安装的工具包不同(由以下输出显示)nvcc
and nvidia-smi
).
Q2:根据上述 stackoverflow 线程的回答,它们可以是分开的。还是我本地安装cuda失败的原因?