您现在的位置是:网站首页 > 博客日记 >

GPU训练环境搭建

作者:YXN-python 阅读量:45 发布日期:2024-12-10

说在前面:

1、整个过程中某下包最好使用国内镜像源安装,临时使用清华镜像源命令:

pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

2、整个过程不能用国内镜像源的,复制下载链接到迅雷下载会快N倍,比如下载CUDA、cuDNN、torch等的时候

1、安装驱动

显卡驱动根据显卡型号下载安装

驱动下载地址:https://www.nvidia.cn/geforce/drivers/

2、安装CUDA

注意:`CUDA` 版本决定了 后面训练环境需要安装的对应 版本,具体可点击下方链接查看:

https://pytorch.org/get-started/locally/

1、查看电脑GPU对应的CUDA版本

打开 NVIDIA控制面板 -帮助 -系统信息 -组件 -NVCUDA64.DLL右边对应的 产品名称 有版本号,

如:NVIDIA CUDA 11.4.176 driver

下载的时候不要超过这个版本,最好就下载该版本,后面的包安装都要参考 CUDA 对应的版本

CUDA下载地址:https://developer.nvidia.com/cuda-toolkit-archive

2、安装时:

            Extraction path是临时解压路径、后面会自动删除的,

            选择驱动程序组件 的时候,勾选CUDA,其他自由选择,CUDA里面的 Visual Studio Integration 可以不勾选

3、安装后 查看系统环境变量 系统变量 是否存在下面两个环境变量,10_1看版本,只安装了CUDA可能没有后面两条,不影响

CUDA_PATH

CUDA_PATH_V10_1

NVCUDASAMPLES_ROOT

NVCUDASAMPLES10_1_ROOT

查看系统变量的`Path`,查看是否有一下两条内容:

D:\install\CUDA\Development\bin

D:\install\CUDA\Development\libnvvp

没有需要自行根据安装地址添加

4、然后重启,`cmd` 输入 `nvcc -v `查看是否安装成功,只安装了CUDA可能查看不了,不影响

3、安装cuDNN

下载CUDA对应的cuDNN版本,下面链接后面有说明

cuDNN下载地址:https://developer.nvidia.com/rdp/cudnn-archive

安装:将压缩包内的 `bin、include、lib` 内的文件分别放到 `CUDA` 安装目录下的对应文件夹中

4、卸载CPU版

如果安装过cpu版本需要卸载掉

pip uninstall torch torchvision torchaudio

5、安装GPU版

官网寻找 `CUDA` 对应版本的兼容版本的安装命令,打开页面,ctrl+f 搜索要安装版本号,如:CUDA 10.1

地址:https://pytorch.org/get-started/previous-versions/

我的是 `CUDA 10.1`,找到的安装命令如下:

pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

注意:

1、安装过程中 torch 下载很大又特别慢,可以运行命令后复制下载时的下载地址用迅雷下载(很快),然后本地安装

2、虽然上面的pip链接是官网给出的,但是还是存在包找不到的情况,所以在用迅雷下载之前先三个包分开执行以下看存不存在,存在再下载,不存在就再改别的命令,避免浪费时间下载下来又不行

6、测试是否可以用gpu训练

import torch

print(torch.cuda.is_available())  # 如果输出 True,则可以使用 GPU
print(torch.cuda.device_count())  # 输出可用的 GPU 数量
print(torch.cuda.get_device_name(0))  # 查看第一个 GPU 的名称

YXN-python

2024-12-10