GPU训练环境搭建
作者:YXN-python 阅读量:45 发布日期:2024-12-10
说在前面:
1、整个过程中某下包最好使用国内镜像源安装,临时使用清华镜像源命令:
pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
2、整个过程不能用国内镜像源的,复制下载链接到迅雷下载会快N倍,比如下载CUDA、cuDNN、torch等的时候
1、安装驱动
显卡驱动根据显卡型号下载安装
驱动下载地址:https://www.nvidia.cn/geforce/drivers/
2、安装CUDA
注意:`CUDA` 版本决定了 后面训练环境需要安装的对应 版本,具体可点击下方链接查看:
https://pytorch.org/get-started/locally/
1、查看电脑GPU对应的CUDA版本
打开 NVIDIA控制面板 -帮助 -系统信息 -组件 -NVCUDA64.DLL右边对应的 产品名称 有版本号,
如:NVIDIA CUDA 11.4.176 driver
下载的时候不要超过这个版本,最好就下载该版本,后面的包安装都要参考 CUDA 对应的版本
CUDA下载地址:https://developer.nvidia.com/cuda-toolkit-archive
2、安装时:
Extraction path是临时解压路径、后面会自动删除的,
选择驱动程序组件 的时候,勾选CUDA,其他自由选择,CUDA里面的 Visual Studio Integration 可以不勾选
3、安装后 查看系统环境变量 系统变量 是否存在下面两个环境变量,10_1看版本,只安装了CUDA可能没有后面两条,不影响
CUDA_PATH
CUDA_PATH_V10_1
NVCUDASAMPLES_ROOT
NVCUDASAMPLES10_1_ROOT
查看系统变量的`Path`,查看是否有一下两条内容:
D:\install\CUDA\Development\bin
D:\install\CUDA\Development\libnvvp
没有需要自行根据安装地址添加
4、然后重启,`cmd` 输入 `nvcc -v `查看是否安装成功,只安装了CUDA可能查看不了,不影响
3、安装cuDNN
下载CUDA对应的cuDNN版本,下面链接后面有说明
cuDNN下载地址:https://developer.nvidia.com/rdp/cudnn-archive
安装:将压缩包内的 `bin、include、lib` 内的文件分别放到 `CUDA` 安装目录下的对应文件夹中
4、卸载CPU版
如果安装过cpu版本需要卸载掉
pip uninstall torch torchvision torchaudio
5、安装GPU版
官网寻找 `CUDA` 对应版本的兼容版本的安装命令,打开页面,ctrl+f 搜索要安装版本号,如:CUDA 10.1
地址:https://pytorch.org/get-started/previous-versions/
我的是 `CUDA 10.1`,找到的安装命令如下:
pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
注意:
1、安装过程中 torch 下载很大又特别慢,可以运行命令后复制下载时的下载地址用迅雷下载(很快),然后本地安装
2、虽然上面的pip链接是官网给出的,但是还是存在包找不到的情况,所以在用迅雷下载之前先三个包分开执行以下看存不存在,存在再下载,不存在就再改别的命令,避免浪费时间下载下来又不行
6、测试是否可以用gpu训练
import torch
print(torch.cuda.is_available()) # 如果输出 True,则可以使用 GPU
print(torch.cuda.device_count()) # 输出可用的 GPU 数量
print(torch.cuda.get_device_name(0)) # 查看第一个 GPU 的名称
YXN-python
2024-12-10