• bug 背景:原本项目使用的是 tensorflow 的 2.1 的版本,该项目在 RTX 1660 上可以正常运行,只是将显卡换到了 RTX 4080 上就运行失败了,所以肯定是显卡(环境)的原因。

  • 实际原因:根据搜集到的资料和项目的报错提示来看,2.1 版本的 tf 还不知道有 4080 这种显卡的存在,所以才会无法识别,导致各种问题,因此,想解决这个问题,是一定要升级 tf 的版本的。

  • 解决方案:这里给出一个可以在 4080 上运行的版本:

    • python:3.6.x(任意小版本)
    • tensorflow:2.6.0
    • CUDA:11.2.2(win10 版本也可用于 win11 系统)
    • cuDNN:8.1.1
    • Keras:2.6(如果需要的话)

# CUDA

下载直链https://developer.nvidia.com/cuda-toolkit-archive

安装过程没有太多好说的,教程也非常多,这里稍微说点不常见的:

最好安装在默认路径

原因在于会涉及到环境变量的配置,大多数教程给出的都是默认的环境变量地址,如果不熟悉的话,安装在默认位置会剩一点力气。

安装完成后需要添加以下环境变量:

- CUDA_BIN_PATH_v11.2 = %CUDA_PATH%\bin
- CUDA_LIB_PATH_v11.2 = %CUDA_PATH%\lib\x64
- CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.2
- CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
- CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64
  1. 这里的 CUDA_SDK_PATH 后的环境变量其实就是默认安装地址,若不是默认地址,这里需要修改为实际的安装地址,其他不用变。

  2. 如果运行时代码报错一堆 dll 找不到,可能就是环境变量没刷新的问题,重启下终端看能不能解决(实在不行就重启电脑,最保险~)

# cuDNN

下载直链https://developer.nvidia.com/rdp/cudnn-archive

下载:cuDNN v8.1.1 for CUDA 11.0,11.1 and 11.2 版本

同样不多说了,教程很多。

# Tensorflow

tensorflow 建议在 conda 那安装,可以用 anaconda,也可以是 miniconda,这个无所谓,这里假设你已经有了相关知识。

conda create -n tensorflow2 python=3.6
conda activate tensorflow2

pip install tensorflow-gpu==2.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

可以通过以下方式来测试是否成功安装:

# 在交互式 python 终端中输入:
import tensorflow as tf

加载可能比较慢,但若没有任何报错,那就是成功安装了。

至此,就应该可以调用 4080 来跑 tensorflow 的代码了~


更新于 阅读次数

请我喝[茶]~( ̄▽ ̄)~*

Gality 微信支付

微信支付

Gality 支付宝

支付宝