搭建深度学习环境:Tensorflow-gpu过程记录

  1. 我的电脑配置NVIDIA RTX3060显卡
  2. 搭建的为cuda11.2 + cudnn8.2.1 + Tensorflow2.9.0

一、搭建过程

1.官网安装Anaconda

2.对Anaconda和Python换源,使得下载地址为国内清华镜像Index of /anaconda/pkgs/main/win-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

3.使用conda install安装版本对应的cuda + cudnn + Tensorflow-gpu,cuda只需要安装cudatoolkit即可,版本对应可查阅Build from source on Windows | TensorFlow (google.cn)

4.进入python使用import Tensorflow as tf来验证是否下载成功,使用tf.test.is_gpu_available()来验证是否可用。

具体可参考Tensorflow-gpu安装超详细!!!_东海扬尘_BingO的博客-CSDN博客_tensorflowgpu安装

二、过程中遇到的问题及解决方法

  • 问题一:Tensorflow/keras 模型搭建以及训练的第一个epoch速度非常慢
    由于我一开始按照上面教程创建的环境及对应的版本为python3.7 + cuda10.1 + cudnn7.6 + tensorflow-gpu2.1.0,从网上查阅,可能是由于30系显卡与cuda版本不符的问题,仅支持cuda11和cudnn8.0以上的版本。
  • 问题二:由于换源后的清华镜像网站上没有cudnn8.0及8.1的版本,而官网版本对照中cudnn最高仅到8.1版本
    image.png
    我查找清华镜像网站后,发现网站上有2021年的cudnn8.2.1版本,以及相对于的cuda11.2版本,于是我下载了最新的Tensorflow-gpu2.9.0版本,最后验证使用时,版本对应没有问题。
  • 问题三:按照顺序下载后,在验证import tensorflow as tf时会出现

TypeError: Descriptors cannot not be created directly. If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0. If you cannot immediately regenerate your protos, some other possible workarounds are:

  1. Downgrade the protobuf package to 3.20.x or lower.
  2. Set PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (but this will use pure-Python parsing and will be much slower).

More information: https://developers.google.com/protocol-buffers/docs/news/2022-05-06#python-updates

解决方案

  1. pip uninstall protobuf
  2. pip install protobuf==3.20.1
  • 问题四:由于我使用的是Anaconda的jupyter lab作为代码编辑器,最后需要添加一下python内核
  1. conda env list # 检查已有的虚拟环境
  2. activate 环境名
  3. conda install nb_conda
  4. conda install ipykernel
  5. conda install -n 环境名 ipykernel
  6. python -m ipykernel install --user --name 环境名

参考在Jupyter Notebook中添加conda虚拟环境内核_Triumph++的博客-CSDN博客


文章标签:

原文连接:https://juejin.cn/post/7106426839630872584

相关推荐

前端如何开始深度学习,那不妨试试JAX

爆肝万字,终于搞定这篇⛵神经网络搭建全全全流程!学不会你来找我~

【深度学习】(二)深度学习基础学习笔记

Windows 安装 Tensorflow 教程,一看就会,十分简单

单人的姿态检测|tensorflow singlepose

Tensorflow2 深度学习十必知

深度学习---三好学生各成绩所占权重问题(3)

深度学习---三好学生各成绩所占权重问题(2)

深度学习(初识tensorflow2.版本)之三好学生成绩问题(1)

【问题解决】Tensorflow中run究竟运行了哪些节点?

安装tensorflow的GPU版本(详细图文教程)--CUDA11.6的安装

TensorFlow败给PyTorch,谷歌:未来就靠你了,JAX

知识储备 -- M1 MacBook Pro上安装Tensorflow

人工智能图像实战课:夏天照片归类器

搭建深度学习环境:Tensorflow-gpu过程记录

TensorFlow新文档发布:新增CLP、DTensor...最先进的模型已就绪

从零开始构建并编写神经网络---Keras【学习笔记】[1/2]

使用 TensorFlow 和 Express.js 实现AI图像识别

深度学习与CV教程(8) | 常见深度学习框架介绍

深度学习与计算机视觉教程(8) | 常见深度学习框架介绍(CV通关指南·完结🎉)