深度学习流体力学环境搭建

Ubuntu 安装 GPU 驱动并创建 Anaconda 虚拟环境

GPU Driver

  1. 检查显卡驱动, 如果不存在需要进入英伟达官网下载对应驱动文件
1
nvidia-smi
  1. 检查 GCC 版本信息, 需高于 12
1
2
3
4
5
gcc --version
sudo apt update
sudo apt install gcc
sudo apt install g++
sudo apt install make
  1. 禁用默认开源驱动nouveau
1
2
3
4
5
6
7
8
9
10
11
# open config file
sudo vim /etc/modeprobe.d/blacklist.conf
# add config
blacklist nouveau
options nouveau modeset=0
# update file
sudo update-initramfs -u
# reboot
reboot
# check
lsmod | grep nouveau
  1. 执行驱动文件安装
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
sudo telinit 3
# login: username and password
Defaults requiretty
export LANG=C
# stop X-windows
sudo service --status-all
# [+] gdm3
sudo service gdm3 stop
sudo service --status-all
# [-] gdm3
sudo chmod 777 NVIDIA-Linux-x86_64-<version>.run
# uninstall nvidia driver
sudo ./NVIDIA-Linux-x86_64-<version>.run --uninstall
# install nvidia driver
sudo ./NVIDIA-Linux-x86_64-<version>.run -no-opengl-files -no-x-check
# automatically update X configuration => Yes
# restart X-windows
sudo service gdm3 start
# check nvidia driver
nvidia-smi
  1. 退出 TTY 用户登陆:通过 Ctrl + Alt + F3 切换到安装登陆的 tty, exit 退出登陆

CUDA

  1. 查看支持的 CUDA 版本 NVIDIA CUDA Toolkit Release Notes
1
2
3
4
5
6
nvidia-smi
# Driver Version: 550.127.05 CUDA Version: 12.4
# Minimum Required Driver Version for CUDA: CUDA 12.x >=525.60.13
# CUDA Toolkit:
# CUDA 12.4 GA >=550.54.14
# CUDA 12.3 Update 1 >=545.23.08
  1. 安装方式选择
    1. 全局安装
    2. conda 安装

Anaconda Environment

  1. 创建虚拟环境
1
conda create -n env_pytorch_cuda python=xxx
  1. 安装 Pytorch (https://pytorch.org/get-started/previous-versions/)
1
conda install pytorch==2.5.0 torchvision==0.20.0 torchaudio==2.5.0 pytorch-cuda=12.4 -c pytorch -c nvidia
  1. 检查是否安装成功
1
2
>>> import torch
>>> print(torch.cuda.is_available())
  1. 为避免重复安装,可以先创建一个父环境,其他新环境直接复制
1
conda create --name myenv_clone --clone myenv

VScode 配置

安装 jupyter 插件,在环境中安装 ipykernel

1
2
conda activate xxxx_env
pip install ipykernel

Reference

知乎 | 一切都好 - ubuntu22.04安装nvidia显卡驱动——超详细、最简单
知乎 | 三只大猫 - Ubuntu20.04安装NVIDIA显卡驱动
博客园 | pprp - NVIDIA 驱动安装(超详细)
CSDN - ubuntu18.04 tty报错&tty界面su/sudo命令无法执行, 如何解决
各 GPU 支持的CUDA版本
知乎 | 残差不收敛怎么办 - 使用conda管理CUDA库

0%