搭建 CUDA 环境虚拟机

当前技术领域，深度学习和大型模型应用的开发正变得日益重要，通过在虚拟机系统中安装 NVIDIA 驱动和 CUDA Toolkit，以及搭建 CUDA Docker 环境，可以在虚拟化的环境中充分利用 GPU 资源，进行深度学习模型的训练和大型模型应用的开发。

TIP

建议选择 Ubuntu 作为虚拟机系统，其在安装 NVIDIA 驱动方面相对方便。

虚拟机创建

确认PVE开启了硬件直通功能。PVE硬件直通
创建虚拟机，Machine 类型选择 q35
添加PCI设备，选择显卡设备。
- 勾选 ALL FUNCTIONS
- 勾选 Primary GPU
- Advanced 设置中勾选 PCI-Express
Display 设置中选择 Standard VGA （否则console无法显示）

安装 NVIDIA 驱动

检查显卡是否直通成功

在安装 NVIDIA 驱动之前，首先需要确认虚拟机是否成功检测到显卡。

执行以下命令以检查虚拟机中是否检测到显卡：

lspci | grep -i nvidia

如果命令输出显示了 NVIDIA 显卡信息，则表示显卡直通成功。

安装驱动

查看当前系统中可用的 NVIDIA 驱动：
```
sudo ubuntu-drivers devices
```
安装 NVIDIA 驱动：
```
sudo apt install nvidia-driver-495
```
安装完成后，重启虚拟机以应用驱动安装：
```
sudo reboot
```

安装 CUDA Toolkit

准备工作

在安装 CUDA Toolkit 之前，请确保 NVIDIA 驱动已正确安装。

安装步骤

访问 NVIDIA CUDA Toolkit 网站，选择对应的操作系统版本，下载安装包。

根据下载页面提供的指令进行安装。通常，安装指令如下：

sudo dpkg -i cuda-repo-<distro>_<version>_amd64.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

设置环境变量：

在 ~/.profile 或者 ~/.bashrc 文件中添加以下行：

export PATH=/usr/local/cuda-<version>/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-<version>/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

其中 <version> 需要替换为实际安装的 CUDA 版本。

重启终端或重新登录，执行 nvcc --version 验证 CUDA Toolkit 是否安装成功。

ON THIS PAGE

#搭建 CUDA 环境虚拟机

#虚拟机创建

#安装 NVIDIA 驱动

#检查显卡是否直通成功

#安装驱动

#安装 CUDA Toolkit

#准备工作

#安装步骤