当前技术领域,深度学习和大型模型应用的开发正变得日益重要,通过在虚拟机系统中安装 NVIDIA 驱动和 CUDA Toolkit,以及搭建 CUDA Docker 环境,可以在虚拟化的环境中充分利用 GPU 资源,进行深度学习模型的训练和大型模型应用的开发。
建议选择 Ubuntu 作为虚拟机系统,其在安装 NVIDIA 驱动方面相对方便。
Machine
类型选择 q35
ALL FUNCTIONS
Primary GPU
Advanced
设置中勾选 PCI-Express
Display
设置中选择 Standard VGA
(否则console无法显示)在安装 NVIDIA 驱动之前,首先需要确认虚拟机是否成功检测到显卡。
执行以下命令以检查虚拟机中是否检测到显卡:
如果命令输出显示了 NVIDIA 显卡信息,则表示显卡直通成功。
查看当前系统中可用的 NVIDIA 驱动:
安装 NVIDIA 驱动:
安装完成后,重启虚拟机以应用驱动安装:
在安装 CUDA Toolkit 之前,请确保 NVIDIA 驱动已正确安装。
访问 NVIDIA CUDA Toolkit 网站,选择对应的操作系统版本,下载安装包。
根据下载页面提供的指令进行安装。通常,安装指令如下:
设置环境变量:
在 ~/.profile
或者 ~/.bashrc
文件中添加以下行:
其中 <version>
需要替换为实际安装的 CUDA 版本。
重启终端或重新登录,执行 nvcc --version
验证 CUDA Toolkit 是否安装成功。