前言:为什么要升级 CUDA?我在学习人工智能课程时,遇到了一个 GPU 计算环境的问题。
操作系统:Windows 10 64 位
Python 版本:3.13
显卡:NVIDIA RTX 2070 Super(驱动版本 512.78)
原 CUDA 版本:11.6
课程要求 CUDA 版本:11.8,但旧驱动不支持
因此,我需要升级驱动,并安装与之兼容的 CUDA 版本。过程中涉及驱动更新、旧版本清理和新版本安装,以下是完整的操作流程。
1. 查询当前驱动和 CUDA 版本nvidia-smi
nvcc --version
如果 nvcc --version显示 not recognized,说明 CUDA 可能未正确安装或环境变量未配置。
2. 升级 NVIDIA 驱动下载最新版驱动访问 NVIDIA 官方驱动查询
选择 GeForce RTX 20 Series (Notebooks) → RTX 2070 SUPER → Windows 10 64-bit
下载并运行安装程序
选择 自定义安装 → 执行干净安装(清除旧驱动)
验证驱动更新nvidia-smi
查看 Driver Version是否已更新,同时检查支持的 CUDA 版本。
3. 清理旧的 CUDA 11.6方法 1:控制面板卸载(推荐)按 Win + R,输入 appwiz.cpl,回车
在 "程序和功能"界面,找到 NVIDIA CUDA 11.6并卸载
方法 2:手动清理(如果卸载失败)删除文件夹rmdir /s /q "C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v11.6"
运行清理脚本创建 clean_cuda.bat,粘贴以下代码并运行:
@echo off
echo 清理 CUDA 11.6 残留...
:: 删除环境变量中的 CUDA 11.6 相关路径
setx CUDA_PATH "" /M
setx CUDA_HOME "" /M
:: 获取系统环境变量 Path
for /f "tokens=2 delims==" %%a in ('wmic environment where "name='Path' and username='
:: 删除 Path 变量中包含 CUDA 11.6 的路径
set "NEWPATH="
for %%i in (%PATHVAR:;=" "%") do (
echo %%i | findstr /I "CUDA\\v11.6" >nul || set "NEWPATH=!NEWPATH!;%%i"
)
:: 更新 Path 变量
if not "%NEWPATH%"=="" (
setx Path "%NEWPATH:~1%" /M
)
:: 删除 CUDA 11.6 的注册表项
reg delete "HKEY_LOCAL_MACHINE\SOFTWARE\NVIDIA Corporation\CUDA" /f
reg delete "HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\NVIDIA Corporation\CUDA" /f
echo 清理完成,请重启电脑!
pause
4. 下载并安装 CUDA 12.8访问 CUDA 官方下载页面,选择 Windows 10 64-bit,推荐 exe (network)或 exe (local)版本。
版本优点缺点exe (network)体积小,安装时自动下载最新组件需要稳定的网络exe (local)一次性下载完整安装包,离线可用体积大(2GB+),占用更多存储空间建议:
网络正常→ 选 exe (network)
网络不稳定→ 选 exe (local)
安装步骤运行 CUDA_12.8.exe
选择 Express(默认)或 Custom(自定义)安装
安装完成后,重启系统
5. 验证 CUDA 安装是否成功检查 CUDA 版本nvcc --version
检查 NVIDIA 驱动和 CUDA 兼容性nvidia-smi
如果显示 CUDA 12.8,则安装成功!
6. 测试 PyTorch / TensorFlow 是否支持 GPUPyTorch 测试import torch
print(torch.cuda.is_available()) # 如果返回 True,说明 GPU 可用
print(torch.cuda.get_device_name(0)) # 显示 GPU 名称
TensorFlow 测试import tensorflow as tf
print(tf.config.list_physical_devices('GPU')) # 列出可用 GPU
如果以上测试 成功,说明 CUDA 12.8 已正确安装并可用!
总结这次升级主要解决了 CUDA 版本不兼容的问题,完整流程如下:
查询旧版本信息 nvidia-smi& nvcc --version
更新 NVIDIA 驱动
卸载 CUDA 11.6 并清理残留文件
下载并安装 CUDA 12.8
验证安装是否成功
测试Ai运行环境