1080Ti 驱动在内核升级后罢工
早上更新系统,晚上 nvidia-smi 就挂了 homelab 执行完 pacman -Syu 后,系统日志里出现这行: failed to generate CDI spec: failed to create device CDI specs: failed to construct device spec generators: failed to initialize NVML: Driver Not Loaded 跑 nvidia-smi 直接报错。一开始以为是简单的模块没加载, modprobe nvidia 怎么都不行。 查了一圈发现是内核升级惹的祸 —— 从 6.19.6 到了 6.19.8,而我的 nvidia-580xx-dkms 还停留在 580.119 版本。 为啥用 yay 装 580 版本?因为 Arch 官方仓库的 nvidia 驱动已经放弃支持 Pascal 架构(GTX 1080 Ti 就是 Pascal)。官方驱动只管 Turing 以后的显卡,老卡只能靠 AUR 社区维护的 nvidia-580xx-dkms 续命。 诊断过程很简单: # 检查当前内核版本 uname -r # 6.19.6-zen1-1-zen # 确认 GPU 存在 lspci | grep -i nvidia # 01:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] # 查看驱动版本 pacman -Q nvidia-580xx-dkms # nvidia-580xx-dkms 580.119.02-2 # 检查模块是否加载(无输出 = 未加载) lsmod | grep nvidia # 查看 DKMS 状态 dkms status nvidia # nvidia/580.119.02: added <- 注意是 added 而非 installed 编译日志里的报错很直白(=/var/lib/dkms/nvidia/580.119.02/build/make.log=): ...