问题表象

某品牌x86服务器,Nvidia 2080 Ti GPU卡, CentOS7.3 操作系统, 配置vfio-pci驱动启动报错。

问题的操作步骤

  1. 硬件准备完毕,全部是原厂硬件,一般不会有硬件故障
  2. 安装Centos7.3操作系统,设置启动参数iommu=on等,在其他服务器上对比过,也没有问题。

3. 检查硬件板卡,已经被系统识别

4. 检查GPU卡的驱动状态,并没有启动vfio-pci

5. 检查vfio驱动配置文件,iommu配置,正常

6. 检查dmesg, 发现问题是vfio-pci驱动启动失败