Chinaunix首页 | 论坛 | 博客
  • 博客访问: 10168941
  • 博文数量: 1669
  • 博客积分: 16831
  • 博客等级: 上将
  • 技术积分: 12594
  • 用 户 组: 普通用户
  • 注册时间: 2011-02-25 07:23
个人简介

柔中带刚,刚中带柔,淫荡中富含柔和,刚猛中荡漾风骚,无坚不摧,无孔不入!

文章分类

全部博文(1669)

文章存档

2023年(4)

2022年(1)

2021年(10)

2020年(24)

2019年(4)

2018年(19)

2017年(66)

2016年(60)

2015年(49)

2014年(201)

2013年(221)

2012年(638)

2011年(372)

分类: 系统运维

2020-02-23 05:50:10



主机系统维护模式设置

esxcli system maintenanceMode set --enable true

GPU设备设置为vGPU模式

esxcli graphics host set --default-type SharedPassthru

返回Default Graphics Type: SharedPassthru

esxcli graphics host get


安装VIB

安装显卡驱动

esxcli software vib install -v /tmp/NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib

说明: 小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动

更新显卡驱动

esxcli software vib update -v /tmp/NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib

ESXi主机服务器退出维护模式

esxcli system maintenanceMode set --enable false

安装在ESXi主机上的VIB,并确保正确完成了NVIDIA VIB

esxcli software vib list | grep -i NVIDIA

说明: 小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动

驱动检查

gpuvm  vGPU

说明: 小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动

GPU卡和ESXi是否可以正常工作

nvidia-smi

说明: 小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动

检查是否有vgpu资源

nvidia-smi vgpu –s

查看第三块卡的运行参数

nvidia-smi -i 2 –q

使用vGPU需要关闭ECC

nvidia-smi -i 2 -e 0

nvidia-smi -e 0

说明: 小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动

现在检查是否已禁用ECC模式

nvidia-smi -q

设置GPU的工作模式,默认VSGA

nvidia-smi -i 2 -vm 3

移除 VIB

esxcli software vib remove --vibname=NVIDIA-vGPU-VMware_ESXi_6.0_Host_Driver

esxcli software vib remove --vibname=NVIDIA-VMware_ESXi_6.7_Host_Driver

测试集群虚拟机是否可以添加新PCI设备

说明: 小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动小白也能懂的VMware ESXi安装NVIDIA GPU显卡硬件驱动

我们可以从上面的VM列表中选择一个示例vGPU配置文件:grid_P100-8q。此配置文件允许VM使用最多8GB的物理GPU内存(总计16GB)。因此,具有此配置文件的主机服务器上的两个单独的虚拟机可以共享同一物理GPU。

通过选择将GPU的全部内存分配给VM的vGPU配置文件,我们可以将该GPU完全专用于该VM,例如,对于具有16 GB内存的GPU,使用名为“ grid_p100-16q”的配置文件。

问题分析

DELL服务器BIOS设置I/O参数

ECC设置

英伟达显卡驱动版本不对

解决办法

设置BIOS内存映射I/O库设置为512GB(默认情况下为56TB)

关闭ECC

更换显卡驱动版本

原文来自:

本文地址:编辑:吴向平,审核员:逄增宝

大全:

为您推荐一些与本文相关的文章:

 

阅读(1435) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~