Перейти к содержанию

Инструкция по настройке

Версионность драйверов

Версии драйверов для сервера и виртуальных машин должны быть совместимы.

Следует устанавливать драйверы для ВМ и сервера из актуального пакета для Linux KVM, скачанного с официального сайта NVIDIA.

При отсутствии доступа к личному кабинету NVIDIA обратитесь в сервисный центр, к дистрибьютору или вендору.

Архив содержит:

  • документацию;

  • драйверы для сервера с ОС Linux;

  • драйверы для ВМ с ОС Linux;

  • драйверы для ВМ с ОС Windows.

1. Установка драйвера NVIDIA GRID на сервер

  1. При наличии на графическом адаптере физических дисплейных выходов необходимо программно отключить их.

  2. Скачать драйверы с официального сайта NVIDIA.

    При отсутствии доступа к личному кабинету NVIDIA обратитесь в сервисный центр, к дистрибьютору или вендору.

  3. Перейти в Web-интерфейс SpaceVM.

  4. Перейти в раздел Хранилища - Пулы данных - <Пул данных> - Файлы.

  5. Нажать кнопку Загрузить из файловой системы.

  6. Выбрать файл драйвера и нажать кнопку ОК.

    Также допускается загрузка файла драйвера на сервер SpaceVM с помощью SSH или FTP.

  7. Перейти в CLI сервера, в который установлен графический адаптер.

  8. Установить драйверы командой:

    install-run --nv /storages/local/default/_LIBRARY/NVIDIA-Linux-x86_64-*-vgpu-kvm.run
    

    где * - версия устанавливаемых драйверов.

    Если файл был загружен на пул данных, отличный от Базового пула данных узла, необходимо вместо /storages/local/default/_LIBRARY/ указать путь до соответствующей директории.

    Внимание

    В процессе установки будет предложено установить драйверы, используя DKMS. Необходимо отклонить предложение.

    Ошибка установки драйвера

    При возникновении ошибки вида Невозможно установить nvidia.ko, содержащей текст 64-bit BAR или нулевой размер BAR, необходимо включить в BIOS поддержку Above 4G Decoding и PCI 64-Bit Resource Allocation.

  9. Перезагрузить сервер.

Адаптеры с архитектурой Ampere

Данные адаптеры обладают поддержкой SR-IOV.

Для возможности распределения vGPU необходимо включить поддержку данной технологии для видеоадаптеров на сервере:

  1. Получить идентификатор шины, состоящий из 16 символов, с помощью команды CLI:

    nvidia vgpu_list
    
  2. Включить поддержку командой:

    nvidia sriov enable 0000:5E:00.0
    

    где 0000:5E:00.0 - идентификатор шины, сокращенный до 12 символов (убраны первые четыре 0).


2. Подключение графического адаптера к ВМ

  1. Выключить питание ВМ.

  2. Перейти в раздел Mediated-устройства ВМ.

  3. Нажать кнопку Подключить mediated-устройство.

    Внимание

    Не допускается перенос ВМ с mediated-устройствами между серверами.

  4. В открывшемся окне необходимо заполнить следующие поля:

    • Выбрать mediated-устройство.

      Выбор из раскрывающегося списка.

    • Выбрать PCI-контроллер.

      Выбор из раскрывающегося списка.

    • Display.

      Сообщает, необходимо ли использовать данное устройство для вывода графической информации.

      Установить значение: включено.

    • Ramfb.

      Добавляет устройство "кадровый буфер (framebuffer) в памяти" к ВМ, через которое выводятся сообщения от старта ВМ до загрузки основного драйвера vGPU.

      Установить значение: включено.

  5. Нажать кнопку Подключить.

    Примечание для mediated-устройств NVIDIA

    В случае использования mediated-устройств NVIDIA для каждого типа устройств (исключая вычислительные) производителем задается определенное ограничение частоты кадров (FRL - Framerate Limit) для равномерного распределения ресурсов GPU сервера между различными vGPU (mediated-устройствами).

    Для включения/отключения ограничения следует перейти в окно свойств выбранного mediated-устройства.

    FRL сохраняется и после перезагрузки сервера.


3. Установка драйвера NVIDIA GRID на ВМ

Linux

  1. Перейти в раздел Процессоры ВМ.

  2. Рекомендуется установить Режим определения - host-passthrough.

    Для этого необходимо:

    • Выключить питание ВМ.

    • Нажать кнопку Изменение настроек процессоров.

    • В открывшемся окне нажать кнопку Режим определения и модель.

    • В открывшемся окне выбрать host-passthrough и нажать кнопку ОК.

  3. Установить пакеты в соответствии с установленной ОС:

    Debian-based ОС: linux-headers, gcc и make.

    RHEL-based ОС: kernel-lt-devel, kernel-lt-headers, gcc, make.

    Внимание

    Если текущие версии ядра и заголовков (headers) совпадают, необходимо пропустить установку linux-headers и kernel-lt-headers.

    • Debian-based ОС:

      sudo apt update
      
      sudo apt install linux-headers-$(uname -r) gcc make
      
    • RHEL-based ОС:

      dnf update
      
      dnf install kernel-lt-devel-$(uname -r) kernel-lt-headers-$(uname -r) gcc make
      
  4. Скачать драйверы с официального сайта NVIDIA.

    При отсутствии доступа к личному кабинету NVIDIA обратитесь в сервисный центр, к дистрибьютору или вендору.

  5. Установить драйверы графического адаптера командой:

    sudo sh /{path}/NVIDIA-Linux-x86_64-*-grid.run --no-x-check
    

    где:

    • {path} - путь до директории со скачанным файлом .run.

    • * - версия устанавливаемых драйверов.

    В процессе установки следует ответить на вопросы:

    • Install NVIDIA's 32-bit compatibility libraries? - No.

    • An incomplete installation of libglvnd was found... - Don't install.

    • Unable to determine the path to install the libglvnd EGL vendor library config files. - OK.

    • Would you like to run the nvidia-xconfig utility... - Yes.

    Ошибка получения изображения на РЕД ОС

    Если после установки драйверов на РЕД ОС система не получает изображение, необходимо переустановить драйверы, ответив на вопрос Would you like to run the nvidia-xconfig utility... - No.

  6. Дождаться завершения установки.

    Примечание

    При использовании более одного графического адаптера или наличии проблем с получением изображения после перезагрузки следует отредактировать файл /etc/X11/xorg.conf.

    Пример qxl + NVIDIA
    • Выполнить команду:

      lspci
      
    • Найти в списке необходимый графический адаптер.

    • Отредактировать файл /etc/X11/xorg.conf в секции Device, если PCI-адрес MDEV равен 00:000a:00.0:

      BusID          "PCI:0:10:0"
      

      00:0a:00.0 в шестнадцатеричном формате переводится в 0:10:0 в десятичном формате, где 0a = 10 в десятичной системе.

  7. Перезагрузить ВМ.


Windows

  1. Перейти в раздел Процессоры ВМ.

  2. Рекомендуется установить Режим определения - host-passthrough.

    Для этого необходимо:

    • Выключить питание ВМ.

    • Нажать кнопку Изменение настроек процессоров.

    • В открывшемся окне нажать кнопку Режим определения и модель.

    • В открывшемся окне выбрать host-passthrough и нажать кнопку ОК.

  3. Скачать драйверы с официального сайта NVIDIA.

    При отсутствии доступа к личному кабинету NVIDIA обратитесь в сервисный центр, к дистрибьютору или вендору.

  4. Установить драйверы графического адаптера.

  5. Выключить ВМ.

  6. Перейти в раздел Информация ВМ.

  7. В раскрывающемся списке Конфигурация ВМ активировать опцию Оптимизация для vgpu.


4. Установка сервера лицензий

FreeGRID

Для работы GRID с использованием лицензий NVIDIA необходимо:

  1. Получить и установить сервер лицензий NVIDIA.

  2. Получить и активировать лицензии NVIDIA.

При отсутствии необходимых компонентов активация функционала GRID доступна с помощью технологии FreeGRID.


Подробнее о FreeGRID.

Активация FreeGRID.

Подробное руководство установки сервера лицензий представлено на официальном сайте NVIDIA.


5. Активация лицензии

Общие замечания о лицензировании

Тип лицензии, получаемой ВМ, зависит от выделенной ей конфигурации vGPU.

Например, если сервер лицензий в состоянии отдать лицензию Quadro vDWS, а vGPU выделена лишь в конфигурации -xB, то лицензия будет получена на virtual PC.

Если на такой лицензии сервера конфигурацию vGPU клиента -xQ, то лицензия будет выдана на Quadro vDWS.

При этом в обоих случаях сервер будет сообщать о выданных лицензиях Quadro vDWS.


Linux

  1. Скопировать gridd.conf.template в файл gridd.conf:

    cp /etc/nvidia/gridd.conf.template /etc/nvidia/gridd.conf
    
  2. Открыть на редактирование файл gridd.conf:

    sudo nano /etc/nvidia/gridd.conf
    
  3. Указать адрес сервера лицензий в строку ServerAddress=.

  4. Указать порт сервера лицензий в строку ServerPort=.

    Порт сервера лицензий по умолчанию - 7070.

  5. Установить параметру FeatureType значение 1.

  6. Сохранить измененный файл gridd.conf и закрыть его.

  7. Перезапустить службу клиента лицензии на ВМ:

    sudo systemctl restart nvidia-gridd.service
    
Пример сконфигурированного файла gridd.conf
# /etc/nvidia/gridd.conf - Configuration file for NVIDIA Grid Daemon

# This is a template for the configuration file for NVIDIA Grid Daemon.
# For details on the file format, please refer to the nvidia-gridd(1)
# man page.
# Description: Set License Server Address
# Data type: string
# Format: "<address>"
ServerAddress=gridlicense.example.com
# Description: Set License Server port number
# Data type: integer
# Format: <port>, default is 7070
ServerPort=7070
# Description: Set Feature to be enabled
# Data type: integer
# Possible values:
# 1 => for GRID vGPU
# 2 => for GRID Virtual Workstation
FeatureType=1
# Description: Parameter to enable or disable Grid Licensing tab in nvidiasettings
# Data type: boolean
# Possible values: TRUE or FALSE, default is TRUE
#EnableUI=TRUE
# Description: Set license borrow period in minutes
# Data type: integer
# Possible values: 10 to 10080 mins(7 days), default is 10080
#Licenselnterval=10080

Лицензионные ограничения снимаются, если сервер доступен и имеет доступные лицензии.

Через графическое приложение NVIDIA имеется возможность управления лицензиями. Для этого необходимо повторить все действия с файлами конфигурации. В файле gridd.conf раскомментировать строку EnableUI=True, после чего перезапустить службу nvidia-gridd.service.


Windows

  1. Открыть ПО NVIDIA Control Panel.

  2. В разделе License выбрать Manage License.

  3. Указать адрес сервера лицензий в строку License Server.

  4. Указать порт сервера лицензий в строку Port Number.

    Порт сервера лицензий по умолчанию - 7070.

  5. Нажать кнопку Apply для применения изменений.

Лицензионные ограничения снимаются, если сервер доступен и имеет доступные лицензии.