Requisitos de software para instancias P6 - AWS Deep Learning AMIs

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos de software para instancias P6

A continuación, se detallan los requisitos para ejecutar DLAMI en instancias P6.

Requisitos de la P6-B200

Se requiere el siguiente software para operar las instancias P6-B200:

Software

Versión mínima requerida

Kit de herramientas de CUDA de NVIDIA

12.8

Controlador de NVIDIA

R570

NVLINK 5

R570

Núcleo de Linux

6.1

Elastic Fabric Adapter (EFA)

1.41.0

AWS Complemento OFI NCCL

1.15.0

Requisitos del P6e- 00 GB2

Se requiere el siguiente software para operar las instancias P6e-00: GB2

Software

Versión mínima requerida

Kit de herramientas de CUDA de NVIDIA

12.8

Controlador de NVIDIA

R570

Núcleo de Linux

6.12

Elastic Fabric Adapter (EFA)

1.42.0

AWS Complemento OFI NCCL

1.15.0

Requisitos del P6-B300

Se requiere el siguiente software para operar las instancias P6-B300:

Software

Versión mínima requerida

Kit de herramientas de CUDA de NVIDIA

13.0

Controlador de NVIDIA

R580

NVLINK 5

R580

Núcleo de Linux

6.1

Elastic Fabric Adapter (EFA)

1.44.0

AWS Complemento OFI NCCL

1.17.1

Cómo confirmar la funcionalidad de la GPU

Para confirmar su funcionamiento: GPUs

  1. Ejecute la siguiente prueba de consulta del dispositivo GPU de Nvidia.

    $ /usr/local/cuda/extras/demo_suite/deviceQuery
  2. Confirme el resultado de la prueba de consulta del dispositivo. El siguiente es un ejemplo de salida para la P6-b200.

    /usr/local/cuda/extras/demo_suite/deviceQuery Starting... CUDA Device Query (Runtime API) Detected 8 CUDA Capable device(s) ... deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.8, CUDA Runtime Version = 12.8, NumDevs = 8, Device0 = NVIDIA B200, Device1 = NVIDIA B200, Device2 = NVIDIA B200, Device3 = NVIDIA B200, Device4 = NVIDIA B200, Device5 = NVIDIA B200, Device6 = NVIDIA B200, Device7 = NVIDIA B200 Result = PASS

Para confirmar que el controlador NVIDIA funciona correctamente:

  1. Ejecute la interfaz de administración del sistema Nvidia.

    $ nvidia-smi
  2. Confirme el resultado de la interfaz de administración del sistema. El siguiente es un ejemplo de salida para el P6-b200.

    +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.133.20 Driver Version: 570.133.20 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA B200 Off | 00000000:51:00.0 Off | 0 | | N/A 32C P0 145W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 1 NVIDIA B200 Off | 00000000:52:00.0 Off | 0 | | N/A 30C P0 140W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 2 NVIDIA B200 Off | 00000000:62:00.0 Off | 0 | | N/A 31C P0 139W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 3 NVIDIA B200 Off | 00000000:63:00.0 Off | 0 | | N/A 29C P0 139W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 4 NVIDIA B200 Off | 00000000:75:00.0 Off | 0 | | N/A 31C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 5 NVIDIA B200 Off | 00000000:76:00.0 Off | 0 | | N/A 31C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 6 NVIDIA B200 Off | 00000000:86:00.0 Off | 0 | | N/A 32C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 7 NVIDIA B200 Off | 00000000:87:00.0 Off | 0 | | N/A 30C P0 138W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
nota

Si tiene algún problema, póngase en contacto con AWS Support.