P6 supportato DLAMIs - AWS Deep Learning AMIs

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

P6 supportato DLAMIs

Di seguito sono riportati i requisiti dettagliati per l'esecuzione di DLAMI su istanze Amazon EC2 P6-B200 e istanze Amazon P6e-00 EC2 GB2

P6-B200 supportato DLAMIs

Le seguenti istanze P6-B200 DLAMIs supportano:

Questi DLAMI contengono il seguente software necessario per il funzionamento delle istanze P6-B200:

Software

Requisito minimo di versione

Toolkit Nvidia CUDA

12.8

Driver Nvidia

R570

NVLINK 5

R570

Kernel Linux

6.1

Elastic Fabric Adapter (EFA)

1.41.0

AWS Plugin OFI NCCL

1.15.0

P6e-00 supportato GB2 DLAMIs

Le seguenti istanze supportano le istanze P6e- 00: DLAMIs GB2

Questi DLAMI contengono il seguente software necessario per il funzionamento delle istanze P6e-00: GB2

Software

Requisito minimo di versione

Toolkit Nvidia CUDA

12.8

Driver Nvidia

R570

Kernel Linux

6.12

Elastic Fabric Adapter (EFA)

1.42.0

AWS Plugin OFI NCCL

1.15.0

Conferma la funzionalità della GPU

Per confermare la funzionalità GPUs:

  1. Esegui il seguente Nvidia GPU Device Query Test

    $ /usr/local/cuda/extras/demo_suite/deviceQuery
  2. Conferma il seguente risultato del Device Query Run:

    $ /usr/local/cuda/extras/demo_suite/deviceQuery /usr/local/cuda/extras/demo_suite/deviceQuery Starting... CUDA Device Query (Runtime API) Detected 8 CUDA Capable device(s) ... deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.8, CUDA Runtime Version = 12.8, NumDevs = 8, Device0 = NVIDIA B200, Device1 = NVIDIA B200, Device2 = NVIDIA B200, Device3 = NVIDIA B200, Device4 = NVIDIA B200, Device5 = NVIDIA B200, Device6 = NVIDIA B200, Device7 = NVIDIA B200 Result = PASS

Per confermare il funzionamento del driver NVIDIA:

  1. Esegui l'interfaccia di gestione del sistema Nvidia

    $ nvidia-smi
  2. Conferma il seguente output dall'interfaccia di gestione del sistema

    +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.133.20 Driver Version: 570.133.20 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA B200 Off | 00000000:51:00.0 Off | 0 | | N/A 32C P0 145W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 1 NVIDIA B200 Off | 00000000:52:00.0 Off | 0 | | N/A 30C P0 140W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 2 NVIDIA B200 Off | 00000000:62:00.0 Off | 0 | | N/A 31C P0 139W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 3 NVIDIA B200 Off | 00000000:63:00.0 Off | 0 | | N/A 29C P0 139W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 4 NVIDIA B200 Off | 00000000:75:00.0 Off | 0 | | N/A 31C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 5 NVIDIA B200 Off | 00000000:76:00.0 Off | 0 | | N/A 31C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 6 NVIDIA B200 Off | 00000000:86:00.0 Off | 0 | | N/A 32C P0 141W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ | 7 NVIDIA B200 Off | 00000000:87:00.0 Off | 0 | | N/A 30C P0 138W / 1000W | 0MiB / 183359MiB | 0% Default | | | | Disabled | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+

Se riscontri problemi con le istanze P6-B200, contatta l'assistenza. AWS