Monitorización
La DLAMI viene preinstalada con varias herramientas de supervisión de GPU. Esta guía también menciona las herramientas que están disponibles para su descarga e instalación.
-
Monitorización de GPU con CloudWatch: una utilidad preinstalada que notifica las estadísticas de uso de GPU a Amazon CloudWatch.
-
CLI de nvidia-smi
: una utilidad para monitorizar el uso general de memoria y computación de GPU. Esta utilidad viene preinstalada en la AWS Deep Learning AMIs (DLAMI). -
Biblioteca de C de NVML
: una API basada en C para obtener acceso directo a las funciones de administración y monitorización de GPU. Esta API la utiliza internamente la CLI de nvidia-smi y viene preinstalada en la DLAMI. También tiene enlaces a Python y Perl para facilitar el desarrollo en dichos lenguajes. La utilidad gpumon.py preinstalada en la DLAMI utiliza el paquete pynvml de nvidia-ml-py . -
NVIDIA DCGM
: una herramienta de administración de clústeres. Visite la página del desarrollador para obtener información sobre cómo instalar y configurar esta herramienta.
sugerencia
Consulte el blog de desarrolladores de NVIDIA para obtener la información más reciente sobre el uso de las herramientas de CUDA instaladas en la DLAMI: