Monitorización - AWS Deep Learning AMIs

Monitorización

La DLAMI viene preinstalada con varias herramientas de supervisión de GPU. Esta guía también menciona las herramientas que están disponibles para su descarga e instalación.

  • Monitorización de GPU con CloudWatch: una utilidad preinstalada que notifica las estadísticas de uso de GPU a Amazon CloudWatch.

  • CLI de nvidia-smi: una utilidad para monitorizar el uso general de memoria y computación de GPU. Esta utilidad viene preinstalada en la AWS Deep Learning AMIs (DLAMI).

  • Biblioteca de C de NVML: una API basada en C para obtener acceso directo a las funciones de administración y monitorización de GPU. Esta API la utiliza internamente la CLI de nvidia-smi y viene preinstalada en la DLAMI. También tiene enlaces a Python y Perl para facilitar el desarrollo en dichos lenguajes. La utilidad gpumon.py preinstalada en la DLAMI utiliza el paquete pynvml de nvidia-ml-py.

  • NVIDIA DCGM: una herramienta de administración de clústeres. Visite la página del desarrollador para obtener información sobre cómo instalar y configurar esta herramienta.

sugerencia

Consulte el blog de desarrolladores de NVIDIA para obtener la información más reciente sobre el uso de las herramientas de CUDA instaladas en la DLAMI: