Annexe - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Annexe

Surveillez les résultats de l'entraînement grâce à HyperPod des recettes

SageMaker HyperPod les recettes proposent l'intégration de Tensorboard pour analyser le comportement d'entraînement. Ces recettes intègrent VizTracer également un outil peu onéreux permettant de suivre et de visualiser l'exécution du code Python. Pour plus d'informations, consultez VizTracer.

Les journaux du tensorboard sont générés et stockés dans le. log_dir Pour accéder à ces journaux et les analyser localement, procédez comme suit :

  1. Téléchargez le dossier de l’expérience Tensorboard depuis votre environnement d’entraînement sur votre ordinateur local.

  2. Ouvrez un terminal ou une invite de commandes sur votre ordinateur local.

  3. Accédez au répertoire contenant le dossier de l’expérience téléchargé.

  4. Lancez Tensorboard en exécutant la commande :

    tensorboard --port=<port> --bind_all --logdir experiment.
  5. Ouvrez votre navigateur Web et rendez-vous surhttp://localhost:8008.

Vous pouvez désormais voir le statut et les visualisations de vos tâches d’entraînement dans l’interface Tensorboard. L’affichage du statut et des visualisations vous permet de surveiller et d’analyser le processus d’entraînement. La surveillance et l’analyse du processus d’entraînement vous aident à mieux comprendre le comportement et les performances de vos modèles. Pour plus d'informations sur la façon dont vous surveillez et analysez l'entraînement avec Tensorboard, consultez le guide de l'utilisateur du NVIDIA NeMo Framework.

VizTracer

Pour l'activer VizTracer, vous pouvez modifier votre recette en définissant la variable ENABLE_VIZTRACER d'environnement sur1. Une fois la formation terminée, votre VizTracer profil se trouve dans le dossier d'expérienceslog_dir/viztracer_xxx.json. Pour analyser votre profil, vous pouvez le télécharger et l'ouvrir à l'aide de l'vizvieweroutil :

vizviewer --port <port> viztracer_xxx.json

Cette commande lance vizviewer sur le port 9001. Vous pouvez consulter le vôtre VizTracer en vous rendant sur http://localhost : <port>dans votre navigateur. Après avoir ouvert VizTracer, vous commencez à analyser l'entraînement. Pour plus d'informations sur l'utilisation VizTracer, consultez VizTracer la documentation.