TensorBoard en Amazon SageMaker AI - Amazon SageMaker AI

TensorBoard en Amazon SageMaker AI

Amazon SageMaker AI con TensorBoard es una capacidad de Amazon SageMaker AI que incorpora las herramientas de visualización de TensorBoard a SageMaker AI y se integra con el entrenamiento de SageMaker AI y el dominio. Ofrece opciones para administrar la cuenta de AWS y los usuarios que pertenecen a la cuenta a través del dominio de SageMaker AI, para dar a los usuarios del dominio acceso a los datos de TensorBoard con los permisos adecuados a Amazon S3, así como para ayudar a los usuarios del dominio a realizar tareas de depuración de modelos mediante los complementos de visualización de TensorBoard. SageMaker AI con TensorBoard se amplía con el complemento SageMaker AI Data Manager, con el que los usuarios del dominio pueden acceder a varios trabajos de entrenamiento en un solo lugar dentro de la aplicación TensorBoard.

nota

Esta característica sirve para depurar el entrenamiento de modelos de aprendizaje profundo mediante PyTorch o TensorFlow.

Para científicos de datos

El entrenamiento de modelos grandes puede plantear problemas científicos que requieran que los científicos de datos deban depurarlos y resolverlos para mejorar la convergencia de los modelos y estabilizar los procesos de descenso de gradientes.

Cuando tenga problemas con el entrenamiento de los modelos, como que las pérdidas no converjan, o el desvanecimiento o explosión de los pesos y gradientes, necesitará acceder a los datos de los tensores para profundizar y analizar los parámetros de modelo, escalares y cualquier métrica personalizada. Al usar SageMaker AI con TensorBoard, puede visualizar los tensores de salida de modelo extraídos de los trabajos de entrenamiento. A medida que experimente con diferentes modelos, varias ejecuciones de entrenamiento e hiperparámetros de modelo, puede seleccionar varios trabajos de entrenamiento en TensorBoard y compararlos en un solo lugar.

Para administradores

A través de la página de inicio de TensorBoard en la consola de SageMaker AI o el dominio de SageMaker AI, puede administrar los usuarios de la aplicación TensorBoard si es administrador de una cuenta de AWS o el dominio de SageMaker AI. Cada usuario de dominio puede acceder a su propia aplicación TensorBoard con los permisos concedidos. Como administrador y usuario de dominio de SageMaker AI, puede crear y eliminar la aplicación TensorBoard según el nivel de permisos que tenga.

nota

No puede compartir la aplicación TensorBoard para colaboración porque el dominio de SageMaker AI no permite el uso compartido de aplicaciones entre usuarios. Los usuarios pueden compartir los tensores de salida guardados en un bucket de S3 si tienen acceso al bucket.

Marcos y Regiones de AWS compatibles

La aplicación TensorBoard de SageMaker AI está disponible para los siguientes marcos de machine learning y Regiones de AWS.

Marcos
  • PyTorch

  • TensorFlow

  • Hugging Face Transformers

Regiones de AWS
  • Este de EE. UU. (Norte de Virginia) (us-east-1)

  • Este de EE. UU. (Ohio) (us-east-2)

  • Oeste de EE. UU. (Oregón) (us-west-2)

  • Europa (Fráncfort) (eu-central-1)

  • Europa (Irlanda) (eu-west-1)

nota

Amazon SageMaker AI con TensorBoard se ejecuta en una instancia de ml.r5.large y se generan cargos una vez finalizado el nivel gratuito de SageMaker AI o el periodo de prueba gratuito de la característica. Para obtener más información, consulte Precios de Amazon SageMaker AI.