Entrenamiento distribuido con la biblioteca de paralelismo de datos distribuidos de SageMaker AI - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Entrenamiento distribuido con la biblioteca de paralelismo de datos distribuidos de SageMaker AI

La biblioteca de paralelismo de datos distribuidos de SageMaker AI (SMDDP) está diseñada para facilitar su uso y proporcionar integración perfecta con PyTorch.

Al entrenar un modelo de aprendizaje profundo con la biblioteca de SMDDP en SageMaker AI puede centrarse en escribir un script de entrenamiento y el entrenamiento del modelo.

Para empezar, importe la biblioteca de SMDDP para utilizar sus operaciones colectivas optimizadas para AWS. En los temas siguientes se proporcionan instrucciones sobre qué añadir al script de entrenamiento en función de la operación colectiva que desee optimizar.