SageMaker HyperPod Guía de inicio rápido de Amazon - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker HyperPod Guía de inicio rápido de Amazon

Esta guía de inicio rápido le guiará a través de la creación de su primer HyperPod clúster con las orquestaciones de Slurm y Amazon EKS (EKS). Para empezar, elija la organización que mejor se adapte a sus necesidades de infraestructura. SageMaker HyperPod

Cree un clúster orquestado por SLURM SageMaker HyperPod

Siga estos pasos para crear su primer SageMaker HyperPod clúster con la orquestación de Slurm.

  1. Abre la consola Amazon SageMaker AI en https://console.aws.amazon.com/sagemaker/.

  2. Seleccione HyperPod Clusters en el panel de navegación izquierdo y, a continuación, Cluster Management.

  3. En la página SageMaker HyperPod Clústeres, elija Crear HyperPod clúster.

  4. En el menú desplegable Crear HyperPod clúster, selecciona Orchestrated by Slurm.

  5. En la página de creación de clústeres, seleccione Configuración rápida. Con esta opción, puede empezar inmediatamente con la configuración predeterminada. SageMaker La IA creará nuevos recursos, como VPC, subredes, grupos de seguridad, un bucket de Amazon S3, una función de IAM y Lustre, FSx durante el proceso de creación del clúster.

  6. En Configuración general, especifique un nombre para el nuevo clúster. Después de crear el clúster no puede cambiarle el nombre.

  7. En Grupos de instancias, elija Agregar grupo. Cada grupo de instancias se puede configurar de una forma diferente y se puede crear un clúster heterogéneo que conste de varios grupos de instancias con diversos tipos de instancias. Para implementar un clúster, debe agregar al menos un grupo de instancias. Puede añadir un grupo de instancias cada vez. Si desea crear varios grupos de instancias, repita el proceso para cada uno de ellos.

    Siga estos pasos para agregar un grupo de instancias.

    1. En Tipo del grupo de instancias, elija un tipo de instancia para su grupo de instancias. Para esta guía de inicio rápido, seleccione Controlador (principal) para my-controller-group, Inicio de sesión para my-login-group y Computación (de trabajo) para worker-group-1.

    2. En Nombre, especifique un nombre para el grupo de instancias. Para esta guía de inicio rápido, cree tres grupos de instancias llamados my-controller-group, my-login-group y worker-group-1.

    3. En Capacidad de instancia, elija la capacidad bajo demanda o un plan de entrenamiento para reservar recursos de computación.

    4. En Tipo de instancia, elija la instancia del grupo de instancias. Para esta guía de inicio rápido, seleccione ml.c5.xlarge para my-controller-group, ml.m5.4xlarge para my-login-group y ml.trn1.32xlarge para worker-group-1.

      Asegúrese de elegir el tipo de instancia con cuotas suficientes en su cuenta o solicite cuotas adicionales siguiendo las instrucciones de SageMaker HyperPod cuotas.

    5. En Cantidad de instancias, especifique un número entero que no supere la cuota de instancias de uso del clúster. Para este inicio rápido, introduzca 1 para los tres grupos.

    6. En Zona de disponibilidad de destino, elija la zona de disponibilidad en la que se aprovisionarán las instancias. La zona de disponibilidad debe corresponder a la ubicación de la capacidad de computación acelerada.

    7. En Volumen de almacenamiento adicional por instancia (GB) - opcional, especifique un número entero entre 1 y 16 384 para establecer el tamaño de un volumen adicional de Elastic Block Store (EBS) en gigabytes (GB). El volumen de EBS está asociado a cada instancia del grupo de instancias. La ruta de montaje predeterminada para el volumen de EBS adicional es /opt/sagemaker. Una vez que el clúster se haya creado correctamente, puede utilizar SSH en las instancias del clúster (nodos) y verificar si el volumen de EBS está montado correctamente ejecutando el comando df -h. La conexión de un volumen de EBS adicional proporciona un almacenamiento estable, fuera de la instancia y persistente de forma independiente, tal y como se describe en la sección Amazon EBS volumes de la Guía del usuario de Amazon Elastic Block Store.

    8. Elija Agregar grupo de instancias.

  8. En Configuración rápida predeterminada, revise los ajustes predeterminados. En esta sección se enumeran todos los ajustes predeterminados para la creación del clúster, incluidos todos los AWS recursos nuevos que se crearán durante el proceso de creación del clúster.

  9. Seleccione Enviar.

Para obtener más información, consulte Cómo empezar a SageMaker HyperPod usar la consola de SageMaker IA.

Cree un clúster orquestado por EKS SageMaker HyperPod

Siga estos pasos para crear su primer SageMaker HyperPod clúster con la orquestación de Amazon EKS.

  1. Abre la consola Amazon SageMaker AI en https://console.aws.amazon.com/sagemaker/.

  2. Seleccione HyperPod Clusters en el panel de navegación izquierdo y, a continuación, Cluster Management.

  3. En la página SageMaker HyperPod Clústeres, elija Crear HyperPod clúster.

  4. En el menú desplegable Crear HyperPod clúster, elija Orchestrated by Amazon EKS.

  5. En la página de creación de clústeres, seleccione Configuración rápida. Con esta opción, puede empezar inmediatamente con la configuración predeterminada. SageMaker La IA creará nuevos recursos, como VPC, subredes, grupos de seguridad, un bucket de Amazon S3, una función de IAM y Lustre, FSx durante el proceso de creación del clúster.

  6. En Configuración general, especifique un nombre para el nuevo clúster. Después de crear el clúster no puede cambiarle el nombre.

  7. En Grupos de instancias, elija Agregar grupo. Cada grupo de instancias se puede configurar de una forma diferente y se puede crear un clúster heterogéneo que conste de varios grupos de instancias con diversos tipos de instancias. Para implementar un clúster, debe agregar al menos un grupo de instancias. Puede añadir un grupo de instancias cada vez. Si desea crear varios grupos de instancias, repita el proceso para cada uno de ellos.

    Siga estos pasos para agregar un grupo de instancias.

    1. Para Tipo del grupo de instancias, seleccione Estándar o Grupo de instancias restringido (RIG). En general, se selecciona Estándar pues proporciona un entorno computacional de uso general sin restricciones de seguridad adicionales. Grupo de instancias restringido (RIG) es un entorno especializado para la personalización de modelos fundacionales, como Amazon Nova. Para obtener más información sobre la configuración de RIG para la personalización de modelos de Amazon Nova, consulte Personalización de Amazon Nova en Amazon SageMaker HyperPod.

    2. En Nombre, especifique un nombre para el grupo de instancias.

    3. En Capacidad de instancia, elija la capacidad bajo demanda o un plan de entrenamiento para reservar recursos de computación.

    4. En Tipo de instancia, elija la instancia del grupo de instancias. Asegúrese de elegir el tipo de instancia con cuotas suficientes en su cuenta o solicite cuotas adicionales accediendo a SageMaker HyperPod cuotas.

    5. En Cantidad de instancias, especifique un número entero que no supere la cuota de instancias de uso del clúster. Para este inicio rápido, introduzca 1 para los tres grupos.

    6. En Zona de disponibilidad de destino, elija la zona de disponibilidad en la que se aprovisionarán las instancias. La zona de disponibilidad debe corresponder a la ubicación de la capacidad de computación acelerada.

    7. En Volumen de almacenamiento adicional por instancia (GB) - opcional, especifique un número entero entre 1 y 16 384 para establecer el tamaño de un volumen adicional de Elastic Block Store (EBS) en gigabytes (GB). El volumen de EBS está asociado a cada instancia del grupo de instancias. La ruta de montaje predeterminada para el volumen de EBS adicional es /opt/sagemaker. Una vez que el clúster se haya creado correctamente, puede utilizar SSH en las instancias del clúster (nodos) y verificar si el volumen de EBS está montado correctamente ejecutando el comando df -h. La conexión de un volumen de EBS adicional proporciona un almacenamiento estable, fuera de la instancia y persistente de forma independiente, tal y como se describe en la sección Amazon EBS volumes de la Guía del usuario de Amazon Elastic Block Store.

    8. En Comprobaciones exhaustivas del estado de las instancias, elija la opción deseada. Las comprobaciones exhaustivas de estado supervisan el estado de las instancias durante la creación y después de las actualizaciones de software, y recuperan automáticamente las instancias con error mediante reinicios o sustituciones cuando están habilitadas.

    9. Elija Agregar grupo de instancias.

  8. En Configuración rápida predeterminada, revise los ajustes predeterminados. En esta sección se enumeran todos los ajustes predeterminados para la creación del clúster, incluidos todos los AWS recursos nuevos que se crearán durante el proceso de creación del clúster.

  9. Seleccione Enviar.

Para obtener más información, consulte Creación de un SageMaker HyperPod clúster con la orquestación de Amazon EKS.

Envío de cargas de trabajo

Siga estos tutoriales del taller para enviar ejemplos de cargas de trabajo.