Definiciones de tareas de Amazon ECS para instancias de aprendizaje profundo - Amazon Elastic Container Service

Definiciones de tareas de Amazon ECS para instancias de aprendizaje profundo

Para utilizar cargas de trabajo de aprendizaje profundo en Amazon ECS, registre las instancias DL1 de Amazon EC2 en los clústeres. Las instancias DL1 de Amazon EC2 funcionan con aceleradores Gaudi de Habana Labs (una empresa de Intel). Utilice el SDK de Habana SynapseAI para conectarse a los aceleradores Gaudi de Habana. El SDK admite los marcos de machine learning populares TensorFlow y PyTorch.

Consideraciones

Antes de comenzar a implementar instancias DL1 en Amazon ECS, tenga en cuenta lo siguiente:

  • Los clústeres pueden contener instancias DL1 y no DL1 combinadas.

  • Cuando crea un servicio o ejecuta una tarea independiente, puede utilizar los atributos de tipo de instancias concretamente al configurar las restricciones de ubicación de tareas para asegurarse de que la tarea se lance en la instancia de contenedor que especifique. Al hacerlo, se asegura de que los recursos se utilizan de manera eficaz y de que las tareas de las cargas de trabajo de aprendizaje profundo se encuentran en las instancias DL1. Para obtener más información, consulte Cómo coloca Amazon ECS las tareas en las instancias de contenedor.

    En el ejemplo siguiente, se ejecuta una tarea en una instancia dl1.24xlarge del clúster default.

    aws ecs run-task \ --cluster default \ --task-definition ecs-dl1-task-def \ --placement-constraints type=memberOf,expression="attribute:ecs.instance-type == dl1.24xlarge"

Uso de una AMI DL1

Tiene tres opciones para ejecutar una AMI en instancias DL1 de Amazon EC2 para Amazon ECS:

  • AMI de AWS Marketplace proporcionadas por Habana aquí.

  • AMI de aprendizaje profundo de Habana proporcionadas por Amazon Web Services. Como no está incluido, debe instalar el agente de contenedor de Amazon ECS por separado.

  • Utilice Packer para crear una AMI personalizada proporcionada por el repositorio de GitHub. Para obtener más información, consulte la documentación de Packer.