Trabajos de servicio en AWS Batch
Los trabajos de servicio de AWS Batch permiten enviar solicitudes a los servicios de AWS mediante las colas de trabajos de AWS Batch. Actualmente, AWS Batch admite los trabajos de entrenamiento de SageMaker como trabajos de servicio. A diferencia de los trabajos en contenedores donde AWS Batch administra la ejecución del contenedor subyacente, los trabajos de servicio le permiten a AWS Batch proporcionar capacidades de programación de trabajos y creación de colas, mientras que el servicio de destino de AWS (como SageMaker AI) se encarga de la ejecución del trabajo.
AWS Batch para los trabajos de entrenamiento de SageMaker le permite a los científicos de datos enviar los trabajos de entrenamiento con prioridades a colas configurables, lo que garantiza que las cargas de trabajo se ejecuten sin intervención en cuanto los recursos estén disponibles. Esta capacidad aborda desafíos comunes, como la coordinación de los recursos, la prevención de gastos excesivos accidentales, el cumplimiento de las restricciones presupuestarias, la optimización de los costos con instancias reservadas y la eliminación de la necesidad de coordinación manual entre los miembros del equipo.
Los trabajos de servicio se diferencian de los trabajos contenerizados en varios aspectos clave:
-
Envío de trabajos: los trabajos de servicio deben enviarse mediante la API SubmitServiceJob. Los trabajos de servicio no se pueden enviar a través de la consola de AWS Batch.
-
Ejecución de trabajos: AWS Batch programa y pone en cola los trabajos de servicio, pero el servicio de destino de AWS ejecuta la carga de trabajo real.
-
Identificadores de recursos: los trabajos de servicio utilizan ARN que contienen “service-job” en lugar de “job” (trabajo) para distinguirlos de los trabajos en contenedores.
Para obtener una introducción a los trabajos de servicio de AWS Batch para el entrenamiento de SageMaker, consulte Introducción a AWS Batch en SageMaker AI.