Responsabilidad compartida de los nodos Kubernetes - AWS Batch

Responsabilidad compartida de los nodos Kubernetes

El mantenimiento de los entornos de computación es una responsabilidad compartida.

  • No cambie ni elimine nodos, etiquetas, manchas, espacios de nombres, plantillas de lanzamiento ni grupos de escalado automático de AWS Batch. No añada información contaminada a los nodos gestionados de AWS Batch. Si realiza alguno de estos cambios, su entorno de computación no será compatible y se producirán errores, incluidas las instancias inactivas.

  • No dirija sus pods a nodos administrados de AWS Batch. Si dirige sus pods a los nodos gestionados, se producirán problemas de escalado y las colas de trabajos se atascarán. Ejecuta cargas de trabajo que no usen AWS Batch en nodos autogestionados o grupos de nodos gestionados. Para obtener más información, consulte Grupos de nodos administrados en la Guía del usuario de Amazon EKS.

  • Puede seleccionar un DaemonSet para que se ejecute en nodos gestionados de AWS Batch. Para obtener más información, consulte Ejecución de un DaemonSet en nodos administrados de AWS Batch.

AWS Batch no actualiza automáticamente las AMI del entorno de computación. Es su responsabilidad actualizarlas. Para actualizar las AMI a la versión más reciente, ejecute el siguiente comando.

$ aws batch update-compute-environment \ --compute-environment <compute-environment-name> \ --compute-resources 'updateToLatestImageVersion=true'

AWS Batch no actualiza automáticamente la versión de Kubernetes. Ejecute el siguiente comando para actualizar la versión Kubernetes de su entorno de computación a la 1.32.

$ aws batch update-compute-environment \ --compute-environment <compute-environment-name> \ --compute-resources \ 'ec2Configuration=[{imageType=EKS_AL2,imageKubernetesVersion=1.32}]'

Al actualizar a una AMI o a una Kubernetes versión más reciente, puede especificar si desea finalizar los trabajos cuando se actualicen (terminateJobsOnUpdate) y cuánto tiempo esperar antes de reemplazar una instancia si los trabajos en ejecución no terminan (jobExecutionTimeoutMinutes.) Para obtener más información, consulte Actualización de un entorno de computación en AWS Batch y la política de actualización de la infraestructura (UpdatePolicy) establecida en la operación UpdateComputeEnvironment de la API.