Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Errores comunes y solución de problemas
Los errores AWS Batch suelen producirse en el nivel de la aplicación o se deben a configuraciones de instancias que no cumplen los requisitos específicos de tu trabajo. Otros problemas incluyen que los trabajos se atasquen en un estado RUNNABLE
o que los entornos de computación se queden atascados en un estado INVALID
. Para obtener más información sobre la solución de problemas de los trabajos que se quedan atascados en el estado RUNNABLE
, consulte Trabajos bloqueados en estado RUNNABLE. Para obtener información sobre cómo solucionar problemas de entornos de computación en un estado INVALID
, consulte Entorno de computación INVALID.
-
Comprueba las cuotas de vCPU de Amazon EC2 Spot: comprueba que tus cuotas de servicio actuales cumplen los requisitos del trabajo. Por ejemplo, supongamos que su cuota de servicio actual es de 256 v CPUs y el trabajo requiere 10 000 vCPUs. Entonces, la cuota de servicio no cumple con el requisito del trabajo. Para obtener más información e instrucciones de solución de problemas, consulta las cuotas de EC2 servicio de Amazon y ¿Cómo aumento la cuota de servicio de mi Amazon EC2resources?
. -
Los trabajos fallan antes de que se ejecute la aplicación: algunos trabajos pueden fallar debido a un error
DockerTimeoutError
o a un errorCannotPullContainerError
. Para obtener información sobre la solución de problemas, consulte ¿Cómo se resuelve el error DockerTimeoutError «» en AWS Batch?. -
Direcciones IP insuficientes: la cantidad de direcciones IP de la VPC y las subredes puede limitar la cantidad de instancias que se pueden crear. Utilice los enrutamientos entre dominios sin clase (CIDRs) para proporcionar más direcciones IP de las necesarias para ejecutar sus cargas de trabajo. Si es necesario, también puede crear una VPC dedicada con un gran espacio de direcciones. Por ejemplo, puede crear una VPC con múltiples entradas
10.x.0.0/16
y una subred CIDRs en cada zona de disponibilidad con un CIDR de.10.x.y.0/17
En este ejemplo, x está entre 1 y 4 e y es 0 o 128. Esta configuración proporciona 36 000 direcciones IP en cada subred. -
Compruebe que las instancias estén registradas en Amazon EC2: si ve sus instancias en la EC2 consola de Amazon, pero no ve ninguna instancia contenedora de Amazon Elastic Container Service en su clúster de Amazon ECS, es posible que el agente de Amazon ECS no esté instalado en una Amazon Machine Image (AMI). Es posible que el Amazon ECS Agent, EC2 los datos de Amazon de su AMI o la plantilla de lanzamiento tampoco estén configurados correctamente. Para aislar la causa raíz, crea una EC2 instancia de Amazon independiente o conéctate a una instancia existente mediante SSH. Para obtener más información, consulte Configuración del agente contenedor de Amazon ECS, Ubicaciones de los archivos de registro de Amazon ECS y Recurso informático AMIs.
-
Revise el AWS panel: revise el AWS panel para comprobar el estado del trabajo esperado y que el entorno informático se escala según lo esperado. También puede revisar los registros de trabajos CloudWatch.
-
Compruebe que la instancia esté creada: si se crea una instancia, significa que su entorno de computación se ha escalado según lo previsto. Si tus instancias no se han creado, busca las subredes asociadas en tu entorno de cómputo para cambiarlas. Para obtener más información, consulte Verificar una actividad de escalado para un grupo de escalado automático.
También le recomendamos que verifique que sus instancias pueden cumplir con los requisitos de trabajo relacionados. Por ejemplo, un trabajo puede requerir 1 TiB de memoria, pero el entorno de computación usa un tipo de instancia C5 que está limitado a 192 GB de memoria.
-
Verifique que sus instancias estén siendo solicitadas por AWS Batch: consulte el historial del grupo de Auto Scaling para verificar que sus instancias estén siendo solicitadas por AWS Batch. Esto indica cómo Amazon EC2 intenta adquirir instancias. Si recibes un error que indica que Amazon EC2 Spot no puede adquirir una instancia en una zona de disponibilidad específica, puede deberse a que la zona de disponibilidad no ofrece una familia de instancias específica.
-
Compruebe que las instancias se registren en Amazon ECS: si ve instancias en la EC2 consola de Amazon, pero no hay instancias de contenedor de Amazon ECS en su clúster de Amazon ECS, es posible que el agente de Amazon ECS no esté instalado en la Amazon Machine Image (AMI). Además, es posible que el Amazon ECS Agent, EC2 los datos de Amazon de su AMI o la plantilla de lanzamiento no estén configurados correctamente. Para aislar la causa raíz, crea una EC2 instancia de Amazon independiente o conéctate a una instancia existente mediante SSH. Para obtener más información, consulte el archivo de configuración del CloudWatch agente: sección Logs, Ubicaciones de los archivos de registro de Amazon ECS yRecurso informático AMIs.
-
Abra un ticket de soporte: si aún tiene problemas después de solucionar algunos problemas y tiene un plan de soporte, abra un ticket de soporte. En el ticket de soporte, asegúrese de incluir información sobre el problema, las especificaciones de la carga de trabajo, la configuración y los resultados de las pruebas. Para obtener más información, consulte Comparar Soporte planes
. -
Consulte los foros AWS Batch y HPC: para obtener más información, consulte los foros AWS Batch
y HPC . -
Revise el panel AWS Batch de supervisión del tiempo de ejecución: este panel utiliza una arquitectura sin servidor para capturar eventos de Amazon ECS y Amazon EC2 para proporcionar información sobre los trabajos y las instancias. AWS Batch Para obtener más información, consulte Solución de paneles de monitoreo de tiempo de ejecución de AWS Batch
.