Résolution des problèmes liés aux instances gérées Amazon ECS - Amazon Elastic Container Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution des problèmes liés aux instances gérées Amazon ECS

Lors du lancement de tâches avec des instances gérées Amazon ECS, Amazon ECS tente d’abord de placer les tâches sur la capacité existante et demande une capacité supplémentaire pour les tâches qui ne peuvent pas être placées. Si le provisionnement de l'instance échoue, l'ID de EC2 demande Amazon est inclus dans le message d'échec de la tâche. Vous pouvez utiliser cet ID de demande pour consulter les détails de la demande ayant échoué afin CloudTrail de poursuivre le dépannage.

Note

Si vous choisissez d'appliquer des autorisations de moindre privilège et de spécifier vos propres autorisations pour le profil d'instance au lieu d'utiliser la politique AmazonECSInstanceRolePolicyForManagedInstances gérée, vous pouvez ajouter les autorisations suivantes pour aider à résoudre les problèmes liés aux tâches avec les instances gérées Amazon ECS :

  • ecs:StartTelemetrySession

  • ecs:PutSystemLogEvents

Définition des tâches incompatible avec les instances gérées Amazon ECS

Cause courante

Cette erreur se produit lorsque votre définition de tâche contient des paramètres ou des configurations qui ne sont pas pris en charge par les instances gérées Amazon ECS. Les incompatibilités courantes incluent des modes réseau, des rôles de tâches ou des besoins en ressources non pris en charge.

Résolution

  1. Vérifiez que votre définition de tâche utilise requiresCompatibilities défini sur MANAGED_INSTANCES.

  2. Assurez-vous que votre définition de tâche utilise le mode réseau awsvpc.

  3. Vérifiez que les valeurs d’UC et de mémoire se situent dans les plages prises en charge pour les instances gérées Amazon ECS.

  4. Consultez le message d’erreur détaillé pour obtenir des informations spécifiques sur les incompatibilités.

Fournisseur de capacité non associé au cluster

Cause courante

Cette erreur se produit lorsque le fournisseur de capacité spécifié dans votre stratégie de fournisseur de capacité n’est pas associé au cluster ou n’existe pas.

Résolution

  1. Vérifiez que le fournisseur de capacité existe dans votre compte et dans votre région.

  2. Associez le fournisseur de capacité à votre cluster à l’aide de la console ou de la CLI Amazon ECS.

  3. Assurez-vous que le statut du fournisseur de capacité est ACTIVE avant de l’utiliser.

Erreurs d’autorisation liées aux rôles d’infrastructure

Cause courante

Cette erreur se produit lorsque le rôle d'infrastructure Amazon ECS ne dispose pas des autorisations nécessaires pour effectuer EC2 des opérations Amazon en votre nom, ou lorsque le rôle ne peut pas être assumé en raison de problèmes de relation de confiance.

Résolution

  1. Vérifiez que votre rôle d’infrastructure entretient une relation de confiance appropriée avec Amazon ECS.

  2. Assurez-vous que le rôle dispose des EC2 autorisations Amazon requisesec2:RunInstances, notammentec2:DescribeInstances, etiam:PassRole.

  3. Consultez le message d'échec d'autorisation codé CloudTrail pour obtenir des informations d'autorisation spécifiques.

  4. Mettez à jour la politique de rôle pour inclure les autorisations manquantes identifiées dans le message d’erreur.

VcpuLimitExceeded erreur

Cause courante

Cette erreur se produit lorsque vous avez atteint votre quota de service vCPU pour la famille de types d’instances dans la région actuelle. Les instances gérées Amazon ECS ne peuvent pas lancer d’instances supplémentaires tant que la capacité n’est pas disponible.

Résolution

  1. Demandez une augmentation du quota de service pour la famille de types d'instances concernée par le biais du AWS Support Center.

  2. Envisagez d’utiliser différents types d’instances relevant d’une catégorie de quotas de vCPU différente.

  3. Mettez fin aux EC2 instances Amazon inutilisées pour libérer de la capacité du vCPU.

  4. Passez en revue la configuration de votre fournisseur de capacité afin d’utiliser des types d’instances nécessitant moins de vCPU.

InsufficientCapacity et les erreurs de capacité associées

Cause courante

Ces erreurs se produisent lorsque la capacité AWS n'est pas suffisante pour répondre à votre demande d'instance. Cela peut inclure une capacité d’instance, une capacité d’adresse ou une capacité de volume insuffisantes dans la zone de disponibilité demandée.

Résolution

  1. Essayez de lancer des instances dans différentes zones de disponibilité en configurant plusieurs sous-réseaux dans votre fournisseur de capacité.

  2. Envisagez d’utiliser différents types d’instances susceptibles de disposer d’une plus grande capacité disponible.

  3. Attendez et recommencez l’opération, car la disponibilité des capacités change fréquemment.

  4. Pour des besoins de capacité persistants, pensez à utiliser des instances réservées ou des Savings Plans.

UnauthorizedOperation erreur

Cause courante

Cette erreur se produit lorsque le service Amazon ECS ne dispose pas des autorisations nécessaires pour effectuer des EC2 opérations Amazon ou transmettre des rôles IAM. Les scénarios courants incluent des autorisations ec2:RunInstances manquantes ou des autorisations iam:PassRole pour le profil d’instance.

Résolution

  1. Vérifiez que votre rôle d'infrastructure Amazon ECS dispose des autorisations nécessaires pour lancer des EC2 instances Amazon.

  2. Assurez-vous que le rôle d’infrastructure dispose d’autorisations iam:PassRole pour le profil d’instance utilisé par vos instances gérées Amazon ECS.

  3. Consultez le message d'échec d'autorisation codé CloudTrail pour obtenir des informations d'autorisation spécifiques.

  4. Mettez à jour la politique de rôle pour inclure les autorisations manquantes identifiées dans le message d’erreur.

La tâche a expiré pendant l’attente de la capacité.

Cause courante

Cette erreur se produit lorsque le lancement et l’enregistrement des instances auprès du cluster prennent plus de temps que prévu. Cela peut être dû à des contraintes de EC2 capacité d'Amazon, à des échecs de lancement d'instance ou à des problèmes de connectivité réseau.

Résolution

  1. Vérifiez l'état EC2 du service Amazon dans votre région pour tout problème persistant.

  2. Vérifiez que vos sous-réseaux disposent de suffisamment d’adresses IP disponibles.

  3. Assurez-vous que vos groupes de sécurité autorisent le trafic nécessaire à la communication avec les agents Amazon ECS.

  4. Envisagez d’utiliser plusieurs zones de disponibilité pour améliorer la disponibilité des capacités.

  5. Réessayez l’opération de lancement de la tâche, car les contraintes de capacité sont souvent temporaires.

Erreurs de configuration réseau

Cause courante

Ces erreurs se produisent lorsqu’il existe des incohérences entre les exigences réseau de votre tâche et la configuration réseau du fournisseur de capacité, telles que des incompatibilités VPC ou une configuration réseau manquante.

Résolution

  1. Vérifiez que votre fournisseur de capacité est configuré avec le VPC et les sous-réseaux appropriés.

  2. Assurez-vous que les groupes de sécurité et les sous-réseaux appartiennent au même VPC.

  3. Vérifiez que la configuration réseau de votre définition de tâche est compatible avec le fournisseur de capacité.

  4. Mettez à jour la configuration de votre fournisseur de capacité avec les paramètres réseau appropriés.

Le fournisseur de capacité ne peut pas être supprimé en raison d'instances bloquées

Cause courante

Ces erreurs se produisent lorsque les instances gérées Amazon ECS sont bloquées dans un DRAINING état ACTIVE ou alors qu'aucune tâche n'est en cours d'exécution sur les instances.

Résolution

Pour autoriser la suppression du fournisseur de capacité, vous pouvez forcer le désenregistrement des instances bloquées à l'aide de la commande suivante.

aws ecs deregister-container-instance \ --cluster arn:aws:ecs:us-east-1:111122223333:cluster/MyCluster \ --container-instance arn:aws:ecs:us-east-1:111122223333:container-instance/a1b2c3d4-5678-90ab-cdef-11111EXAMPLE \ --force