Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Résoudre les problèmes liés à Amazon ECS Anywhere
Amazon ECS Anywhere fournit une assistance pour l'enregistrement d'une instance externe telle qu'un serveur sur site ou une machine virtuelle (VM) sur votre cluster Amazon ECS. Voici les problèmes courants que vous pouvez rencontrer et les recommandations générales pour leur résolution.
Rubriques
Problèmes d'enregistrement d'instance externe
Lorsque vous enregistrez une instance externe auprès de votre cluster Amazon ECS, les conditions suivantes doivent être remplies :
-
Une AWS Systems Manager activation, qui consiste en un ID d'activation et un code d'activation, doit être récupérée. Vous l'utilisez pour enregistrer l'instance externe en tant qu'instance gérée par Systems Manager. Lorsqu'une activation de Systems Manager est demandée, spécifiez une limite d'enregistrement et une date d'expiration. La limite d'enregistrement spécifie le nombre maximal d'instances qui peuvent être enregistrées à l'aide de l'activation. La valeur par défaut pour la limite d'enregistrement est
1
instance. La date d'expiration spécifie la date à laquelle l'activation expire. La valeur par défaut est 24 heures. Si l'activation de Systems Manager que vous utilisez pour enregistrer votre instance externe n'est pas valide, demandez-en une nouvelle. Pour de plus amples informations, veuillez consulter Enregistrement d'une instance externe dans un cluster Amazon ECS. -
Une politique IAM est utilisée pour fournir à votre instance externe les autorisations dont elle a besoin pour communiquer avec les opérations AWS d'API. Si cette stratégie gérée n'est pas créée correctement et ne contient pas les autorisations requises, l'enregistrement d'instance externe échoue. Pour de plus amples informations, veuillez consulter Rôle IAM dans Amazon ECS Anywhere.
-
Amazon ECS fournit un script d'installation qui installe Docker, l'agent de conteneur Amazon ECS et le Systems Manager Agent sur votre instance externe. Si le script d'installation échoue, il est probable qu'il ne puisse plus être exécuté sur la même instance sans qu'une erreur ne se produise. Dans ce cas, suivez le processus de nettoyage pour effacer les AWS ressources de l'instance afin de pouvoir réexécuter le script d'installation. Pour de plus amples informations, veuillez consulter Annulation de l'enregistrement d'une instance externe Amazon ECS.
Note
Sachez que si le script d'installation a demandé et utilisé avec succès l'activation de Systems Manager, toute autre exécution du script d'installation utilise à nouveau l'activation de Systems Manager. Cela peut à son tour vous amener à atteindre la limite d'enregistrement pour cette activation. Si cette limite est atteinte, vous devez recréer une activation.
-
Lors de l'exécution du script d'installation sur une instance externe pour les charges de travail du GPU, si le pilote NVIDIA n'est pas détecté ou configuré correctement, une erreur se produit. Le script d'installation utilise la commande
nvidia-smi
pour confirmer l'existence du pilote NVIDIA.
Problèmes de réseau d'instance externe
Pour communiquer toute modification, votre instance externe nécessite une connexion réseau à AWS. Si votre instance externe perd sa connexion réseau AWS, les tâches exécutées sur vos instances continuent de s'exécuter de toute façon, sauf si elles sont arrêtées manuellement. Une fois la connexion rétablie, les AWS informations d'identification utilisées par l'agent de conteneur Amazon ECS et l'agent Systems Manager sur l'instance externe sont renouvelées automatiquement. AWS Pour plus d'informations sur les AWS domaines utilisés pour la communication entre votre instance externe et AWS, consultezRéseaux .
Problèmes d'exécution de tâches sur votre instance externe
Si vos tâches ou conteneurs ne parviennent pas à s'exécuter sur votre instance externe, cela est généralement dû au réseau ou aux autorisations. Si vos conteneurs extraient leurs images d'Amazon ECR ou sont configurés pour envoyer des journaux de conteneurs à Logs, votre définition de tâche doit spécifier un rôle IAM d'exécution de tâche valide. CloudWatch Sans un rôle IAM d'exécution de tâche valide, vos conteneurs ne démarrent pas. Pour en savoir plus sur les problèmes liés au réseau, consultez Problèmes de réseau d'instance externe.
Important
Amazon ECS fournit l'outil de collecte des journaux Amazon ECS. Vous pouvez l'utiliser pour collecter des journaux de vos instances externes à des fins de dépannage. Pour de plus amples informations, veuillez consulter Collecte des journaux de conteneurs avec le collecteur de journaux Amazon ECS .