Risoluzione dei problemi relativi alle istanze gestite da Amazon ECS - Amazon Elastic Container Service

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi relativi alle istanze gestite da Amazon ECS

Quando si avviano attività con le istanze gestite da Amazon ECS, Amazon ECS tenta innanzitutto di collocare le attività sulla capacità esistente e richiede capacità aggiuntiva per le attività che non possono essere collocate. Se il provisioning dell'istanza fallisce, l'ID della EC2 richiesta Amazon viene incluso nel messaggio di errore dell'attività. Puoi utilizzare questo ID di richiesta per cercare i dettagli della richiesta non riuscita CloudTrail per un'ulteriore risoluzione dei problemi.

Nota

Se scegli di applicare le autorizzazioni con privilegi minimi e di specificare le tue autorizzazioni per il profilo dell'istanza anziché utilizzare la policy AmazonECSInstanceRolePolicyForManagedInstances gestita, puoi aggiungere le seguenti autorizzazioni per aiutarti a risolvere i problemi relativi alle attività con Amazon ECS Managed Instances:

  • ecs:StartTelemetrySession

  • ecs:PutSystemLogEvents

La definizione delle attività non è compatibile con le istanze gestite da Amazon ECS.

Cause comuni

Questo errore si verifica quando la definizione dell'attività contiene parametri o configurazioni non supportati dalle istanze gestite da Amazon ECS. Le incompatibilità più comuni includono modalità di rete, ruoli delle attività o requisiti delle risorse non supportati.

Risoluzione

  1. Verifica che la definizione dell'attività usi requiresCompatibilities impostato su MANAGED_INSTANCES.

  2. Assicurati che la definizione dell'attività usi la modalità di rete awsvpc.

  3. Controlla che i valori di CPU e memoria rientrino negli intervalli supportati per le istanze gestite da Amazon ECS.

  4. Controlla il messaggio di errore dettagliato per i dettagli specifici sull'incompatibilità.

Provider di capacità non associato al cluster

Cause comuni

Questo errore si verifica quando il provider di capacità specificato nella strategia del provider di capacità non è associato al cluster oppure non esiste.

Risoluzione

  1. Verifica che il provider di capacità esista nel tuo account e nella tua regione.

  2. Associa il provider di capacità al cluster usando la CLI o la console Amazon ECS.

  3. Assicurati che il provider di capacità sia nello stato ACTIVE prima di utilizzarlo.

Errori relativi alle autorizzazioni dei ruoli dell'infrastruttura

Cause comuni

Questo errore si verifica quando il ruolo dell'infrastruttura Amazon ECS non dispone delle autorizzazioni necessarie per EC2 eseguire operazioni Amazon per tuo conto o quando il ruolo non può essere assunto a causa di problemi di relazione di fiducia.

Risoluzione

  1. Verifica che il tuo ruolo dell'infrastruttura abbia un rapporto di fiducia adeguato con Amazon ECS.

  2. Assicurati che il ruolo disponga delle EC2 autorizzazioni Amazon richiesteec2:RunInstances, tra cuiec2:DescribeInstances, eiam:PassRole.

  3. Controlla il messaggio codificato di errore di autorizzazione CloudTrail per dettagli specifici sulle autorizzazioni.

  4. Aggiorna la policy del ruolo per includere le autorizzazioni mancanti identificate nel messaggio di errore.

VcpuLimitExceeded errore

Cause comuni

Questo errore si verifica quando viene raggiunta la quota del servizio vCPU per la famiglia di tipi di istanza nella regione corrente. Le istanze gestite da Amazon ECS non possono avviare istanze aggiuntive finché non è disponibile la capacità necessaria.

Risoluzione

  1. Richiedi un aumento della quota di servizio per la famiglia di tipi di istanze interessata tramite il AWS Support Center.

  2. Valuta l'utilizzo di tipi di istanza diversi che rientrano in una categoria di quota vCPU diversa.

  3. Termina le EC2 istanze Amazon non utilizzate per liberare capacità vCPU.

  4. Rivedi la configurazione del tuo provider di capacità per usare tipi di istanza con requisiti vCPU inferiori.

InsufficientCapacity e i relativi errori di capacità

Cause comuni

Questi errori si verificano quando AWS non dispone di una capacità sufficiente per soddisfare la richiesta dell'istanza. Ciò può includere una capacità insufficiente di istanze, indirizzi o volumi nella zona di disponibilità richiesta.

Risoluzione

  1. Prova ad avviare istanze in diverse zone di disponibilità configurando più sottoreti nel tuo provider di capacità.

  2. Valuta l'utilizzo di tipi di istanza diversi che potrebbero avere una maggiore capacità disponibile.

  3. Attendi e riprova l'operazione in quanto la disponibilità della capacità cambia frequentemente.

  4. Per esigenze di capacità persistenti, valuta l'utilizzo di istanze riservate o Savings Plans.

UnauthorizedOperation errore

Cause comuni

Questo errore si verifica quando il servizio Amazon ECS non dispone delle autorizzazioni necessarie per EC2 eseguire operazioni Amazon o passare ruoli IAM. Gli scenari più comuni includono la mancanza di autorizzazioni ec2:RunInstances o iam:PassRole per il profilo dell'istanza.

Risoluzione

  1. Verifica che il ruolo dell'infrastruttura Amazon ECS disponga delle autorizzazioni necessarie per avviare le istanze Amazon EC2 .

  2. Assicurati che il ruolo dell'infrastruttura disponga delle autorizzazioni iam:PassRole per il profilo dell'istanza usato dalle tue istanze gestite da Amazon ECS.

  3. Controlla il messaggio codificato di errore di autorizzazione CloudTrail per dettagli specifici sulle autorizzazioni.

  4. Aggiorna la policy del ruolo per includere le autorizzazioni mancanti identificate nel messaggio di errore.

Attività scaduta in attesa di capacità

Cause comuni

Questo errore si verifica quando le istanze impiegano più del previsto per l'avvio e la registrazione nel cluster. Ciò può accadere a causa di limiti di EC2 capacità di Amazon, errori di avvio delle istanze o problemi di connettività di rete.

Risoluzione

  1. Verifica lo stato EC2 del servizio Amazon nella tua regione per eventuali problemi in corso.

  2. Verifica che le sottoreti dispongano di un numero sufficiente di indirizzi IP disponibili.

  3. Assicurati che i tuoi gruppi di sicurezza consentano il traffico necessario per la comunicazione con l'agente Amazon ECS.

  4. Valuta l'utilizzo di più zone di disponibilità per migliorare la disponibilità della capacità.

  5. Riprova a eseguire l'attività di avvio dell'attività, poiché i limiti di capacità sono spesso temporanei.

Errori di configurazione della rete

Cause comuni

Questi errori avvengono quando ci sono discrepanze tra i requisiti di rete della tua attività e la configurazione di rete del provider di capacità, come discrepanze VPC o configurazione di rete mancante.

Risoluzione

  1. Verifica che il provider di capacità sia configurato con il VPC e le sottoreti corretti.

  2. Verifica che i gruppi di sicurezza e le sottoreti appartengano allo stesso VPC.

  3. Controlla che la configurazione di rete della definizione dell'attività sia compatibile con il provider di capacità.

  4. Aggiorna la configurazione del provider di capacità con le impostazioni di rete corrette.

Il Capacity Provider non può essere eliminato a causa di istanze bloccate

Cause comuni

Questi errori si verificano quando le istanze gestite di Amazon ECS sono bloccate in uno DRAINING stato ACTIVE or ma non ci sono attività in esecuzione sulle istanze.

Risoluzione

Per consentire l'eliminazione del provider di capacità, puoi forzare l'annullamento della registrazione delle istanze bloccate utilizzando il seguente comando.

aws ecs deregister-container-instance \ --cluster arn:aws:ecs:us-east-1:111122223333:cluster/MyCluster \ --container-instance arn:aws:ecs:us-east-1:111122223333:container-instance/a1b2c3d4-5678-90ab-cdef-11111EXAMPLE \ --force