Avvisi dal monitoraggio di base in AMS - Guida per l'utente avanzato di AMS

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Avvisi dal monitoraggio di base in AMS

Scopri le impostazioni predefinite di monitoraggio di AMS. Per ulteriori informazioni, consulta Monitoraggio e gestione degli eventi in AMS.

La tabella seguente mostra cosa viene monitorato e le soglie di avviso predefinite. Puoi modificare le soglie di avviso con un RFC Management | Other | Other | Update (ct-0xdawir96cy7k) dopo aver determinato le modifiche desiderate e aver sottoscritto l'argomento pertinente di Amazon SNS. CloudWatch Per informazioni sulla creazione e la sottoscrizione di argomenti, consulta Sottoscrivere un argomento. Per informazioni generali, consulta Amazon SNS FAQs. Per ricevere una notifica diretta quando gli allarmi superano la soglia, oltre alla procedura di avviso standard di AMS, segui queste istruzioni su come sovrascrivere le configurazioni degli allarmi,. Ricezione di avvisi generati da AMS

Amazon CloudWatch offre una conservazione estesa dei parametri. Per ulteriori informazioni, consulta CloudWatch Limiti.

Nota

AMS calibra il monitoraggio di base su base periodica. L'onboarding di nuovi account viene sempre effettuato con il monitoraggio di base più recente e la tabella descrive il monitoraggio di base per un account che ha appena effettuato l'onboarding. AMS aggiorna periodicamente il monitoraggio di base negli account esistenti e potrebbe verificarsi un intervallo di tempo prima che gli aggiornamenti siano disponibili. Per ulteriori informazioni, consulta Visualizzazione della configurazione di monitoraggio per un account AMS.

Nota
Avvisi provenienti dal monitoraggio di base

Servizio

Avviso di sicurezza

Nome dell'avviso e condizione di attivazione

Note

Per gli avvisi contrassegnati da un asterisco (*), AMS valuta in modo proattivo l'impatto e corregge quando possibile; se la correzione non è possibile, AMS crea un incidente. Nel caso in cui l'automazione non riesca a risolvere il problema, AMS informa l'utente del caso in cui si è verificato l'incidente e viene assunto un tecnico AMS. Inoltre, questi avvisi possono essere inviati direttamente alla tua e-mail (se hai scelto l'argomento Direct-Customer-Alerts SNS).

Istanza Application Load Balancer (ALB)

No

RejectedConnectionCount

somma > 0 per 1 minuto, 5 volte consecutive.

CloudWatch allarme se il numero di connessioni che sono state rifiutate perché il sistema di bilanciamento del carico ha raggiunto il suo massimo.

Obiettivo Application Load Balancer (ALB)

No

TargetConnectionErrorCount

somma > 0 per 1 minuto, 5 volte consecutive.

CloudWatch allarme se il numero di connessioni è stato stabilito senza successo tra il sistema di bilanciamento del carico e le istanze registrate.

EC2 Istanza Amazon: Windows

No

SecureChannelFailure

> 0,0 per 10 degli ultimi 15 punti dati.

CloudWatch allarme sulle istanze Windows per avvisare quando la connessione Secure a Channel non è riuscita.

Istanza Aurora

No

CPUUtilization

> 85% per 5 minuti, 2 volte consecutive.

CloudWatch allarme.

AWS Backup

DeleteRecoveryPoint

Un ruolo principale IAM o un user principal IAM inaspettato ha eliminato un punto di AWS Backup ripristino.

CloudWatch evento. Emesso quando viene eliminato un punto di ripristino di backup.

AWS Outposts

AMSOutpostsInstanceFamilyCapacityAvailability InstanceFamilyCapacityAvailability

= 80% per 5 minuti, 12 volte consecutive.

CloudWatch allarme ad esempio sulla disponibilità della capacità familiare della AWS Outposts risorsa.

AMSOutpostsInstanceTypeCapacityAvailability TypeCapacityAvailability

= 80% per 5 minuti, 12 volte consecutive.

CloudWatch allarme sul tipo di istanza (capacità, disponibilità della AWS Outposts risorsa).

AMSOutpostsConnectedStatusConnectedStatus

< 1 per 5 minuti, 1 volta consecutiva.

CloudWatch allarme sulla connessione al AWS Outposts service link, meno di 1 conteggio è compromesso.

AMSOutpostsCapacityExceptionCapacityExceptions

0 per 5 minuti, 1 volta consecutiva.

CloudWatch allarme in caso di capacità insufficiente, errori (ad esempio, avvio di una risorsa AWS Outposts)

.

EC2 istanza - tutte OSs

No

CPUUtilization*

>= 95% per 5 minuti, 6 volte consecutive.

CloudWatch allarme. L'elevato utilizzo della CPU è un indicatore di un cambiamento nello stato dell'applicazione, ad esempio deadlock, loop infiniti, attacchi dannosi e altre anomalie.

StatusCheckFailed

> 0 per 5 minuti, 3 volte consecutive.

CloudWatch allarme.

Utilizzo del volume root

>= 95% per 5 minuti, 6 volte consecutive.

Utilizzo di volumi non root

> 85% per 5 minuti, 2 volte consecutive.

Disattivata per impostazione predefinita; per ulteriori informazioni, vedere https://docs.aws.amazon.com/managedservices/latest/ctref/management-monitoring-cloudwatch-enable-non-root-volumes-monitoring.html#management-monitoring-cloudwatch-enable-non-root-volumes-monitoring-info.

Memoria liberata*

MemoryFree < 5% per 5 minuti, 6 volte consecutive.

Malware EPS

Malware rilevato su esempio.

CloudWatch evento.

EC2 Istanza Amazon - Linux

No

Utilizzo di Root Volume Inode

Media >= 95% per 5 minuti, 6 volte consecutive.

CloudWatch allarme. Applicato solo alle istanze Linux.

Swap gratuito*

Memory Swap < 5% per 5 minuti, 6 volte consecutive.

ElastiCache Cluster

No

CurrConnections = 65000

Questo allarme notifica ad AMS il limite massimo di connessione di un ElastiCache host.

CloudWatch Allarme. Se desideri aggiornare questa soglia, contatta l'assistenza AMS.

ElastiCache Nodo

No

CPUUtilization

Media > valore predefinito per 15 minuti, 2 volte consecutive.

CloudWatch allarme. L'impostazione predefinita è 90. Se Redis, usa uno dei seguenti valori in base al tipo di istanza:

  • cache.t1.micro: 90%

  • cache.m1.small: 90%

  • cache.m1.medium: 90%

  • cache.m1.large: 45%

  • cache.m1.xlarge: 22,5%

  • cache.m2.xlarge: 45%

  • cache.m2.4xlarge: 11,25%

  • cache.c1.xlarge: 11,25%

  • cache.t2.micro: 90%

  • cache.t2.small: 90%

  • cache.t2.medium: 45%

  • cache.m3.medium: 90%

  • cache.m3.large: 45%

  • cache.m3.xlarge: 22,5%

  • cache.m3.2xlarge: 11,25%

  • cache.r3.large: 45%

  • cache.r3.xlarge: 22,5%

  • cache.r3.2xlarge: 11,25%

  • cache.r3.4xlarge: 5,625%

  • cache.r3.8xlarge: 2,8125%

ElastiCache Nodo: memcached

No

SwapUsage

massimo > 50.000.000 di byte per 5 minuti, 5 volte consecutive.

CloudWatch allarme. Applicato solo a memcached.

OpenSearch ammasso

No

ClusterStatus.red

il massimo è >= 1 per 1 minuto, 1 volta consecutiva.

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

CloudWatch allarme. Almeno una partizioni primaria e le relative repliche non sono assegnate a un nodo. Per saperne di più, consulta Red Cluster Status.

OpenSearch dominio

No

KMSKeyErrore

>= 1 per 1 minuto, 1 volta consecutiva.

CloudWatch allarme. La chiave crittografica KMS che viene utilizzata per crittografare i dati a riposo nel tuo dominio è disabilitata. Riabilitala per ripristinare le normali operazioni. Per ulteriori informazioni, consulta Encryption of Data at Rest for OpenSearch Service.

ClusterStatus.giallo

il massimo è >= 1 per 1 minuto, 1 volta consecutiva

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

Almeno una partizione di replica non è allocata per un nodo. Per ulteriori informazioni, consulta Yellow Cluster Status.

FreeStorageSpace

il minimo è <= 20480 per 1 minuto, 1 volta consecutiva

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

Un nodo nel cluster è legato ai 20 GiB di spazio di archiviazione gratuito. Per ulteriori informazioni, consulta Mancanza di spazio di archiviazione disponibile.

ClusterIndexWritesBlocked

>= 1 per 5 minuti, 1 volta consecutiva

Quando viene attivato questo avviso, AMS intraprende azioni proattive per ridurre l'impatto operativo.

Il cluster sta bloccando le richieste di scrittura. Per ulteriori informazioni, consulta ClusterBlockException.

Nodi

il minimo è < x per 1 giorno, 1 volta consecutiva

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

x è il numero di nodi del cluster. Questo allarme indica che almeno un nodo nel cluster è stato irraggiungibile per un giorno. Per ulteriori informazioni, consulta Failed Cluster Nodes.

CPUUtilization

la media è >= 80% per 15 minuti, 3 volte consecutive

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

L'utilizzo al 100% della CPU è comune, ma valori medi elevati e sostenuti sono problematici. Consigliamo di utilizzare tipi di istanza più grandi o aggiungere istanze.

JVMMemoryPressione

il massimo è >= 80% per 5 minuti, 3 volte consecutive

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

Sui cluster potrebbero verificarsi errori di esaurimento della memoria nel caso in cui l'utilizzo aumenti. Considerare il dimensionamento verticale. Amazon ES utilizza metà della RAM di un'istanza per l'heap Java, fino a una dimensione dell'heap di 32 GiB. Puoi scalare le istanze verticalmente fino a 64 GiB di RAM e poi scalare orizzontalmente aggiungendo le istanze.

Padrone CPUUtilization

la media è >= 50% per 15 minuti, 3 volte consecutive

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

Prendi in considerazione l'utilizzo di tipi di istanze più grandi per i tuoi nodi master dedicati. A causa del loro ruolo nella stabilità e nelle blue/green implementazioni dei cluster, i nodi master dedicati dovrebbero avere un utilizzo medio della CPU inferiore rispetto ai nodi di dati.

Pressione principale JVMMemory

il massimo è >= 80% per 15 minuti, 1 volta consecutiva

AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso.

Prendi in considerazione l'utilizzo di tipi di istanze più grandi per i tuoi nodi master dedicati. A causa del loro ruolo nella stabilità e nelle blue/green implementazioni dei cluster, i nodi master dedicati dovrebbero avere un utilizzo medio della CPU inferiore rispetto ai nodi di dati.

OpenSearch istanza

No

AutomatedSnapshotFailure

il massimo è >= 1 per 1 minuto, 1 volta consecutiva.

CloudWatch allarme. Uno snapshot automatico ha restituito un errore. Questo errore è spesso il risultato di uno stato del cluster rosso. Vedi Red Cluster Status.

Istanza Elastic Load Balancing

No

SurgeQueueLength

> 100 per 1 minuto, 15 volte consecutive.

CloudWatch allarme se un numero eccessivo di richieste è in attesa di instradamento.

HTTPCode_ELB_5XX_Count

somma > 0 per 5 minuti, 3 volte consecutive.

CloudWatch allarme relativo al numero eccessivo di codici di risposta HTTP 5XX che provengono dal load balancer.

SpilloverCount

> 1 per 1 minuto, 15 volte consecutive.

CloudWatch allarme se un numero eccessivo di richieste sono state rifiutate perché la coda di sovratensione è piena.

GuardDuty servizio

Non applicabile; tutti i risultati (ai fini della minaccia) vengono monitorati. Ogni risultato corrisponde a un avviso.

Modifiche nei GuardDuty risultati. Queste modifiche includono i nuovi risultati generati e le occorrenze successive dei risultati esistenti.

L'elenco dei tipi di GuardDuty ricerca supportati si trova in GuardDuty Active Finding Types.

Integrità

Può variare

AWS Health Dashboard

Le notifiche vengono inviate quando ci sono cambiamenti nello stato degli eventi AWS Health Dashboard (AWS Health) in relazione ai servizi di base supportati da AMS. Per ulteriori informazioni, consulta Servizi supportati.

AWS Managed Microsoft AD

No

Stato di Active Directory

AWS Managed Microsoft AD l'istanza invia un evento di stato attivo.

Evento di servizio. Emesso quando la directory funziona normalmente dopo un evento.

Stato della directory alterato

AWS Managed Microsoft AD l'istanza invia un evento di stato della directory alterato.

Evento di servizio. Emesso quando la directory è in esecuzione in uno stato degradato. Uno o più problemi sono stati rilevati e non tutte le operazioni di directory potrebbero lavorare alla massima capacità operativa.

Stato della directory non utilizzabile

AWS Managed Microsoft AD l'istanza invia un evento di stato non utilizzabile.

Evento di servizio. Emesso quando la directory non è funzionante. Sono stati segnalati problemi per tutti gli endpoint della directory.

Eliminazione dello stato della directory

AWS Managed Microsoft AD l'istanza invia un evento di eliminazione dello stato della directory.

Evento di servizio. Emesso quando la directory viene attualmente eliminata.

Stato della directory non riuscito

AWS Managed Microsoft AD l'istanza invia un evento di stato non riuscito.

Evento di servizio. Emesso quando non è stato possibile creare la directory.

RestoreFailed Stato della directory

AWS Managed Microsoft AD l'istanza invia un evento di ripristino non riuscito dello stato della directory.

Evento di servizio. Emesso durante il ripristino della directory da un'istantanea non riuscito.

Istanza Amazon RDS

No

L'avviso Low Storage si attiva quando lo storage allocato per l'istanza DB è esaurito.

RDS-EVENT-0007, consulta i dettagli in Utilizzo della notifica degli eventi di Amazon RDS.

Errore dell'istanza DB

L'istanza database ha avuto esito negativo a causa di una configurazione non compatibile o di un problema di storage sottostante. Inizia a point-in-time-restore per l'istanza DB.

Evento di servizio. RDS-EVENT-0031, categorie di eventi e messaggi di eventi di Amazon RDS.

Failover non tentato

Amazon RDS non sta tentando di effettuare un failover richiesto perché di recente si è verificato un failover nell'istanza database.

Evento di servizio. RDS-EVENT-0034, categorie di eventi e messaggi di eventi di Amazon RDS.

Parametri non validi dell'istanza DB

Ad esempio, MySQL non può avviarsi perché un parametro relativo alla memoria è impostato su un valore troppo alto per questa classe di istanza, quindi l'azione del cliente consisterebbe nel modificare il parametro di memoria e riavviare l'istanza DB.

Evento di servizio. RDS-EVENT-0035, categorie di eventi e messaggi di eventi di Amazon RDS.

Istanza DB IDs di sottorete non valida

L'istanza database si trova in una rete non compatibile. Alcune delle sottoreti specificate non IDs sono valide o non esistono.

Evento di servizio. RDS-EVENT-0036, categorie di eventi e messaggi di eventi di Amazon RDS.

Errore di lettura della replica dell'istanza DB

Si è verificato un errore interno nel processo di replica di lettura. Per ulteriori informazioni, consulta il messaggio di evento. Per informazioni sulla risoluzione degli errori di Read Replica, consulta Risoluzione di un problema di Read Replica di MySQL.

Evento di servizio. RDS-EVENT-0045, categorie di eventi e messaggi di eventi di Amazon RDS.

La replica di lettura dell'istanza DB è terminata

La replica sulla Read Replica è stata terminata.

Evento di servizio. RDS-EVENT-0057, categorie di eventi e messaggi di eventi di Amazon RDS.

Errore durante la creazione dell'account utente statspack

Errore durante la creazione dell'account utente Statspack PERFSTAT. Elimina l'account prima di aggiungere l'opzione Statspack.

Evento di servizio. RDS-EVENT-0058, categorie di eventi e messaggi di eventi di Amazon RDS.

Avvio del ripristino dell'istanza DB

L'istanza database di SQL Server sta ristabilendo il relativo mirror. Le prestazioni subiranno un peggioramento fino al termine dell'operazione. È stato trovato un database con un modello di recupero non FULL. Il modello di ripristino è stato riportato a FULL ed è stato avviato il ripristino in mirroring. (<dbname>: <recovery model found>[,...]).

Evento di servizio. RDS-EVENT-0066, categorie di eventi e messaggi di eventi di Amazon RDS.

Il failover del cluster di database non è riuscito.

RDS-EVENT-0069, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

Bucket S3 di ripristino delle autorizzazioni non valide

Il ruolo IAM utilizzato per accedere al bucket di Amazon S3 per il backup e ripristino nativo di SQL Server non è configurato correttamente. Per ulteriori informazioni, vedere Configurazione per il backup e il ripristino nativi.

Evento di servizio. RDS-EVENT-0081, categorie di eventi e messaggi di eventi di Amazon RDS.

Aurora non è riuscito a copiare i dati di backup da un bucket Simple Storage Service (Amazon S3).

RDS-EVENT-0082, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

Avviso di storage insufficiente quando l'istanza DB ha consumato più del 90% dello storage allocato

RDS-EVENT-0089, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

Il servizio di notifica durante il ridimensionamento non è riuscito per il cluster DB Aurora Serverless.

RDS-EVENT-0143, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

L'istanza database è in uno stato non valido. Nessuna operazione richiesta. Il ridimensionamento automatico verrà riprovato in un secondo momento.

RDS-EVENT-0219, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

L'istanza database ha raggiunto la soglia completa dello storage e il database è stato arrestato.

RDS-EVENT-0221, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

Questo evento indica che la scalabilità automatica dello storage delle istanze RDS non è in grado di scalare. I motivi per cui l'autoscaling non è riuscito possono essere diversi.

RDS-EVENT-0223, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

La scalabilità automatica dello storage ha attivato un'attività di storage in sospeso che avrebbe raggiunto la soglia massima di storage.

RDS-EVENT-0224, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

Il tipo di archiviazione dell'istanza database non è attualmente disponibile nella zona di disponibilità. Il ridimensionamento automatico verrà riprovato in un secondo momento.

RDS-EVENT-0237, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

RDS non è stato in grado di allocare la capacità per il proxy perché non ci sono sufficienti indirizzi IP disponibili nelle sottoreti.

RDS-EVENT-0243, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

Lo storage per il tuo account AWS ha superato la quota di storage consentita.

RDS-EVENT-0254, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS.

CPUUtilization

Utilizzo medio della CPU > 90% per 15 minuti, 2 volte consecutive.

CloudWatch allarme.

DiskQueueDepth

La somma è > 75 per 1 minuto, 15 volte consecutive.

FreeStorageSpace

Media < 1.073.741.824 byte per 5 minuti, 2 volte consecutive.

SwapUsage

Media = 104.857.600 byte per 5 minuti, 2 volte consecutive.

Cluster Amazon Redshift

No

RedshiftClusterStatus

Lo stato del cluster quando non è in modalità di manutenzione < 1 per 5 minuti.

1 rappresenta un cluster integro.

Amazon Macie

Avvisi appena generati e aggiornamenti agli avvisi esistenti.

Macie rileva eventuali modifiche nei risultati. Queste modifiche includono i nuovi risultati generati e le occorrenze successive dei risultati esistenti.

Avviso Amazon Macie. Per un elenco dei tipi di avvisi Macie supportati, consulta Analyzing Amazon Macie Findings. Tieni presente che Macie non è abilitato per tutti gli account.

AMS intraprende azioni proattive (ridimensionamento del cluster) quando viene attivato questo avviso.

Per informazioni sulle azioni correttive, consulta. Correzione automatica degli avvisi con AMS