Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Avvisi dal monitoraggio di base in AMS
Scopri le impostazioni predefinite di monitoraggio di AMS. Per ulteriori informazioni, consulta Monitoraggio e gestione degli eventi in AMS.
La tabella seguente mostra cosa viene monitorato e le soglie di avviso predefinite. Puoi modificare le soglie di avviso con un RFC Management | Other | Other | Update (ct-0xdawir96cy7k) dopo aver determinato le modifiche desiderate e aver sottoscritto l'argomento pertinente di Amazon SNS. CloudWatch Per informazioni sulla creazione e la sottoscrizione di argomenti, consulta Sottoscrivere un argomento. Per informazioni generali, consulta Amazon SNS FAQs
Amazon CloudWatch offre una conservazione estesa dei parametri. Per ulteriori informazioni, consulta CloudWatch Limiti.
Nota
AMS calibra il monitoraggio di base su base periodica. L'onboarding di nuovi account viene sempre effettuato con il monitoraggio di base più recente e la tabella descrive il monitoraggio di base per un account che ha appena effettuato l'onboarding. AMS aggiorna periodicamente il monitoraggio di base negli account esistenti e potrebbe verificarsi un intervallo di tempo prima che gli aggiornamenti siano disponibili. Per ulteriori informazioni, consulta Visualizzazione della configurazione di monitoraggio per un account AMS.
Nota
L'avviso di EC2 istanza Non-root volume usage è DISABILITATO per impostazione predefinita. Se si richiede la generazione di avvisi in base a questo allarme, è necessario abilitarla utilizzando il tipo di modifica RFC ct-0erkoad6uyvvg
Servizio |
Avviso di sicurezza |
Nome dell'avviso e condizione di attivazione |
Note |
|---|---|---|---|
Per gli avvisi contrassegnati da un asterisco (*), AMS valuta in modo proattivo l'impatto e corregge quando possibile; se la correzione non è possibile, AMS crea un incidente. Nel caso in cui l'automazione non riesca a risolvere il problema, AMS informa l'utente del caso in cui si è verificato l'incidente e viene assunto un tecnico AMS. Inoltre, questi avvisi possono essere inviati direttamente alla tua e-mail (se hai scelto l'argomento Direct-Customer-Alerts SNS). | |||
Istanza Application Load Balancer (ALB) |
No |
RejectedConnectionCount somma > 0 per 1 minuto, 5 volte consecutive. |
CloudWatch allarme se il numero di connessioni che sono state rifiutate perché il sistema di bilanciamento del carico ha raggiunto il suo massimo. |
Obiettivo Application Load Balancer (ALB) |
No |
TargetConnectionErrorCount somma > 0 per 1 minuto, 5 volte consecutive. |
CloudWatch allarme se il numero di connessioni è stato stabilito senza successo tra il sistema di bilanciamento del carico e le istanze registrate. |
EC2 Istanza Amazon: Windows |
No |
SecureChannelFailure > 0,0 per 10 degli ultimi 15 punti dati. |
CloudWatch allarme sulle istanze Windows per avvisare quando la connessione Secure a Channel non è riuscita. |
Istanza Aurora |
No |
CPUUtilization > 85% per 5 minuti, 2 volte consecutive. |
CloudWatch allarme. |
AWS Backup |
Sì |
DeleteRecoveryPoint Un ruolo principale IAM o un user principal IAM inaspettato ha eliminato un punto di AWS Backup ripristino. |
CloudWatch evento. Emesso quando viene eliminato un punto di ripristino di backup. |
|
AWS Outposts |
Sì |
AMSOutpostsInstanceFamilyCapacityAvailability InstanceFamilyCapacityAvailability = 80% per 5 minuti, 12 volte consecutive. |
CloudWatch allarme ad esempio sulla disponibilità della capacità familiare della AWS Outposts risorsa. |
AMSOutpostsInstanceTypeCapacityAvailability TypeCapacityAvailability = 80% per 5 minuti, 12 volte consecutive. |
CloudWatch allarme sul tipo di istanza (capacità, disponibilità della AWS Outposts risorsa). |
||
AMSOutpostsConnectedStatusConnectedStatus < 1 per 5 minuti, 1 volta consecutiva. |
CloudWatch allarme sulla connessione al AWS Outposts service link, meno di 1 conteggio è compromesso. |
||
AMSOutpostsCapacityExceptionCapacityExceptions 0 per 5 minuti, 1 volta consecutiva. |
CloudWatch allarme in caso di capacità insufficiente, errori (ad esempio, avvio di una risorsa AWS Outposts) . |
||
EC2 istanza - tutte OSs |
No |
CPUUtilization* >= 95% per 5 minuti, 6 volte consecutive. |
CloudWatch allarme. L'elevato utilizzo della CPU è un indicatore di un cambiamento nello stato dell'applicazione, ad esempio deadlock, loop infiniti, attacchi dannosi e altre anomalie. |
StatusCheckFailed > 0 per 5 minuti, 3 volte consecutive. |
CloudWatch allarme. | ||
Utilizzo del volume root >= 95% per 5 minuti, 6 volte consecutive. | |||
Utilizzo di volumi non root > 85% per 5 minuti, 2 volte consecutive. Disattivata per impostazione predefinita; per ulteriori informazioni, vedere https://docs.aws.amazon.com/managedservices/latest/ctref/management-monitoring-cloudwatch-enable-non-root-volumes-monitoring.html#management-monitoring-cloudwatch-enable-non-root-volumes-monitoring-info. | |||
Memoria liberata* MemoryFree < 5% per 5 minuti, 6 volte consecutive. | |||
Sì |
Malware EPS Malware rilevato su esempio. |
CloudWatch evento. | |
EC2 Istanza Amazon - Linux |
No |
Utilizzo di Root Volume Inode Media >= 95% per 5 minuti, 6 volte consecutive. |
CloudWatch allarme. Applicato solo alle istanze Linux. |
Swap gratuito* Memory Swap < 5% per 5 minuti, 6 volte consecutive. | |||
ElastiCache Cluster |
No |
CurrConnections = 65000 |
Questo allarme notifica ad AMS il limite massimo di connessione di un ElastiCache host. CloudWatch Allarme. Se desideri aggiornare questa soglia, contatta l'assistenza AMS. |
ElastiCache Nodo |
No |
CPUUtilization Media > valore predefinito per 15 minuti, 2 volte consecutive. |
CloudWatch allarme. L'impostazione predefinita è 90. Se Redis, usa uno dei seguenti valori in base al tipo di istanza:
|
ElastiCache Nodo: memcached |
No |
SwapUsage massimo > 50.000.000 di byte per 5 minuti, 5 volte consecutive. |
CloudWatch allarme. Applicato solo a memcached. |
OpenSearch ammasso |
No |
ClusterStatus.red il massimo è >= 1 per 1 minuto, 1 volta consecutiva. AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
CloudWatch allarme. Almeno una partizioni primaria e le relative repliche non sono assegnate a un nodo. Per saperne di più, consulta Red Cluster Status. |
OpenSearch dominio |
No |
KMSKeyErrore >= 1 per 1 minuto, 1 volta consecutiva. |
CloudWatch allarme. La chiave crittografica KMS che viene utilizzata per crittografare i dati a riposo nel tuo dominio è disabilitata. Riabilitala per ripristinare le normali operazioni. Per ulteriori informazioni, consulta Encryption of Data at Rest for OpenSearch Service. |
ClusterStatus.giallo il massimo è >= 1 per 1 minuto, 1 volta consecutiva AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
Almeno una partizione di replica non è allocata per un nodo. Per ulteriori informazioni, consulta Yellow Cluster Status. | ||
FreeStorageSpace il minimo è <= 20480 per 1 minuto, 1 volta consecutiva AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
Un nodo nel cluster è legato ai 20 GiB di spazio di archiviazione gratuito. Per ulteriori informazioni, consulta Mancanza di spazio di archiviazione disponibile. | ||
ClusterIndexWritesBlocked >= 1 per 5 minuti, 1 volta consecutiva Quando viene attivato questo avviso, AMS intraprende azioni proattive per ridurre l'impatto operativo. |
Il cluster sta bloccando le richieste di scrittura. Per ulteriori informazioni, consulta ClusterBlockException. | ||
Nodi il minimo è < x per 1 giorno, 1 volta consecutiva AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
x è il numero di nodi del cluster. Questo allarme indica che almeno un nodo nel cluster è stato irraggiungibile per un giorno. Per ulteriori informazioni, consulta Failed Cluster Nodes. | ||
CPUUtilization la media è >= 80% per 15 minuti, 3 volte consecutive AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
L'utilizzo al 100% della CPU è comune, ma valori medi elevati e sostenuti sono problematici. Consigliamo di utilizzare tipi di istanza più grandi o aggiungere istanze. | ||
JVMMemoryPressione il massimo è >= 80% per 5 minuti, 3 volte consecutive AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
Sui cluster potrebbero verificarsi errori di esaurimento della memoria nel caso in cui l'utilizzo aumenti. Considerare il dimensionamento verticale. Amazon ES utilizza metà della RAM di un'istanza per l'heap Java, fino a una dimensione dell'heap di 32 GiB. Puoi scalare le istanze verticalmente fino a 64 GiB di RAM e poi scalare orizzontalmente aggiungendo le istanze. | ||
Padrone CPUUtilization la media è >= 50% per 15 minuti, 3 volte consecutive AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
Prendi in considerazione l'utilizzo di tipi di istanze più grandi per i tuoi nodi master dedicati. A causa del loro ruolo nella stabilità e nelle blue/green implementazioni dei cluster, i nodi master dedicati dovrebbero avere un utilizzo medio della CPU inferiore rispetto ai nodi di dati. | ||
Pressione principale JVMMemory il massimo è >= 80% per 15 minuti, 1 volta consecutiva AMS intraprende azioni proattive per ridurre l'impatto operativo, quando viene attivato questo avviso. |
Prendi in considerazione l'utilizzo di tipi di istanze più grandi per i tuoi nodi master dedicati. A causa del loro ruolo nella stabilità e nelle blue/green implementazioni dei cluster, i nodi master dedicati dovrebbero avere un utilizzo medio della CPU inferiore rispetto ai nodi di dati. | ||
OpenSearch istanza |
No |
AutomatedSnapshotFailure il massimo è >= 1 per 1 minuto, 1 volta consecutiva. |
CloudWatch allarme. Uno snapshot automatico ha restituito un errore. Questo errore è spesso il risultato di uno stato del cluster rosso. Vedi Red Cluster Status. |
Istanza Elastic Load Balancing |
No |
SurgeQueueLength > 100 per 1 minuto, 15 volte consecutive. |
CloudWatch allarme se un numero eccessivo di richieste è in attesa di instradamento. |
HTTPCode_ELB_5XX_Count somma > 0 per 5 minuti, 3 volte consecutive. |
CloudWatch allarme relativo al numero eccessivo di codici di risposta HTTP 5XX che provengono dal load balancer. | ||
SpilloverCount > 1 per 1 minuto, 15 volte consecutive. |
CloudWatch allarme se un numero eccessivo di richieste sono state rifiutate perché la coda di sovratensione è piena. | ||
GuardDuty servizio |
Sì |
Non applicabile; tutti i risultati (ai fini della minaccia) vengono monitorati. Ogni risultato corrisponde a un avviso. Modifiche nei GuardDuty risultati. Queste modifiche includono i nuovi risultati generati e le occorrenze successive dei risultati esistenti. |
L'elenco dei tipi di GuardDuty ricerca supportati si trova in GuardDuty Active Finding Types. |
Integrità |
Può variare |
AWS Health Dashboard |
Le notifiche vengono inviate quando ci sono cambiamenti nello stato degli eventi AWS Health Dashboard (AWS Health) in relazione ai servizi di base supportati da AMS. Per ulteriori informazioni, consulta Servizi supportati. |
AWS Managed Microsoft AD |
No |
Stato di Active Directory AWS Managed Microsoft AD l'istanza invia un evento di stato attivo. |
Evento di servizio. Emesso quando la directory funziona normalmente dopo un evento. |
Stato della directory alterato AWS Managed Microsoft AD l'istanza invia un evento di stato della directory alterato. |
Evento di servizio. Emesso quando la directory è in esecuzione in uno stato degradato. Uno o più problemi sono stati rilevati e non tutte le operazioni di directory potrebbero lavorare alla massima capacità operativa. | ||
Stato della directory non utilizzabile AWS Managed Microsoft AD l'istanza invia un evento di stato non utilizzabile. |
Evento di servizio. Emesso quando la directory non è funzionante. Sono stati segnalati problemi per tutti gli endpoint della directory. | ||
Eliminazione dello stato della directory AWS Managed Microsoft AD l'istanza invia un evento di eliminazione dello stato della directory. |
Evento di servizio. Emesso quando la directory viene attualmente eliminata. | ||
Stato della directory non riuscito AWS Managed Microsoft AD l'istanza invia un evento di stato non riuscito. |
Evento di servizio. Emesso quando non è stato possibile creare la directory. | ||
RestoreFailed Stato della directory AWS Managed Microsoft AD l'istanza invia un evento di ripristino non riuscito dello stato della directory. |
Evento di servizio. Emesso durante il ripristino della directory da un'istantanea non riuscito. | ||
Istanza Amazon RDS |
No |
L'avviso Low Storage si attiva quando lo storage allocato per l'istanza DB è esaurito. |
RDS-EVENT-0007, consulta i dettagli in Utilizzo della notifica degli eventi di Amazon RDS. |
Errore dell'istanza DB L'istanza database ha avuto esito negativo a causa di una configurazione non compatibile o di un problema di storage sottostante. Inizia a point-in-time-restore per l'istanza DB. |
Evento di servizio. RDS-EVENT-0031, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Failover non tentato Amazon RDS non sta tentando di effettuare un failover richiesto perché di recente si è verificato un failover nell'istanza database. |
Evento di servizio. RDS-EVENT-0034, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Parametri non validi dell'istanza DB Ad esempio, MySQL non può avviarsi perché un parametro relativo alla memoria è impostato su un valore troppo alto per questa classe di istanza, quindi l'azione del cliente consisterebbe nel modificare il parametro di memoria e riavviare l'istanza DB. |
Evento di servizio. RDS-EVENT-0035, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Istanza DB IDs di sottorete non valida L'istanza database si trova in una rete non compatibile. Alcune delle sottoreti specificate non IDs sono valide o non esistono. |
Evento di servizio. RDS-EVENT-0036, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Errore di lettura della replica dell'istanza DB Si è verificato un errore interno nel processo di replica di lettura. Per ulteriori informazioni, consulta il messaggio di evento. Per informazioni sulla risoluzione degli errori di Read Replica, consulta Risoluzione di un problema di Read Replica di MySQL. |
Evento di servizio. RDS-EVENT-0045, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
La replica di lettura dell'istanza DB è terminata La replica sulla Read Replica è stata terminata. |
Evento di servizio. RDS-EVENT-0057, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Errore durante la creazione dell'account utente statspack Errore durante la creazione dell'account utente Statspack PERFSTAT. Elimina l'account prima di aggiungere l'opzione Statspack. |
Evento di servizio. RDS-EVENT-0058, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Avvio del ripristino dell'istanza DB L'istanza database di SQL Server sta ristabilendo il relativo mirror. Le prestazioni subiranno un peggioramento fino al termine dell'operazione. È stato trovato un database con un modello di recupero non FULL. Il modello di ripristino è stato riportato a FULL ed è stato avviato il ripristino in mirroring. (<dbname>: <recovery model found>[,...]). |
Evento di servizio. RDS-EVENT-0066, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Il failover del cluster di database non è riuscito. |
RDS-EVENT-0069, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Bucket S3 di ripristino delle autorizzazioni non valide Il ruolo IAM utilizzato per accedere al bucket di Amazon S3 per il backup e ripristino nativo di SQL Server non è configurato correttamente. Per ulteriori informazioni, vedere Configurazione per il backup e il ripristino nativi. |
Evento di servizio. RDS-EVENT-0081, categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Aurora non è riuscito a copiare i dati di backup da un bucket Simple Storage Service (Amazon S3). |
RDS-EVENT-0082, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Avviso di storage insufficiente quando l'istanza DB ha consumato più del 90% dello storage allocato |
RDS-EVENT-0089, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Il servizio di notifica durante il ridimensionamento non è riuscito per il cluster DB Aurora Serverless. |
RDS-EVENT-0143, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
L'istanza database è in uno stato non valido. Nessuna operazione richiesta. Il ridimensionamento automatico verrà riprovato in un secondo momento. |
RDS-EVENT-0219, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
L'istanza database ha raggiunto la soglia completa dello storage e il database è stato arrestato. |
RDS-EVENT-0221, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Questo evento indica che la scalabilità automatica dello storage delle istanze RDS non è in grado di scalare. I motivi per cui l'autoscaling non è riuscito possono essere diversi. |
RDS-EVENT-0223, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
La scalabilità automatica dello storage ha attivato un'attività di storage in sospeso che avrebbe raggiunto la soglia massima di storage. |
RDS-EVENT-0224, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Il tipo di archiviazione dell'istanza database non è attualmente disponibile nella zona di disponibilità. Il ridimensionamento automatico verrà riprovato in un secondo momento. |
RDS-EVENT-0237, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
RDS non è stato in grado di allocare la capacità per il proxy perché non ci sono sufficienti indirizzi IP disponibili nelle sottoreti. |
RDS-EVENT-0243, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
Lo storage per il tuo account AWS ha superato la quota di storage consentita. |
RDS-EVENT-0254, consulta i dettagli in Categorie di eventi e messaggi di eventi di Amazon RDS. | ||
CPUUtilization Utilizzo medio della CPU > 90% per 15 minuti, 2 volte consecutive. |
CloudWatch allarme. | ||
DiskQueueDepth La somma è > 75 per 1 minuto, 15 volte consecutive. | |||
FreeStorageSpace Media < 1.073.741.824 byte per 5 minuti, 2 volte consecutive. | |||
SwapUsage Media = 104.857.600 byte per 5 minuti, 2 volte consecutive. | |||
Cluster Amazon Redshift |
No |
RedshiftClusterStatus Lo stato del cluster quando non è in modalità di manutenzione < 1 per 5 minuti. |
1 rappresenta un cluster integro. |
Amazon Macie |
Sì |
Avvisi appena generati e aggiornamenti agli avvisi esistenti. Macie rileva eventuali modifiche nei risultati. Queste modifiche includono i nuovi risultati generati e le occorrenze successive dei risultati esistenti. |
Avviso Amazon Macie. Per un elenco dei tipi di avvisi Macie supportati, consulta Analyzing Amazon Macie Findings. Tieni presente che Macie non è abilitato per tutti gli account. |
AMS intraprende azioni proattive (ridimensionamento del cluster) quando viene attivato questo avviso.
Per informazioni sulle azioni correttive, consulta. Correzione automatica degli avvisi con AMS