Creazione di un allarme basato su un'origine dati connessa - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un allarme basato su un'origine dati connessa

Puoi creare allarmi che controllano le metriche provenienti da fonti di dati che non sono presenti. CloudWatch Per ulteriori informazioni sulla creazione di connessioni a queste altre origini dati, consulta Recupero dei parametri da altre origini dati.

Per creare un allarme sui parametri da un'origine dati alla quale si è effettuata la connessione
  1. Apri la CloudWatch console all'indirizzo. https://console.aws.amazon.com/cloudwatch/

  2. Nel pannello di navigazione, seleziona Metrics (Parametri), All metrics (Tutti i parametri).

  3. Scegli la scheda Query da più origini.

  4. Per Origine dati, seleziona l'origine dati che desideri utilizzare.

  5. Il generatore di query richiede le informazioni necessarie affinché la query recuperi i parametri da utilizzare per l'allarme. Il flusso di lavoro è diverso per ogni origine dati ed è personalizzato in base a essa. Ad esempio, per le origini dati Amazon Managed Service for Prometheus e le origini dati Prometheus, viene visualizzata una casella di editor di query PromQL con una guida alle query.

  6. Quando hai completato la creazione della query, scegli Query a grafo.

  7. Se il grafico di esempio ha l'aspetto previsto, scegli Crea allarme.

  8. Viene visualizzata la pagina Specifica parametro e condizioni. Se la query che stai usando produce più di una serie temporale, un banner di avviso viene visualizzato nella parte superiore della pagina. In tal caso, seleziona una funzione da utilizzare per aggregare le serie temporali nella funzione di aggregazione.

  9. (Facoltativo) Aggiungi un'etichetta per l'allarme.

  10. Per Whenever your-metric-name is.. , scegli Maggiore, Maggiore/Uguale, Minore/Uguale o Inferiore. Per di . . ., specifica un numero per il valore di soglia.

  11. Scegli Additional configuration (Configurazione aggiuntiva). In Datapoints to Alarm (Punti dati all'allarme), specifica il numero di periodi di valutazione (punti dati) che devono essere nello stato ALARM per attivare l'allarme. Se i due valori corrispondono, crea un allarme che passa nello stato ALARM se si verifica una violazione durante tali periodi consecutivi.

    Per creare un allarme M di N, specifica un numero del primo valore inferiore a quello del secondo valore. Per ulteriori informazioni, consulta Valutazione di un allarme.

  12. Per Missing data treatment (Trattamento dati mancanti), scegli la modalità di comportamento dell'allarme quando mancano alcuni punti dati. Per ulteriori informazioni, consulta Configurazione del modo in cui gli allarmi trattano i dati mancanti CloudWatch .

  13. Scegli Next (Successivo).

  14. Per Notifica, seleziona un argomento Amazon SNS per segnalare quando l'allarme passa allo stato ALARM, OK o INSUFFICIENT_DATA.

    1. (Facoltativo) Per fare in modo che l'allarme invii più notifiche per lo stesso stato di allarme o per stati di allarme diversi, scegli Add notification (Aggiungi notifica).

      Nota

      Ti consigliamo di impostare l'allarme in modo da intervenire quando entra in stato Dati insufficienti oltre a quando entra in stato Allarme. Questo perché molti problemi relativi alla funzione Lambda che si connette all'origine dati possono causare il passaggio dell'allarme a Dati insufficienti.

    2. (Facoltativo) Per fare in modo che l'allarme non invii notifiche Amazon SNS, scegli Rimuovi.

  15. Per fare in modo che l'allarme esegua azioni Auto Scaling, Lambda o Systems Manager, scegli il pulsante appropriato e scegli lo stato dell'allarme e l'azione da eseguire. Se scegli una funzione Lambda come operazione di allarme, specifichi il nome della funzione o l'ARN e, facoltativamente, puoi scegliere una versione specifica della funzione.

    Gli allarmi possono eseguire le operazioni Systems Manager solo quando entrano nello stato ALARM. Per ulteriori informazioni sulle azioni di Systems Manager, vedere Configurazione per la creazione CloudWatch OpsItems da allarmi e Creazione di incidenti.

    Nota

    Per creare un allarme che esegua un'operazione SSM Incident Manager, è necessario disporre di determinate autorizzazioni. Per ulteriori informazioni, vedere Esempi di policy basate sull'identità per AWS Systems Manager Incident Manager.

  16. Scegli Next (Successivo).

  17. In Add a description (Aggiungere una descrizione), immetti un nome e una descrizione per l'allarme e scegli Next (Successivo). Il nome deve contenere solo caratteri UTF-8 e non può contenere caratteri di controllo ASCII. La descrizione può includere la formattazione del markdown, che viene visualizzata solo nella scheda Dettagli dell'allarme nella console. CloudWatch Il markdown può essere utile per aggiungere collegamenti ai runbook o ad altre risorse interne.

    Suggerimento

    Il nome dell'allarme deve contenere solo caratteri UTF-8. Non può contenere caratteri di controllo ASCII.

  18. In Preview and create (Visualizza anteprima e crea), conferma che le informazioni e le condizioni dell'allarme sono quelle desiderate, quindi scegli Create alarm (Crea allarme).

Dettagli sugli allarmi per le origini dati connesse

  • Quando CloudWatch valuta un allarme, lo fa ogni minuto, anche se il periodo dell'allarme è più lungo di un minuto. Affinché l'allarme funzioni, la funzione Lambda deve essere in grado di restituire un elenco di timestamp a partire da un minuto qualsiasi, non solo da multipli della durata del periodo. Questi timestamp devono essere distanziati di un periodo.

    Pertanto, se l'origine dati interrogata da Lambda può restituire solo timestamp multipli della durata del periodo, la funzione dovrebbe “ricampionare” i dati recuperati in modo che corrispondano ai timestamp previsti dalla richiesta. GetMetricData

    Ad esempio, un allarme con un periodo di cinque minuti viene valutato ogni minuto utilizzando finestre di cinque minuti che si spostano di un minuto ogni volta. In questo caso:

    • Per la valutazione dell'allarme alle 12:15:00, CloudWatch prevede punti dati con timestamp pari a, e. 12:00:00 12:05:00 12:10:00

    • Quindi, per la valutazione dell'allarme alle 12:16, si CloudWatch aspetta punti dati con timestamp di, e. 12:01:00 12:06:00 12:11:00

  • Quando CloudWatch valuta un allarme, tutti i punti dati restituiti dalla funzione Lambda che non sono in linea con i timestamp previsti vengono eliminati e l'allarme viene valutato utilizzando i punti dati previsti rimanenti. Ad esempio, quando l'allarme viene valutato alle 12:15:00, prevede dati con timestamp pari di 12:00:00, 12:05:00 e 12:10:00. Se riceve dati con timestamp pari a,, e 12:00:00 12:05:00 12:06:0012:10:00, i dati da 12:06:00 vengono eliminati e valuta l'allarme utilizzando gli altri timestamp. CloudWatch

    Quindi, per la valutazione successiva alle 12:16:00, prevede dati con timestamp di 12:01:00, 12:06:00 e 12:11:00. Se ha solo i dati con timestamp di 12:00:00, 12:05:00 e 12:10:00, tutti questi punti dati vengono ignorati alle 12:16:00 e l'allarme passa allo stato in base a come è stato specificato che tratti i dati mancanti. Per ulteriori informazioni, consulta Valutazione di un allarme.

  • Ti consigliamo di creare questi allarmi per intraprendere azioni durante la transizione allo stato INSUFFICIENT_DATA, poiché diversi casi d'uso di errori della funzione Lambda faranno passare l'allarme a INSUFFICIENT_DATA indipendentemente dal modo in cui è stato specificato che tratti i dati mancanti.

  • Se la funzione Lambda restituisce un errore:

    • Se c'è un problema di autorizzazione con la chiamata alla funzione Lambda, l'allarme inizia ad presentare transizioni di dati mancanti in base a come è stato specificato che tratti i dati mancanti al momento della creazione.

    • Qualsiasi altro errore proveniente dalla funzione Lambda causa il passaggio dell'allarme a INSUFFICIENT_DATA.

  • Se la funzione Lambda restituisce dati parziali:

    • L'allarme continua a essere valutato sui punti dati restituiti.

    • Puoi utilizzare i seguenti metodi per scoprire se un allarme su una funzione Lambda sta attualmente valutando il suo stato di allarme in base a dati parziali:

      • Nella console, scegli un allarme e scegli la pagina Dettagli. Se viene visualizzato il messaggio Avviso di valutazione: in quella pagina viene visualizzato il messaggio Avviso di valutazione: non si tratta di valutare tutti i dati, significa che si tratta di una valutazione in base a dati parziali.

      • Se vedi il valore PARTIAL_DATA nel EvaluationState campo quando usi il describe-alarms AWS CLI comando o l' DescribeAlarms API, significa che si tratta di una valutazione su dati parziali.

    • Un allarme pubblica anche gli eventi su Amazon EventBridge quando passa allo stato parziale dei dati.

  • Se il parametro richiesto dalla funzione Lambda presenta un certo ritardo che provoca sempre la mancanza dell'ultimo punto dati, è necessario utilizzare una soluzione alternativa. È possibile creare un allarme M di N o aumentare il periodo di valutazione dell'allarme. Per ulteriori informazioni sugli allarmi M di N, consulta Valutazione di un allarme.