Utilizzo del gruppo di indagine per esaminare i problemi operativi nell'ambiente
Indice
Creazione di un'indagine da una pagina della console AWS
Puoi avviare un'indagine da diverse console AWS, tra cui, ad esempio, le pagine degli allarmi di CloudWatch, le pagine delle metriche di CloudWatch e le pagine di monitoraggio Lambda.
Per avviare un'indagine da una pagina della console AWS
-
Nella pagina della console, seleziona il grafico della metrica o dell'allarme che desideri esaminare.
-
Se nella parte superiore della pagina è presente il pulsante Indaga, selezionalo e scegli Avvia una nuova indagine.
Altrimenti, scegli l'icona del menu con i puntini di sospensione verticali
per la metrica e scegli Indaga, Avvia una nuova indagine. -
Nel pannello Indagine, inserisci un nome per l'indagine in Titolo della nuova indagine e, facoltativamente, inserisci delle note sulla metrica o sull'allarme selezionato.
-
Nella sezione Ora approssimativa di inizio dell'impatto, CloudWatch Investigations consiglia un timestamp per l'analisi in base alla telemetria selezionata. Per modificare il timestamp dell'indagine, aggiorna la data e l'ora.
-
Quindi scegli Avvia indagine.
L'indagine ha inizio. CloudWatch Investigations analizza i dati di telemetria per trovare i dati che potrebbero essere associati a questa situazione.
-
Per spostare i dati delle indagini nel pannello più grande, scegli Apri a pagina intera.
-
Per istruzioni dettagliate sui passaggi che puoi eseguire mentre continui l'indagine, consulta Visualizzare e continuare un'indagine aperta.
Creazione di un'indagine da un obiettivo del livello di servizio (SLO) di CloudWatch Application Signals
Puoi avviare un'indagine da un obiettivo del livello di servizio (SLO) di CloudWatch Application Signals.
Per avviare un'indagine da un obiettivo del livello di servizio (SLO) di CloudWatch Application Signals
Apri la console CloudWatch all'indirizzo https://console.aws.amazon.com/cloudwatch/
. -
Vai alla pagina della console Applications Signals (APM), Obiettivi del livello di servizio (SLO).
-
Seleziona una voce dall'elenco Obiettivi del livello di servizio (SLO) per visualizzare le metriche disponibili per tale SLO.
-
Seleziona una metrica, quindi scegli Indaga dal menu Operazione.
In alternativa, nella visualizzazione della metrica che desideri analizzare, accanto al menu Altro
, seleziona l'icona IA
per avviare un'indagine.Nota
Se non hai configurato le indagini operative nel tuo account, l'icona IA apre il pannello Risoluzione dei problemi operativi. Seleziona Inizia per configurare un gruppo di indagine, quindi continua.
-
Nel pannello Risoluzione dei problemi operativi di Indagine, in Titolo dell'indagine, inserisci un nome per l'indagine e, facoltativamente, inserisci delle note sulla metrica selezionata.
-
Nella sezione Ora approssimativa di inizio dell'impatto, CloudWatch Investigations consiglia un timestamp per l'analisi in base alla telemetria selezionata. Per modificare il timestamp dell'indagine, aggiorna la data e l'ora.
-
Quindi scegli Avvia indagine.
L'indagine ha inizio. CloudWatch Investigations analizza i dati di telemetria per trovare i dati che potrebbero essere associati a questa situazione.
-
Per spostare i dati delle indagini nel pannello più grande, scegli Apri a pagina intera.
-
Per istruzioni dettagliate sui passaggi che puoi eseguire mentre continui l'indagine, consulta Visualizzare e continuare un'indagine aperta.
Creazione di un'indagine dalla chat di Amazon Q
Puoi porre domande sui problemi della tua implementazione nella chat di Amazon Q. Puoi porre domande come “Perché questa funzione Lambda oggi è lenta?”
In tal caso, Amazon Q potrebbe porre domande di follow-up ed eseguire un controllo dell'integrità in relazione al problema. Dopo il controllo dell'integrità, la chat ti chiederà se desideri avviare un'indagine.
Per ulteriori informazioni e altre domande di esempio, consulta Chatting with Amazon Q about AWS.
Per istruzioni dettagliate sui passaggi che puoi eseguire mentre continui l'indagine dopo che è stata avviata, consulta Visualizzare e continuare un'indagine aperta.
Creazione di un'indagine a partire da un'operazione di allarme CloudWatch
Quando crei un allarme CloudWatch, è possibile specificare che avvii automaticamente un'indagine quando entra in stato ALARM. È possibile fare ciò sia per gli allarmi delle metriche sia per gli allarmi compositi. Per ulteriori informazioni, consultare Avvio di un'indagine CloudWatch a partire da un allarme, Creare un allarme CloudWatch basato su una soglia statica e Creazione di un allarme composito.
Visualizzare e continuare un'indagine aperta
Utilizza i passaggi riportati in questa sezione per visualizzare e continuare l'indagine esistente
Per visualizzare e continuare un'indagine
-
Se non sei ancora nella pagina dedicata all'indagine, procedi come segue:
Apri la console CloudWatch all'indirizzo https://console.aws.amazon.com/cloudwatch/
. -
Nel pannello di navigazione a sinistra, scegli Operazioni di IA, Indagini.
-
Scegli il nome dell'indagine.
-
La sezione Feed mostra gli elementi che sono stati aggiunti agli esiti dell'indagine, inclusa la metrica o l'allarme originariamente selezionati per avviare l'indagine.
Il pannello sulla destra include delle schede. Scegli la scheda Suggerimenti.
-
La scheda Suggerimenti mostra le osservazioni di altri dati di telemetria rilevati da CloudWatch Investigations che potrebbero essere correlati all'indagine. Potrebbe includere anche delle ipotesi, che sono possibili ragioni o cause principali che CloudWatch Investigations ha individuato per la situazione.
CloudWatch Investigations scrive sia le osservazioni sia le ipotesi in linguaggio naturale.
A questo scopo, sono disponibili numerose opzioni:
-
Per ogni suggerimento, puoi scegliere Accetta o Elimina.
Quando scegli Accetta, il suggerimento viene aggiunto alla sezione Feed e CloudWatch Investigations utilizza queste informazioni per indirizzare ulteriori scansioni e suggerimenti.
Se scegli Elimina, il suggerimento viene spostato nella scheda Eliminati.
-
Per ogni suggerimento relativo al tipo di osservazione, puoi scegliere di espandere il grafico nella scheda Suggerimenti o di aprirlo nella console CloudWatch per visualizzare ulteriori dettagli al riguardo.
-
Alcune delle osservazioni potrebbero essere il risultato di query di Approfondimenti di CloudWatch Logs eseguite da CloudWatch Investigations nell'ambito dell'indagine. Quando un'osservazione è il risultato di una query di Approfondimenti di CloudWatch Logs, la query stessa viene visualizzata come parte dell'osservazione. È possibile modificare la query ed eseguirla nuovamente. A tale scopo, scegli l'icona del menu con i puntini di sospensione verticali
accanto ai risultati, quindi scegli Apri in Approfondimenti di Logs. Per ulteriori informazioni consulta Analisi dei dati di log con CloudWatch Logs Insights. -
Se sai che la telemetria in un servizio AWS potrebbe essere applicabile a questa indagine, puoi accedere alla console di quel servizio e aggiungere la telemetria all'indagine. Ad esempio, per aggiungere una metrica Lambda all'indagine, puoi effettuare quanto segue:
-
Apri la console Lambda.
-
Nella sezione Monitoraggio, individua la metrica.
-
Apri il menu contestuale con i puntini di sospensione verticali
per la metrica, scegli Indagine, Aggiungi all'indagine. Quindi, nel pannello Indagine, seleziona il nome dell'indagine.
-
-
Quando visualizzi un'ipotesi nella scheda Suggerimenti, puoi scegliere Mostra ragionamento per visualizzare i dati utilizzati da CloudWatch Investigations per generare l'ipotesi. Per le ipotesi che coinvolgono più risorse, puoi anche vedere una rappresentazione visiva che mostra le relazioni causali tra le risorse sotto forma di nodi connessi.
-
Puoi scegliere la scheda Eliminati e visualizzare i suggerimenti che sono stati eliminati in precedenza. Per aggiungerne uno agli esiti, scegli Ripristina agli esiti.
-
Per aggiungere note agli esiti, scegli Nuova nota nel pannello Feed. Quindi inserisci le tue note e scegli Aggiungi.
-
-
Quando aggiungi un'ipotesi all'area Feed, potrebbe essere visualizzato Mostra operazioni suggerite. In tal caso, selezionando questa opzione vengono visualizzate le operazioni che è possibile intraprendere, supponendo che l'ipotesi relativa al problema sia corretta. Le possibili operazioni includono quanto segue:
-
I Suggerimenti relativi alla documentazione sono collegamenti alla documentazione di AWS che possono aiutarti a comprendere il problema su cui stai lavorando e a risolverlo. Per visualizzare la documentazione suggerita, scegli il relativo collegamento Rivedi
-
I suggerimenti sui runbook sono suggerimenti che sfruttano i runbook predefiniti in Automazione Systems Manager. Ogni runbook definisce una serie di passaggi per eseguire un'attività su una risorsa AWS.
Importante
L'esecuzione di un runbook di Automazione è a pagamento. Tuttavia, CloudWatch Investigations ti offre un'anteprima delle operazioni intraprese da un runbook suggerito, offrendoti l'opportunità di valutare meglio se eseguire il runbook. Per informazioni sui prezzi di Automazione, consulta Prezzi AWS Systems Manager di Automazione
. Per informazioni su come proseguire con un'operazione di runbook, consulta Revisione ed esecuzione delle correzioni suggerite dai runbook per CloudWatch Investigations prima di continuare con il passaggio successivo di questa procedura.
-
-
Per terminare un'indagine, scegli Termina indagine e, facoltativamente, aggiungi le note finali. Quindi scegli Save (Salva).
Lo stato dell'indagine cambia in Archiviata. È possibile riavviare le indagini archiviate aprendo la pagina delle indagini e selezionando Riavvia l'indagine.
Ti consigliamo di non lasciare le indagini aperte a tempo indeterminato, perché le transizioni di stato di allarme relative all'indagine continueranno a essere aggiunte all'indagine finché sarà aperta.
Nota
A un certo punto, potresti vedere il messaggio Analisi completata. Indagine conclusa. visualizzato sopra l'area Feed. Se successivamente aggiungi altra telemetria agli esiti, questo messaggio cambia e CloudWatch Investigations ricomincia a scansionare la telemetria sulla base dei nuovi dati che hai aggiunto agli esiti.
Revisione ed esecuzione delle correzioni suggerite dai runbook per CloudWatch Investigations
Quando aggiungi un'ipotesi all'area Feed di un'indagine attiva, CloudWatch Investigations potrebbe visualizzare Mostra operazioni suggerite. Un'operazione suggerita potrebbe essere quella di visualizzare la documentazione, con delle informazioni per aiutarti a risolvere un problema manualmente.
Un altro suggerimento potrebbe essere quello di utilizzare un runbook di Automazione per tentare di risolvere automaticamente il problema. Automazione è una funzionalità di Systems Manager, un altro Servizio AWS. I runbook di Automazione definiscono una serie di passaggi, od operazioni, da eseguire sulle risorse selezionate. Ogni runbook è progettato per risolvere un problema specifico. I runbook possono soddisfare diverse esigenze operative, quali creazione, riparazione, riconfigurazione, installazione, risoluzione dei problemi, correzione, duplicazione e altro ancora. Per ulteriori informazioni su Automazione, consulta Integrazione con Automazione AWS Systems Manager.
Prima di iniziare
Prima di utilizzare i runbook di Automazione in un'indagine, è necessario essere a conoscenza delle seguenti considerazioni importanti:
-
La scelta di eseguire il runbook comporta dei costi. Per informazioni, consulta Prezzi di AWS Systems Manager
. -
Le cause principali e i suggerimenti sui runbook si basano sul ragionamento automatico e sui servizi di intelligenza artificiale generativa.
Importante
L'utente è responsabile delle operazioni derivanti dall'esecuzione dei passaggi del runbook e della scelta dei valori dei parametri immessi durante l'esecuzione del runbook. Potrebbe essere necessario modificare il runbook consigliato per assicurarsi che funzioni come previsto. Per ulteriori informazioni, consulta Policy sull'IA responsabile di AWS
. -
A seconda del runbook, potrebbe essere necessario immettere i valori per Parametri di input del runbook prima che l'esecuzione possa essere eseguita.
-
Il runbook viene eseguito utilizzando le autorizzazioni IAM assegnate all'operatore. Se necessario, accedi con autorizzazioni IAM differenti per eseguire il runbook. Oltre alle autorizzazioni per le operazioni da intraprendere, per eseguire i passaggi del runbook sono necessarie autorizzazioni aggiuntive di Systems Manager. Per ulteriori informazioni, consulta Setting up Automation nella Guida per l'utente di AWS Systems Manager.
Per esaminare ed eseguire le operazioni di runbook suggerite per CloudWatch Investigations
-
Per visualizzare le informazioni su un runbook consigliato, scegli Rivedi per ottenere informazioni su come eseguire i passaggi del runbook.
Nella pagina dei dettagli dell'indagine, scegli Suggerimenti.
-
Nel pannello Suggerimenti, esamina l'elenco delle ipotesi basate sull'analisi del sistema del problema in esame.
Per ogni ipotesi, puoi scegliere tra le seguenti opzioni:
-
Mostra ragionamento: visualizza ulteriori informazioni sul motivo per cui il sistema ha generato l'ipotesi.
-
Visualizza operazioni: visualizza le operazioni suggerite per il problema. Non tutte le ipotesi includono operazioni suggerite.
-
Accetta: accetta l'ipotesi e aggiungila alla sezione Feed dell'indagine.
Nota
L'accettazione dell'ipotesi non comporta l'esecuzione automatica della soluzione di runbook associata. È possibile visualizzare i runbook suggeriti prima di accettare un'ipotesi, ma è necessario accettare l'ipotesi per eseguire un runbook.
-
Ignora: respingi l'ipotesi senza approfondirla ulteriormente.
-
-
Dopo aver scelto Visualizza operazione, nel pannello Operazioni suggerite, esamina l'elenco delle operazioni suggerite che puoi intraprendere per risolvere il problema. Le operazioni suggerite possono includere uno o più dei seguenti:
-
Articoli di conoscenza AWS: fornisce informazioni sulle procedure che è possibile eseguire per risolvere manualmente il problema, oltre a un collegamento a ulteriori informazioni.
-
Documentazione AWS: fornisce agli utenti collegamenti agli argomenti della documentazione relativi al problema.
-
Runbook di proprietà di AWS: elenca uno o più runbook di Automazione gestiti da AWS che è possibile eseguire per tentare di risolvere i problemi.
-
Runbook di tua proprietà: elenca uno o più runbook di Automazione personalizzati, creati da te o da qualcun altro all'interno del tuo account o della tua organizzazione, che puoi eseguire per tentare di risolvere i problemi.
Nota
Il sistema genera automaticamente questo elenco di runbook valutando le parole chiave nei runbook personalizzati e confrontandole con i termini relativi al problema oggetto di indagine.
Un numero maggiore di corrispondenze di parole chiave indica che un determinato runbook personalizzato appare più in alto nell'elenco dei Runbook di tua proprietà.
-
-
Dopo aver valutato l'ipotesi, puoi esaminare ulteriormente un'operazione specifica suggerita e leggere la documentazione correlata scegliendo Ulteriori informazioni. Puoi anche scegliere Rivedi i dettagli per esaminare i runbook suggeriti di proprietà di AWS e di tua proprietà.
-
Quando scegli Rivedi i dettagli per i runbook, procedi come segue:
-
In Descrizione del runbook, rivedi il contenuto, che fornisce una panoramica delle operazioni che il runbook può intraprendere per correggere il problema oggetto dell'indagine. Scegli Visualizza passaggi per visualizzare il flusso di lavoro del runbook e approfondire i dettagli dei singoli passaggi.
-
Per Parametri di input, specifica i valori per i parametri richiesti dal runbook. Questi parametri variano da runbook a runbook.
-
In Anteprima di esecuzione, rivedi attentamente le informazioni. Queste informazioni spiegano quale sarebbe l'ambito e l'impatto se si scegliesse di eseguire il runbook.
Il contenuto di Anteprima di esecuzione fornisce le seguenti informazioni:
-
In quante account e Regioni verrebbe eseguita l'operazione del runbook.
-
I tipi di operazioni che verrebbero intraprese e quante di ciascun tipo.
I tipi di operazioni includono quanto segue:
-
Mutating: una fase di runbook apporterebbe modifiche alle destinazioni tramite operazioni che creano, modificano o eliminano risorse. -
Non-Mutating: una fase del runbook recupererebbe i dati sulle risorse, non apportandoci nessuna modifica. Questa categoria include generalmenteDescribe,List,Gete simili operazioni API di sola lettura. -
Undetermined: una fase indeterminata richiama le esecuzioni eseguite da un altro servizio di orchestrazione come AWS Lambda, AWS Step Functions o Run Command, una funzionalità di AWS Systems Manager. Un'ulteriore fase indeterminata richiamare anche un'API di terze parti o esegue uno script Python o PowerShell. Systems Manager Automation non è in grado di rilevare quale sarebbe il risultato dei processi di orchestrazione o delle esecuzioni di API di terze parti, pertanto non li valuta. È necessario esaminare manualmente i risultati di tali fasi per determinarne l'impatto.
Per informazioni sulle operazioni supportate e sui relativi tipi di impatto, consulta Remediation impact types of runbook actions nella Guida per l'utente di AWS Systems Manager.
-
-
-
quindi esamina attentamente le informazioni di anteprima prima di decidere se procedere.
In questo caso, è possibile scegliere una delle seguenti operazioni:
-
Arresta il runbook senza eseguirlo.
-
Modifica i parametri di input prima di eseguire il runbook.
-
Esegui il runbook con le opzioni già selezionate.
-
Importante
La scelta di eseguire il runbook comporta dei costi. Per informazioni, consulta Prezzi di AWS Systems Manager
. -
-
Se vuoi eseguire il runbook, scegli Esegui.
Se hai già accettato l'ipotesi, l'esecuzione viene avviata.
Se non hai ancora accettato l'ipotesi, viene visualizzata una finestra di dialogo che richiede di accettarla prima dell'esecuzione.
Dopo aver scelto Esegui per un runbook, l'operazione viene aggiunta al pannello Feed dell'indagine. Dall'indagine, puoi monitorare i nuovi dati nelle metriche degli esiti per vedere se le operazioni del runbook stanno risolvendo il problema.