Visualizzazione Agente - Amazon CloudWatch

Visualizzazione Agente

La visualizzazione Agente offre un pannello di controllo curato per gli agenti del tuo account. Puoi visualizzare i dati degli agenti ospitati su servizi AWS nativi come Runtime AgentCore, Lambda o Amazon EC2. La visualizzazione mostra anche gli agenti che inviano dati di telemetria a CloudWatch.

Panoramica

Le metriche e i pannelli di controllo mostrano i dati provenienti da intervalli di agenti campionati. Per informazioni sugli intervalli degli agenti, consulta Intervalli.

Sono supportate le seguenti metriche Agente:

  • Agenti/alias: numero di agenti e alias instrumentati e intervalli di emissione

  • Sessioni: numero di sessioni create da agenti instrumentati che emettono intervalli. Una sessione è simile a una conversazione e contiene un contesto generale

  • Tracce: numero di tracce create da agenti instrumentati che emettono intervalli. Una traccia è un ciclo individuale di richiesta-risposta all'interno di una sessione

  • Tasso di errore: percentuale di errori nelle interazioni con gli agenti

  • Tasso di limitazione: percentuale di interazioni con agenti limitati

Scegli Visualizza dettagli per visualizzare le metriche dell'agente in forma grafica.

Visualizzazione Agenti

Metriche di runtime

Le metriche e i pannelli di controllo di Runtime visualizzano i dati della primitiva Runtime. Utilizzando questa primitiva, puoi ospitare i tuoi agenti sul runtime Amazon Bedrock AgentCore. Per ulteriori informazioni, consulta Creating an AgentCore Runtime.

Runtime AgentCore supporta queste metriche

  • Agenti/alias di runtime: tiene traccia del numero di agenti e alias ospitati su Runtime AgentCore

  • Sessioni di runtime: tiene traccia del numero di sessioni create dagli agenti in esecuzione in Runtime AgentCore. Una sessione è simile a una conversazione e contiene il contesto generale dell'intero flusso di interazione. Utile per monitorare l'utilizzo complessivo della piattaforma, la pianificazione della capacità e la comprensione degli schemi di coinvolgimento degli utenti

  • Invocazioni di runtime: numero totale di richieste effettuate all'API piano dati. Ogni chiamata API conta come una invocazione, indipendentemente dalla dimensione del payload della richiesta o dallo stato della risposta

  • Errori di runtime: il numero di errori di sistema e dell'utente. Per le definizioni degli errori di sistema e utente, consulta AgentCore provided runtime metrics

  • Limitazioni di runtime: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito. Queste richieste restituiscono ThrottlingException con il codice di stato HTTP 429. Monitora questa metrica per determinare se è necessario rivedere le quote di servizio o ottimizzare gli schemi di richiesta

Visualizza le modifiche delle metriche nel tempo nel pannello di controllo predefinito. Espandi Visualizza dettagli per visualizzare i grafici relativi alle metriche.

Visualizzazione Runtime

Agenti

Gli agenti sono componenti che raccolgono e inviano dati di monitoraggio dalle applicazioni. La tabella Agenti mostra tutti gli agenti configurati nell'account. Questi agenti possono essere ospitati su servizi AWS nativi come Runtime AgentCore, Lambda o Amazon EC2. La tabella mostra anche altri agenti instrumentati per inviare telemetria a CloudWatch.

Puoi utilizzare Filtra agenti per trovare un agente specifico che desideri approfondire oppure i nomi delle colonne per ordinare gli agenti e trovare l'agente richiesto. Seleziona l'icona a forma di ingranaggio per mostrare o nascondere colonne aggiuntive.

Visualizzazione degli agenti di Runtime

È possibile visualizzare i dettagli dell'agente espandendo il nome dell'agente.

Panoramica degli agenti di Runtime

Dettagli dell'agente: panoramica

La scheda Panoramica mostra i pannelli di controllo automatici per le metriche degli agenti. Queste metriche provengono da intervalli campionati e da metriche di Runtime (quando l'agente utilizza Runtime AgentCore).

Il pannello di controllo Metriche dell'agente include metriche derivate dagli intervalli campionati:

  • Sessioni e tracce: numero di sessioni e tracce per questo agente

  • Utilizzo del token FM: conteggio totale del consumo di token del modello di fondazione. Puoi filtrare il grafico in un particolare modello di fondazione

  • Errori di sistema e client: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine. Gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Errori e latenza per intervallo: i tassi di errore e la latenza per un determinato intervallo. Tieni presente che in molti agenti può apparire un intervallo

  • Limitazioni: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito

Il pannello di controllo Metriche di Runtime include le metriche che Runtime AgentCore genera automaticamente:

  • Sessioni e chiamate di runtime: numero di sessioni e invocazioni che questo particolare agente ha generato durante l'hosting su Runtime

  • Latenza di runtime: latenza delle richieste degli agenti ospitati su Runtime

  • Limitazioni di Runtime: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito

Dettagli dell'agente: sessioni

Un agente può avere diverse sessioni. Visualizza la sessione nella scheda Sessioni. Usa Filtra sessioni o ordina le colonne per trovare la sessione richiesta.

Scegli l'ID sessione per visualizzare le metriche di riepilogo della sessione e l'elenco delle tracce appartenenti a quella sessione. Le metriche della sessione includono:

  • Tracce: numero di tracce appartenenti alle sessioni

  • Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine

  • Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Limitazioni: numero di richieste limitate in relazione a questa sessione a causa del superamento del valore TPS (transazioni al secondo) consentito

  • Dettagli sulle sessioni: metadati sulla sessione come ora di inizio, ora di fine e ID della sessione

Per analizzare un elenco di tracce in una sessione, scegli Filtra tracce per restringere o ordina le colonne della tabella in modo da raggruppare la traccia specifica che desideri esaminare.

Dopo aver selezionato una traccia, il pannello a destra mostra i dettagli della traccia. Per ogni traccia, puoi visualizzare informazioni dettagliate su Riepilogo della traccia, Intervalli e Contenuto della traccia.

Nella sezione Riepilogo della traccia, puoi visualizzare le seguenti metriche:

Nota

I campi della pagina di riepilogo sono coerenti tra la visualizzazione Agente, la visualizzazione Sessioni e la visualizzazione Tracce.

  • Intervalli: il numero di intervalli all'interno di una traccia

  • Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine

  • Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Limitazioni: numero di richieste limitate in relazione a questa sessione a causa del superamento del valore TPS (transazioni al secondo) consentito

  • Latenza di intervallo P95: la latenza del 95° percentile relativa a tutte le invocazioni di questo particolare intervallo. Tieni presente che un intervallo può essere utilizzato su molti agenti

  • Dettagli della traccia: metadati relativi alla traccia, ad esempio ora di inizio, ora di fine e ID traccia

Visualizzazione Intervallo

Scegli Cronologia per visualizzare la durata di ogni intervallo e per comprendere l'intervallo che ha richiesto più tempo e ha contribuito a rallentare la risposta.

Visualizzazione Traiettoria

Per analizzare le relazioni tra gli intervalli e le chiamate successive, scegli Traiettoria per comprendere la relazione interconnessa tra gli intervalli e le chiamate successive provenienti da tali intervalli.

In Intervalli, seleziona un singolo evento di intervallo per rivedere i dati dell'intervllo nella loro forma originale. Esamina i dati dell'intervallo nella loro forma originale. Per una risoluzione dettagliata dei problemi, seleziona la scheda Eventi per esaminare gli input e gli output del modello.

Dettagli dell'agente: tracce

Ogni agente può avere più tracce. Visualizza i dettagli della traccia nella scheda Tracce. Scegli Filtra le tracce o ordina le colonne per trovare la traccia richiesta.