Visualizzazione Agente
La visualizzazione Agente offre un pannello di controllo curato per gli agenti del tuo account. Puoi visualizzare i dati degli agenti ospitati su servizi AWS nativi come Runtime AgentCore, Lambda o Amazon EC2. La visualizzazione mostra anche gli agenti che inviano dati di telemetria a CloudWatch.
Panoramica
Le metriche e i pannelli di controllo mostrano i dati provenienti da intervalli di agenti campionati. Per informazioni sugli intervalli degli agenti, consulta Intervalli.
Sono supportate le seguenti metriche Agente:
-
Agenti/alias: numero di agenti e alias instrumentati e intervalli di emissione
-
Sessioni: numero di sessioni create da agenti instrumentati che emettono intervalli. Una sessione è simile a una conversazione e contiene un contesto generale
-
Tracce: numero di tracce create da agenti instrumentati che emettono intervalli. Una traccia è un ciclo individuale di richiesta-risposta all'interno di una sessione
-
Tasso di errore: percentuale di errori nelle interazioni con gli agenti
-
Tasso di limitazione: percentuale di interazioni con agenti limitati
Scegli Visualizza dettagli per visualizzare le metriche dell'agente in forma grafica.
Metriche di runtime
Le metriche e i pannelli di controllo di Runtime visualizzano i dati della primitiva Runtime. Utilizzando questa primitiva, puoi ospitare i tuoi agenti sul runtime Amazon Bedrock AgentCore. Per ulteriori informazioni, consulta Creating an AgentCore Runtime.
Runtime AgentCore supporta queste metriche
-
Agenti/alias di runtime: tiene traccia del numero di agenti e alias ospitati su Runtime AgentCore
-
Sessioni di runtime: tiene traccia del numero di sessioni create dagli agenti in esecuzione in Runtime AgentCore. Una sessione è simile a una conversazione e contiene il contesto generale dell'intero flusso di interazione. Utile per monitorare l'utilizzo complessivo della piattaforma, la pianificazione della capacità e la comprensione degli schemi di coinvolgimento degli utenti
-
Invocazioni di runtime: numero totale di richieste effettuate all'API piano dati. Ogni chiamata API conta come una invocazione, indipendentemente dalla dimensione del payload della richiesta o dallo stato della risposta
-
Errori di runtime: il numero di errori di sistema e dell'utente. Per le definizioni degli errori di sistema e utente, consulta AgentCore provided runtime metrics
-
Limitazioni di runtime: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito. Queste richieste restituiscono ThrottlingException con il codice di stato HTTP 429. Monitora questa metrica per determinare se è necessario rivedere le quote di servizio o ottimizzare gli schemi di richiesta
Visualizza le modifiche delle metriche nel tempo nel pannello di controllo predefinito. Espandi Visualizza dettagli per visualizzare i grafici relativi alle metriche.
Agenti
Gli agenti sono componenti che raccolgono e inviano dati di monitoraggio dalle applicazioni. La tabella Agenti mostra tutti gli agenti configurati nell'account. Questi agenti possono essere ospitati su servizi AWS nativi come Runtime AgentCore, Lambda o Amazon EC2. La tabella mostra anche altri agenti instrumentati per inviare telemetria a CloudWatch.
Puoi utilizzare Filtra agenti per trovare un agente specifico che desideri approfondire oppure i nomi delle colonne per ordinare gli agenti e trovare l'agente richiesto. Seleziona l'icona a forma di ingranaggio per mostrare o nascondere colonne aggiuntive.
È possibile visualizzare i dettagli dell'agente espandendo il nome dell'agente.
Dettagli dell'agente: panoramica
La scheda Panoramica mostra i pannelli di controllo automatici per le metriche degli agenti. Queste metriche provengono da intervalli campionati e da metriche di Runtime (quando l'agente utilizza Runtime AgentCore).
Il pannello di controllo Metriche dell'agente include metriche derivate dagli intervalli campionati:
-
Sessioni e tracce: numero di sessioni e tracce per questo agente
-
Utilizzo del token FM: conteggio totale del consumo di token del modello di fondazione. Puoi filtrare il grafico in un particolare modello di fondazione
-
Errori di sistema e client: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine. Gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste
-
Errori e latenza per intervallo: i tassi di errore e la latenza per un determinato intervallo. Tieni presente che in molti agenti può apparire un intervallo
-
Limitazioni: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito
Il pannello di controllo Metriche di Runtime include le metriche che Runtime AgentCore genera automaticamente:
-
Sessioni e chiamate di runtime: numero di sessioni e invocazioni che questo particolare agente ha generato durante l'hosting su Runtime
-
Latenza di runtime: latenza delle richieste degli agenti ospitati su Runtime
-
Limitazioni di Runtime: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito
Dettagli dell'agente: sessioni
Un agente può avere diverse sessioni. Visualizza la sessione nella scheda Sessioni. Usa Filtra sessioni o ordina le colonne per trovare la sessione richiesta.
Scegli l'ID sessione per visualizzare le metriche di riepilogo della sessione e l'elenco delle tracce appartenenti a quella sessione. Le metriche della sessione includono:
-
Tracce: numero di tracce appartenenti alle sessioni
-
Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine
-
Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste
-
Limitazioni: numero di richieste limitate in relazione a questa sessione a causa del superamento del valore TPS (transazioni al secondo) consentito
-
Dettagli sulle sessioni: metadati sulla sessione come ora di inizio, ora di fine e ID della sessione
Per analizzare un elenco di tracce in una sessione, scegli Filtra tracce per restringere o ordina le colonne della tabella in modo da raggruppare la traccia specifica che desideri esaminare.
Dopo aver selezionato una traccia, il pannello a destra mostra i dettagli della traccia. Per ogni traccia, puoi visualizzare informazioni dettagliate su Riepilogo della traccia, Intervalli e Contenuto della traccia.
Nella sezione Riepilogo della traccia, puoi visualizzare le seguenti metriche:
Nota
I campi della pagina di riepilogo sono coerenti tra la visualizzazione Agente, la visualizzazione Sessioni e la visualizzazione Tracce.
-
Intervalli: il numero di intervalli all'interno di una traccia
-
Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine
-
Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste
-
Limitazioni: numero di richieste limitate in relazione a questa sessione a causa del superamento del valore TPS (transazioni al secondo) consentito
-
Latenza di intervallo P95: la latenza del 95° percentile relativa a tutte le invocazioni di questo particolare intervallo. Tieni presente che un intervallo può essere utilizzato su molti agenti
-
Dettagli della traccia: metadati relativi alla traccia, ad esempio ora di inizio, ora di fine e ID traccia
Scegli Cronologia per visualizzare la durata di ogni intervallo e per comprendere l'intervallo che ha richiesto più tempo e ha contribuito a rallentare la risposta.
Per analizzare le relazioni tra gli intervalli e le chiamate successive, scegli Traiettoria per comprendere la relazione interconnessa tra gli intervalli e le chiamate successive provenienti da tali intervalli.
In Intervalli, seleziona un singolo evento di intervallo per rivedere i dati dell'intervllo nella loro forma originale. Esamina i dati dell'intervallo nella loro forma originale. Per una risoluzione dettagliata dei problemi, seleziona la scheda Eventi per esaminare gli input e gli output del modello.
Dettagli dell'agente: tracce
Ogni agente può avere più tracce. Visualizza i dettagli della traccia nella scheda Tracce. Scegli Filtra le tracce o ordina le colonne per trovare la traccia richiesta.