Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Visualizzazione dell'agente
La visualizzazione Agente offre una dashboard curata per gli agenti del tuo account. Puoi visualizzare i dati degli agenti ospitati su servizi AWS nativi come AgentCore Runtime, Lambda o Amazon. EC2 La vista mostra anche gli agenti che emettono dati di telemetria a. CloudWatch
Panoramica
Le metriche e i dashboard mostrano i dati provenienti da intervalli di agenti campionati. Per informazioni sugli intervalli degli agenti, consulta Spans.
Sono supportate le seguenti metriche dell'agente:
-
Agenti/alias: numero di agenti e alias strumentati e intervalli di emissione
-
Sessioni: numero di sessioni create da agenti strumentati che emettono intervalli. Una sessione è simile a una conversazione e contiene un contesto generale
-
Tracce: numero di tracce create da agenti strumentati che emettono intervalli. Una traccia è un ciclo individuale di richiesta-risposta all'interno di una sessione
-
Tasso di errore: percentuale di errori nelle interazioni con gli agenti
-
Frequenza di accelerazione: percentuale di interazioni con agenti limitati
Scegli Visualizza dettagli per visualizzare le metriche dell'agente in grafici.

Metriche di runtime
Le metriche e i dashboard di Runtime visualizzano i dati della primitiva Runtime. Utilizzando questa primitiva, puoi ospitare i tuoi agenti sul runtime di Amazon Bedrock AgentCore . Per ulteriori informazioni, consulta Creazione di un AgentCore runtime.
AgentCore Runtime supporta queste metriche
Runtime Agents/Aliases : tiene traccia del numero di agenti e alias ospitati su Runtime AgentCore
Sessioni di runtime: tiene traccia del numero di sessioni create dagli agenti in esecuzione in AgentCore Runtime. Una sessione è simile a una conversazione e contiene l'ampio contesto dell'intero flusso di interazione. Utile per monitorare l'utilizzo complessivo della piattaforma, la pianificazione della capacità e la comprensione dei modelli di coinvolgimento degli utenti
Richiamazioni in fase di esecuzione: numero totale di richieste effettuate all'API Data Plane. Ogni chiamata API conta come una chiamata, indipendentemente dalla dimensione del payload della richiesta o dallo stato della risposta
Errori di runtime: il numero di errori di sistema e dell'utente. Per le definizioni degli errori di sistema e utente, consulta le metriche di runtime AgentCore fornite
Limitazioni di runtime: il numero di richieste limitate dal servizio a causa del superamento del TPS (Transactions Per Second) consentito. Queste richieste restituiscono ThrottlingException il codice di stato HTTP 429. Monitora questa metrica per determinare se è necessario rivedere le quote di servizio o ottimizzare i modelli di richiesta
Visualizza le modifiche delle metriche nel tempo nella dashboard predefinita. Espandi Visualizza dettagli per visualizzare i grafici metrici.

Agents (Agenti)
Gli agenti sono componenti che raccolgono e inviano dati di monitoraggio dalle applicazioni. La tabella Agenti mostra tutti gli agenti configurati nell'account. Questi agenti possono essere ospitati su servizi AWS nativi come AgentCore Runtime, Lambda o Amazon. EC2 La tabella mostra anche altri agenti a cui è possibile inviare dati di telemetria. CloudWatch
Puoi utilizzare gli agenti di filtro per trovare un agente specifico che desideri approfondire oppure puoi anche utilizzare i nomi delle colonne per ordinare gli agenti e trovare l'agente richiesto. Seleziona l'icona a forma di ingranaggio per mostrare o nascondere colonne aggiuntive.

È possibile visualizzare i dettagli dell'agente espandendo il nome dell'agente.

Dettagli sull'agente: panoramica
La scheda Panoramica mostra i dashboard automatici per le metriche degli agenti. Queste metriche provengono da intervalli campionati e da metriche di Runtime (quando l'agente utilizza Runtime). AgentCore
La dashboard delle metriche dell'agente include metriche derivate da intervalli campionati:
Sessioni e tracce: numero di sessioni e tracce per questo agente
Utilizzo del token FM: conteggio totale del consumo di token del Foundational Model. Puoi filtrare il grafico in un particolare modello Foundational
Errori di sistema e client: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'analisi. Gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste
Errori e latenza per intervallo: i tassi di errore e la latenza per un determinato intervallo. Tieni presente che in molti agenti può apparire un intervallo
Limitazioni: numero di richieste limitate dal servizio a causa del superamento del TPS (Transactions Per Second) consentito
La dashboard delle metriche di Runtime include le metriche che Runtime genera automaticamente: AgentCore
Sessioni e chiamate di runtime: numero di sessioni e chiamate che questo particolare agente ha generato durante l'hosting su Runtime
Latenza di runtime: latenza delle richieste degli agenti ospitati su Runtime
Limitazioni di runtime: numero di richieste rallentato dal servizio a causa del superamento del TPS (Transactions Per Second) consentito
Dettagli dell'agente - Sessioni
Un agente può avere diverse sessioni. Visualizza la sessione nella scheda Sessioni. Usa il filtro delle sessioni o ordina le colonne per trovare la sessione richiesta.
Scegli l'ID della sessione per visualizzare le metriche di riepilogo della sessione e l'elenco delle tracce appartenenti a quella sessione. Le metriche della sessione includono:
Tracce: numero di tracce appartenenti alle sessioni
Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'analisi
Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori sul lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste
Limitazioni: numero di richieste limitate relative a questa sessione a causa del superamento del TPS (Transactions Per Second) consentito
Dettagli sulle sessioni: metadati sulla sessione come ora di inizio, ora di fine e ID della sessione
Per analizzare un elenco di tracce in una sessione, scegli Filtra le tracce per restringere o ordina le colonne della tabella in modo da raggruppare la traccia specifica che desideri esaminare.
Dopo aver selezionato una traccia, il riquadro destro mostra i dettagli della traccia. Per ogni Trace, puoi visualizzare il riepilogo di Trace, Spans e i dettagli del contenuto di Trace.
Nella sezione Riepilogo di Trace, puoi visualizzare le seguenti metriche:
Nota
I campi della pagina di riepilogo sono coerenti tra la visualizzazione Agente, la visualizzazione Sessioni e la visualizzazione Traces.
Intervalli: numero di intervalli all'interno di una traccia
Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'analisi
Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori sul lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste
Limitazioni: il numero di richieste relative a questa sessione diminuisce a causa del superamento del TPS (Transactions Per Second) consentito
Latenza di intervallo P95: la latenza del 95 percentile relativa a tutte le chiamate di questo particolare intervallo. Tieni presente che un intervallo può essere utilizzato su molti agenti
Dettagli di tracciamento: metadati relativi alla traccia, ad esempio ora di inizio, ora di fine e Trace ID

Scegliete Cronologia per visualizzare la durata di ogni intervallo e per comprendere l'intervallo che ha richiesto più tempo e ha contribuito a rallentare la risposta.

Per analizzare le relazioni tra gli intervalli e le chiamate successive, scegliete Trajectory per comprendere la relazione interconnessa tra gli intervalli e le chiamate successive provenienti da tali intervalli.
In Spans, selezionate un singolo evento span per rivedere i dati di span nella loro forma originale. Rivedi i dati di span nella loro forma originale. Per una risoluzione dettagliata dei problemi, selezionate la scheda Eventi per esaminare gli input e gli output del modello.
Dettagli dell'agente - Traces
Ogni agente può avere più tracce. Visualizza i dettagli della traccia nella scheda Tracce. Scegli Filtra le tracce o ordina le colonne per trovare la traccia richiesta.