Visualizzazione dell'agente - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Visualizzazione dell'agente

La visualizzazione Agente offre una dashboard curata per gli agenti del tuo account. Puoi visualizzare i dati degli agenti ospitati su servizi AWS nativi come AgentCore Runtime, Lambda o Amazon. EC2 La vista mostra anche gli agenti che emettono dati di telemetria a. CloudWatch

Panoramica

Le metriche e i dashboard mostrano i dati provenienti da intervalli di agenti campionati. Per informazioni sugli intervalli degli agenti, consulta Spans.

Sono supportate le seguenti metriche dell'agente:

  • Agenti/alias: numero di agenti e alias strumentati e intervalli di emissione

  • Sessioni: numero di sessioni create da agenti strumentati che emettono intervalli. Una sessione è simile a una conversazione e contiene un contesto generale

  • Tracce: numero di tracce create da agenti strumentati che emettono intervalli. Una traccia è un ciclo individuale di richiesta-risposta all'interno di una sessione

  • Tasso di errore: percentuale di errori nelle interazioni con gli agenti

  • Frequenza di accelerazione: percentuale di interazioni con agenti limitati

Scegli Visualizza dettagli per visualizzare le metriche dell'agente in grafici.

Visualizzazione degli agenti

Metriche di runtime

Le metriche e i dashboard di Runtime visualizzano i dati della primitiva Runtime. Utilizzando questa primitiva, puoi ospitare i tuoi agenti sul runtime di Amazon Bedrock AgentCore . Per ulteriori informazioni, consulta Creazione di un AgentCore runtime.

AgentCore Runtime supporta queste metriche

  • Runtime Agents/Aliases : tiene traccia del numero di agenti e alias ospitati su Runtime AgentCore

  • Sessioni di runtime: tiene traccia del numero di sessioni create dagli agenti in esecuzione in AgentCore Runtime. Una sessione è simile a una conversazione e contiene l'ampio contesto dell'intero flusso di interazione. Utile per monitorare l'utilizzo complessivo della piattaforma, la pianificazione della capacità e la comprensione dei modelli di coinvolgimento degli utenti

  • Richiamazioni in fase di esecuzione: numero totale di richieste effettuate all'API Data Plane. Ogni chiamata API conta come una chiamata, indipendentemente dalla dimensione del payload della richiesta o dallo stato della risposta

  • Errori di runtime: il numero di errori di sistema e dell'utente. Per le definizioni degli errori di sistema e utente, consulta le metriche di runtime AgentCore fornite

  • Limitazioni di runtime: il numero di richieste limitate dal servizio a causa del superamento del TPS (Transactions Per Second) consentito. Queste richieste restituiscono ThrottlingException il codice di stato HTTP 429. Monitora questa metrica per determinare se è necessario rivedere le quote di servizio o ottimizzare i modelli di richiesta

Visualizza le modifiche delle metriche nel tempo nella dashboard predefinita. Espandi Visualizza dettagli per visualizzare i grafici metrici.

Visualizzazione in fase di esecuzione

Agents (Agenti)

Gli agenti sono componenti che raccolgono e inviano dati di monitoraggio dalle applicazioni. La tabella Agenti mostra tutti gli agenti configurati nell'account. Questi agenti possono essere ospitati su servizi AWS nativi come AgentCore Runtime, Lambda o Amazon. EC2 La tabella mostra anche altri agenti a cui è possibile inviare dati di telemetria. CloudWatch

Puoi utilizzare gli agenti di filtro per trovare un agente specifico che desideri approfondire oppure puoi anche utilizzare i nomi delle colonne per ordinare gli agenti e trovare l'agente richiesto. Seleziona l'icona a forma di ingranaggio per mostrare o nascondere colonne aggiuntive.

Visualizzazione degli agenti di runtime

È possibile visualizzare i dettagli dell'agente espandendo il nome dell'agente.

Panoramica degli agenti di runtime

Dettagli sull'agente: panoramica

La scheda Panoramica mostra i dashboard automatici per le metriche degli agenti. Queste metriche provengono da intervalli campionati e da metriche di Runtime (quando l'agente utilizza Runtime). AgentCore

La dashboard delle metriche dell'agente include metriche derivate da intervalli campionati:

  • Sessioni e tracce: numero di sessioni e tracce per questo agente

  • Utilizzo del token FM: conteggio totale del consumo di token del Foundational Model. Puoi filtrare il grafico in un particolare modello Foundational

  • Errori di sistema e client: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'analisi. Gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Errori e latenza per intervallo: i tassi di errore e la latenza per un determinato intervallo. Tieni presente che in molti agenti può apparire un intervallo

  • Limitazioni: numero di richieste limitate dal servizio a causa del superamento del TPS (Transactions Per Second) consentito

La dashboard delle metriche di Runtime include le metriche che Runtime genera automaticamente: AgentCore

  • Sessioni e chiamate di runtime: numero di sessioni e chiamate che questo particolare agente ha generato durante l'hosting su Runtime

  • Latenza di runtime: latenza delle richieste degli agenti ospitati su Runtime

  • Limitazioni di runtime: numero di richieste rallentato dal servizio a causa del superamento del TPS (Transactions Per Second) consentito

Dettagli dell'agente - Sessioni

Un agente può avere diverse sessioni. Visualizza la sessione nella scheda Sessioni. Usa il filtro delle sessioni o ordina le colonne per trovare la sessione richiesta.

Scegli l'ID della sessione per visualizzare le metriche di riepilogo della sessione e l'elenco delle tracce appartenenti a quella sessione. Le metriche della sessione includono:

  • Tracce: numero di tracce appartenenti alle sessioni

  • Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'analisi

  • Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori sul lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Limitazioni: numero di richieste limitate relative a questa sessione a causa del superamento del TPS (Transactions Per Second) consentito

  • Dettagli sulle sessioni: metadati sulla sessione come ora di inizio, ora di fine e ID della sessione

Per analizzare un elenco di tracce in una sessione, scegli Filtra le tracce per restringere o ordina le colonne della tabella in modo da raggruppare la traccia specifica che desideri esaminare.

Dopo aver selezionato una traccia, il riquadro destro mostra i dettagli della traccia. Per ogni Trace, puoi visualizzare il riepilogo di Trace, Spans e i dettagli del contenuto di Trace.

Nella sezione Riepilogo di Trace, puoi visualizzare le seguenti metriche:

Nota

I campi della pagina di riepilogo sono coerenti tra la visualizzazione Agente, la visualizzazione Sessioni e la visualizzazione Traces.

  • Intervalli: numero di intervalli all'interno di una traccia

  • Errori del server: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'analisi

  • Errori del client: gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori sul lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Limitazioni: il numero di richieste relative a questa sessione diminuisce a causa del superamento del TPS (Transactions Per Second) consentito

  • Latenza di intervallo P95: la latenza del 95 percentile relativa a tutte le chiamate di questo particolare intervallo. Tieni presente che un intervallo può essere utilizzato su molti agenti

  • Dettagli di tracciamento: metadati relativi alla traccia, ad esempio ora di inizio, ora di fine e Trace ID

Visualizzazione Span

Scegliete Cronologia per visualizzare la durata di ogni intervallo e per comprendere l'intervallo che ha richiesto più tempo e ha contribuito a rallentare la risposta.

Vista della traiettoria

Per analizzare le relazioni tra gli intervalli e le chiamate successive, scegliete Trajectory per comprendere la relazione interconnessa tra gli intervalli e le chiamate successive provenienti da tali intervalli.

In Spans, selezionate un singolo evento span per rivedere i dati di span nella loro forma originale. Rivedi i dati di span nella loro forma originale. Per una risoluzione dettagliata dei problemi, selezionate la scheda Eventi per esaminare gli input e gli output del modello.

Dettagli dell'agente - Traces

Ogni agente può avere più tracce. Visualizza i dettagli della traccia nella scheda Tracce. Scegli Filtra le tracce o ordina le colonne per trovare la traccia richiesta.