Visualizzazione Agente - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Visualizzazione Agente

La visualizzazione Agente offre un pannello di controllo curato per gli agenti del tuo account. Puoi visualizzare i dati degli agenti ospitati su servizi AWS nativi come AgentCore Runtime, Lambda o Amazon. EC2 La vista mostra anche gli agenti che emettono dati di telemetria a. CloudWatch

Panoramica

Le metriche e i pannelli di controllo mostrano i dati provenienti da intervalli di agenti campionati. Per informazioni sugli intervalli degli agenti, consulta Intervalli.

Sono supportate le seguenti metriche Agente:

  • Agenti/endpoint: numero di agenti e alias strumentati e intervalli di emissione

  • Sessioni: numero di sessioni create da agenti instrumentati che emettono intervalli. Una sessione è simile a una conversazione e contiene un contesto generale

  • Tracce: numero di tracce create da agenti instrumentati che emettono intervalli. Una traccia è un ciclo individuale di richiesta-risposta all'interno di una sessione

  • Tasso di errore: percentuale di errori nelle interazioni con gli agenti

  • Tasso di limitazione: percentuale di interazioni con agenti limitati

Scegli Visualizza dettagli per visualizzare le metriche dell'agente in forma grafica.

Visualizzazione Agenti

Metriche di runtime

Le metriche e i pannelli di controllo di Runtime visualizzano i dati della primitiva Runtime. Utilizzando questa primitiva, puoi ospitare i tuoi agenti sul runtime di Amazon Bedrock AgentCore . Per ulteriori informazioni, consulta Creazione di un AgentCore runtime.

AgentCore Runtime supporta queste metriche

  • Runtime Agents/Aliases : tiene traccia del numero di agenti e alias ospitati su Runtime AgentCore

  • Sessioni di runtime: tiene traccia del numero di sessioni create dagli agenti in esecuzione in AgentCore Runtime. Una sessione è simile a una conversazione e contiene il contesto generale dell'intero flusso di interazione. Utile per monitorare l'utilizzo complessivo della piattaforma, la pianificazione della capacità e la comprensione degli schemi di coinvolgimento degli utenti

  • Invocazioni di runtime: numero totale di richieste effettuate all'API piano dati. Ogni chiamata API conta come una invocazione, indipendentemente dalla dimensione del payload della richiesta o dallo stato della risposta

  • Errori di runtime: il numero di errori di sistema e dell'utente. Per le definizioni degli errori di sistema e utente, consulta le metriche di runtime AgentCore fornite

  • Limitazioni di runtime: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito. Queste richieste restituiscono il codice ThrottlingException di stato HTTP 429. Monitora questa metrica per determinare se è necessario rivedere le quote di servizio o ottimizzare gli schemi di richiesta

Visualizza le modifiche delle metriche nel tempo nel pannello di controllo predefinito. Espandi Visualizza dettagli per visualizzare i grafici relativi alle metriche.

Visualizzazione Runtime

Agents (Agenti)

Gli agenti sono componenti che raccolgono e inviano dati di monitoraggio dalle applicazioni. La tabella Agenti mostra tutti gli agenti configurati nell'account. Questi agenti possono essere ospitati su servizi AWS nativi come AgentCore Runtime, Lambda o Amazon. EC2 La tabella mostra anche altri agenti a cui è possibile inviare dati di telemetria. CloudWatch

Puoi utilizzare Filtra agenti per trovare un agente specifico che desideri approfondire oppure i nomi delle colonne per ordinare gli agenti e trovare l'agente richiesto. Seleziona l'icona a forma di ingranaggio per mostrare o nascondere colonne aggiuntive.

Visualizzazione degli agenti di Runtime

È possibile visualizzare i dettagli dell'agente espandendo il nome dell'agente.

Panoramica degli agenti di Runtime

Dettagli dell'agente: panoramica

La scheda Panoramica mostra i pannelli di controllo automatici per le metriche degli agenti. Queste metriche provengono da intervalli campionati e da metriche di Runtime (quando l'agente utilizza Runtime). AgentCore

La dashboard Evaluators include approfondimenti derivati da intervalli con valutazioni abilitate.

  • Principali valori deltas nei punteggi degli valutatori: mostra gli agenti valutatori che hanno subito il maggior numero di cambiamenti rispetto all'ultimo periodo in base al periodo di tempo selezionato.

  • Metriche di configurazione della valutazione: mostra le metriche dello stato operativo degli agenti valutatori, incluso il numero di volte in cui le valutazioni sono state eseguite e il numero di errori riscontrati.

Per modificare una configurazione di valutazione utilizzando la AgentCore console Amazon Bedrock, fai clic sul link nella colonna Evaluator o Evaluation configuration. Per rivedere i risultati dello strumento di valutazione, fai clic su un punteggio nella colonna Punteggio medio. Per visualizzare tutte le valutazioni dell'agente, scegli la scheda Valutazioni. Per ulteriori informazioni, consulta Dettagli dell'agente - Valutazioni.

Il pannello di controllo Metriche dell'agente include metriche derivate dagli intervalli campionati:

  • Sessioni e tracce: numero di sessioni e tracce per questo agente

  • Utilizzo del token FM: conteggio totale del consumo di token del modello di fondazione. Puoi filtrare il grafico in un particolare modello di fondazione

  • Errori di sistema e client: conteggio degli errori di sistema durante l'elaborazione della richiesta. Livelli elevati di errori sul lato server possono indicare potenziali problemi di infrastruttura o di servizio che richiedono un'indagine. Gli errori del client sono errori derivanti da richieste non valide. Livelli elevati di errori lato client possono indicare problemi con la formattazione o le autorizzazioni delle richieste

  • Errori e latenza per intervallo: i tassi di errore e la latenza per un determinato intervallo. Tieni presente che in molti agenti può apparire un intervallo

  • Limitazioni: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito

  • Autenticazione in entrata: chiamate con token di autorizzazione e accesso: numero di richieste di autenticazione in entrata elaborate dall'agente, inclusi i controlli di autorizzazione e le convalide dei token di accesso da client o servizi esterni

  • Distribuzione Auth:Usage in uscita: modello di distribuzione dei metodi di autenticazione in uscita utilizzati dall'agente, che mostra la frequenza e i tipi di meccanismi di autenticazione utilizzati per l'accesso a servizi esterni

La dashboard delle metriche di Runtime include le metriche che Runtime genera automaticamente: AgentCore

  • Sessioni e chiamate di runtime: numero di sessioni e invocazioni che questo particolare agente ha generato durante l'hosting su Runtime

  • Latenza di runtime: latenza delle richieste degli agenti ospitati su Runtime

  • Limitazioni di Runtime: numero di richieste limitate dal servizio a causa del superamento del valore TPS (transazioni al secondo) consentito