Abilitazione di Invocazione del modello in Amazon Bedrock

Invocazioni del modello

CloudWatch l'osservabilità generativa dell'intelligenza artificiale consente di monitorare le prestazioni di Model Invocations. Puoi tenere traccia di metriche come il numero di invocazioni, l'utilizzo dei token e gli errori utilizzando le visualizzazioni predefinite. Per una visibilità dettagliata del contenuto delle chiamate, come input e output, abilita la registrazione di Bedrock Invocation e invia i log a. CloudWatch Per ulteriori informazioni, consulta Configurare una destinazione per i log e Aiutare a proteggere CloudWatch i dati di registro sensibili con il mascheramento.

Abilitazione di Invocazione del modello in Amazon Bedrock

Nota

Per visualizzare le invocazioni, è necessario abilitare la registrazione di Invocazione del modello in Amazon Bedrock.

Per abilitare la registrazione delle chiamate dei modelli in Amazon Bedrock, segui questi passaggi.

Apri la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock/.
Seleziona Impostazioni.
In Registrazione delle invocazioni del modello, seleziona Registrazione delle invocazioni del modello.
Scegli i tipi di dati richiesti da includere nei log. Scegli di inviare i log solo a CloudWatch Logs o sia ad Amazon S3 che a Logs se stai CloudWatch già pubblicando su Amazon S3.
Nelle configurazioni CloudWatch Logs, crea il nome del gruppo di log e seleziona i ruoli di servizio appropriati.
Scegli i tipi di dati richiesti da includere nei log.
Scegli Salva impostazioni.

Quando inizi a utilizzare le invocazioni di Amazon Bedrock, puoi visualizzare automaticamente i pannelli di controllo preconfigurati. Dopo l'attivazione di Model Invocation logging, puoi visualizzare i pannelli di controllo predefiniti e accedere alla tabella delle invocazioni sottostante.

Numero di chiamate: numero di richieste riuscite alle operazioni di Converse,, e API ConverseStream InvokeModel InvokeModelWithResponseStream
Latenza di invocazione: latenza delle invocazioni
Conteggio dei token per modello: conteggi dei token per modello delineati dai conteggi dei token di input e dei token di output
Conteggi giornalieri di token per ModelID: conteggi totali giornalieri di token per ID modello
InputTokenCount, OutputTokenCount — Numero totale di token in input e output in questo account su modelli selezionati
Richieste, raggruppate per token di input: numero di richieste raggruppate per token di input in 6 intervalli. Ogni riga rappresenta il numero di richieste che rientrano in un intervallo particolare
Limitazioni di invocazione: numero di invocazioni limitate dal sistema. Il numero di limitazioni visualizzato dipenderà dalle impostazioni dei nuovi tentativi nell'SDK. Per ulteriori informazioni, consulta Retry behavior nella Guida di riferimento agli AWS SDK e agli strumenti
Numero di errori di invocazione: conteggio delle invocazioni che generano errori sul lato server e sul lato client

Per utilizzare la dashboard di invocazione del modello, segui questi passaggi.

Passa il mouse su qualsiasi grafico di metrica per visualizzare i dettagli dell'invocazione. Puoi scegliere l'icona Allarme per configurare Alarms per monitorare la qualità e le prestazioni dell'applicazione.
Nel menu a discesa ModelID, puoi selezionare un ID modello per visualizzare le metriche corrispondenti.
Seleziona Visualizza nelle CloudWatch metriche per visualizzare le metriche del dashboard in cui si trovano. CloudWatch
Seleziona Sostituzione periodo per modificare l'intervallo di tempo delle metriche (ad esempio, 1 minuto, 1 ora o 6 ore).
In Invocazioni, scegli ID richiesta per visualizzare i dettagli della richiesta. È possibile visualizzare i dettagli di input e output dell'invocazione del modello nel pannello a destra.

Model Invocation: richiedi la visualizzazione dell'ID.

Nella pagina Request ID, nel menu a discesa Azioni, scegli Visualizza in Logs Insights per visualizzare i log in. CloudWatch Per ulteriori informazioni, consulta Analisi dei dati di registro con Logs Insights. CloudWatch

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Osservabilità dell'IA generativa

Amazon Bedrock AgentCore