Osservabilità dell'IA generativa - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Osservabilità dell'IA generativa

Con Amazon CloudWatch, puoi osservare i carichi di lavoro di intelligenza artificiale generativa, inclusi AgentCore gli agenti Amazon Bedrock, e ottenere informazioni dettagliate sulle prestazioni, lo stato e la precisione dell'IA. CloudWatch fornisce visualizzazioni preconfigurate della latenza, dell'utilizzo e degli errori dei carichi di lavoro di intelligenza artificiale, consentendoti di rilevare più rapidamente i problemi in componenti come modelli e agenti. End-to-endil tracciamento tempestivo consente di identificare rapidamente i problemi in componenti come knowledge base, strumenti e modelli. CloudWatchle funzionalità di monitoraggio dell'IA sono compatibili con i più diffusi framework di orchestrazione dell'IA generativa come AWS Strands e LangGraph offrono flessibilità nella LangChain scelta del framework.

CloudWatch l'osservabilità generativa dell'IA consente di:

CloudWatch l'osservabilità generativa dell'intelligenza artificiale offre due funzionalità predefinite:

Nota

Puoi utilizzare il pannello di controllo Model Invocation utilizzando qualsiasi modello di inferenza in Amazon Bedrock.

  • Model Invocations: dashboard metriche dettagliate sull'utilizzo del modello e sul consumo di token e una tabella di log di invocazione curata per visualizzare il contenuto dettagliato di input e output delle inferenze del modello

  • AgentCore Agenti Amazon Bedrock: metriche di prestazioni e decisioni per elementi primitivi di Amazon AgentCore Bedrock come agenti, memoria, strumenti integrati, gateway e identità

Le metriche chiave disponibili in questo pannello di controllo includono:

  • Invocazioni totali e medie

  • Utilizzo dei token (totale, media per query, input, output)

  • Latenza (media, P90, P99)

  • Tassi di errore ed eventi di limitazione

  • Attribuzione dei costi per applicazione, ruolo utente o utente specifico