Observabilité de l’IA générative

Avec Amazon CloudWatch, vous pouvez observer les charges de travail génératives liées à l'IA, y compris les AgentCore agents Amazon Bedrock, et obtenir des informations sur les performances, la santé et la précision de l'IA. CloudWatch fournit des vues préconfigurées de la latence, de l'utilisation et des erreurs de vos charges de travail d'IA, ce qui vous permet de détecter les problèmes plus rapidement dans des composants tels que les modèles et les agents. End-to-end le suivi rapide vous permet d'identifier rapidement les problèmes liés à des composants tels que les bases de connaissances, les outils et les modèles. CloudWatchles capacités de surveillance de l'IA sont compatibles avec les frameworks d'orchestration d'IA générative populaires tels que AWS LangChain Strands et LangGraph offrent une flexibilité quant au choix du framework.

CloudWatch l'observabilité générative de l'IA vous permet de :

Évaluez la qualité et la précision des applications d'IA à grande échelle grâce à une surveillance automatisée, en réduisant les exigences de révision manuelle en capturant les résultats du modèle, les indicateurs de qualité des réponses et les interactions avec les utilisateurs finaux
Surveiller les invocations de modèles, les agents (gérés, autohébergés et tiers), les bases de connaissances, les barrières de protection et les outils
Passer de l’expérimentation des agents à la production d’applications GenAI innovantes tout en garantissant une qualité, des performances et une fiabilité supérieures. Pour plus d'informations, consultez Qu'est-ce qu'Amazon Bedrock ? AgentCore
Identifier rapidement la source des erreurs à l’aide du traçage rapide de bout en bout, des métriques sélectionnées et des journaux
Résolvez les problèmes liés à l'ensemble de votre application GenAI et à votre infrastructure sous-jacente, en tirant parti des outils d' CloudWatch observabilité existants tels que les signaux d'application, les alarmes, les tableaux de bord, la protection des données sensibles et les informations sur les journaux
Accédez à des traces rapides lorsque vous utilisez Amazon Bedrock et envoyez des traces structurées de modèles tiers à CloudWatch l'aide du SDK ADOT. Pour plus d'informations sur l'ajout d'observabilité à votre AgentCore agent ou outil Amazon Bedrock, consultez Amazon Bedrock AgentCore

CloudWatch l'observabilité générative de l'IA fournit deux fonctionnalités prédéfinies :

Note

Vous pouvez utiliser le tableau de bord Model Invocation en utilisant n'importe quel modèle à des fins d'inférence dans Amazon Bedrock.

Invocations de modèles : tableau de bord détaillé des statistiques sur l'utilisation du modèle, la consommation de jetons, et tableau des journaux d'invocation organisé pour afficher le contenu détaillé des entrées et sorties des inférences du modèle
AgentCore Agents Amazon Bedrock : indicateurs de performance et de décision pour les primitives d'Amazon Bedrock AgentCore telles que les agents, la mémoire, les Built-in outils, les passerelles et l'identité

Les métriques clés disponibles dans ces tableaux de bord comprennent :

Nombre total et moyen d’invocations
Utilisation des jetons (total, moyenne par requête, entrée, sortie)
Latence (moyenne, P90, P99)
Taux d’erreur et événements de limitation
Attribution des coûts par application, rôle utilisateur ou utilisateur spécifique

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Résolution des problèmes

Invocations de modèles