Vue Agent
La Vue Agent fournit un tableau de bord organisé pour les agents de votre compte. Vous pouvez afficher les données provenant des agents hébergés sur des services AWS natifs tels que le service d’exécution AgentCore, Lambda ou Amazon EC2. La vue affiche également les agents qui émettent des données de télémétrie vers CloudWatch.
Présentation
Les métriques et les tableaux de bord affichent les données provenant des portées d’agents échantillonnées. Pour plus d’informations sur les portées d’agents, consultez Portées.
Les métriques d’agent suivantes sont prises en charge :
-
Agents/Alias : nombre d’agents et d’alias instrumentés et émettant des portées
-
Sessions : nombre de sessions créées par les agents instrumentés émettant des portées. Une session est similaire à une conversation et contient le contexte général
-
Traces : nombre de traces créées par les agents instrumentés émettant des portées. Une trace est un cycle de demande-réponse individuel au sein d’une session
-
Taux d’erreur : pourcentage d’erreurs dans les interactions des agents
-
Taux de limitation : pourcentage d’interactions des agents limitées
Sélectionnez Afficher les détails pour voir les métriques des agents sous forme de graphiques.
Métriques d’exécution
Les métriques et tableaux de bord Exécution affichent les données provenant de la primitive Exécution. À l’aide de cette primitive, vous pouvez héberger vos agents sur l’exécution Amazon Bedrock AgentCore. Pour plus d’informations, consultez Création d’un service d’exécution AgentCore.
Le service d’exécution AgentCore prend en charge les métriques suivantes
-
Agents/alias d’exécution : suit le nombre d’agents et d’alias hébergés sur le service d’exécution AgentCore
-
Sessions d’exécution : suit le nombre de sessions créées par les agents s’exécutant dans le service d’exécution AgentCore. Une session est similaire à une conversation et contient le contexte général de l’ensemble du flux d’interaction. Utile pour surveiller l’utilisation globale de la plateforme, planifier la capacité et comprendre les modèles d’engagement des utilisateurs
-
Invocations d’exécution : nombre total de demandes effectuées vers l’API Data Plane. Chaque appel d’API compte comme une invocation, quelle que soit la taille des données utiles de la demande ou le statut de la réponse
-
Erreurs d’exécution : nombre d’erreurs système et utilisateur. Pour les définitions des erreurs système et utilisateur, consultez Métriques d’exécution fournies par le service d’exécution AgentCore
-
Limitations d’exécution : nombre de demandes limitées par le service en raison d’un dépassement du TPS (transactions par seconde). Ces demandes renvoient une exception ThrottlingException avec le code d’état HTTP 429. Surveillez cette métrique pour déterminer si vous devez revoir vos quotas de service ou optimiser les modèles de demandes
Affichez l’évolution des métriques au fil du temps dans le tableau de bord par défaut. Développez Afficher les détails pour afficher les graphiques des métriques.
Agents
Les agents sont des composants qui collectent et envoient les données de surveillance de vos applications. Le tableau Agents affiche tous les agents configurés dans votre compte. Ces agents peuvent être hébergés sur des services natifs AWS tels que le service d’exécution AgentCore, Lambda ou Amazon EC2. Le tableau affiche également d’autres agents qui sont instrumentés pour émettre des données de télémétrie vers CloudWatch.
Vous pouvez utiliser l’option Filtrer les agents pour trouver un agent spécifique que vous voulez examiner en détail. Vous pouvez également utiliser les noms de colonnes pour trier les agents et trouver celui dont vous avez besoin. Sélectionnez l’icône en forme d’engrenage pour afficher ou masquer des colonnes supplémentaires.
Vous pouvez afficher les détails de l’agent en développant son nom.
Détails de l’agent – Vue d’ensemble
L’onglet Vue d’ensemble affiche des tableaux de bord automatiques pour les métriques de votre agent. Ces métriques proviennent d’intervalles échantillonnés et de métriques d’exécution (lorsque l’agent utilise le service d’exécution AgentCore).
Le tableau de bord Métriques de l’agent comprend des métriques dérivées d’intervalles échantillonnés :
-
Sessions et traces : nombre de sessions et de traces pour cet agent
-
Utilisation des jetons FM : nombre total de jetons de modèle de fondation consommés. Vous pouvez filtrer le graphique pour afficher un modèle de fondation particulier
-
Erreurs système et client : nombre d’erreurs système lors du traitement des demandes. Un nombre élevé d’erreurs côté serveur peut indiquer des problèmes potentiels d’infrastructure ou de service qui nécessitent une enquête. Les erreurs client sont des erreurs résultant de demandes non valides. Un nombre élevé d’erreurs côté client peut indiquer des problèmes de formatage des demandes ou d’autorisations
-
Erreurs et latence par portée : taux d’erreur et latence pour une portée particulière. Veuillez noter qu’une portée peut apparaître dans plusieurs agents
-
Limitations : nombre de demandes limitées par le service en raison d’un dépassement du TPS (transactions par seconde) autorisé
Le tableau de bord Métrique d’exécution comprend des métriques générées automatiquement par le service d’exécution AgentCore :
-
Sessions et invocations d’exécution : nombre de sessions et d’invocations générées par cet agent particulier lorsqu’il est hébergé sur le service d’exécution
-
Latence d’exécution : latence des demandes par les agents hébergés sur le service d’exécution
-
Limitations d’exécution : nombre de demandes limitées par le service en raison d’un dépassement du TPS (transactions par seconde) autorisé
Détails de l’agent – Sessions
Un agent peut avoir plusieurs sessions. Affichez la session dans l’onglet Sessions. Utilisez Filtre des sessions ou triez les colonnes pour trouver la session requise.
Sélectionnez l’ID de session pour afficher les métriques récapitulatives de la session et la liste des traces appartenant à cette session. Les métriques des sessions incluent :
-
Traces : nombre de traces appartenant aux sessions
-
Erreurs serveur : nombre d’erreurs système lors du traitement des requêtes. Un niveau élevé d’erreurs côté serveur peut indiquer des problèmes potentiels d’infrastructure ou de service qui nécessitent une enquête
-
Erreurs client : les erreurs client sont des erreurs résultant de demandes non valides. Un nombre élevé d’erreurs côté client peut indiquer des problèmes de formatage des demandes ou d’autorisations
-
Limitations : nombre de demandes limitées pour cette session en raison d’un dépassement du TPS (transactions par seconde) autorisé
-
Détails de la session : métadonnées sur la session, telles que l’heure de début, l’heure de fin et l’ID de session
Pour analyser une liste de traces dans une session, sélectionnez Filtrer les traces afin de restreindre ou de trier les colonnes du tableau pour faire apparaître la trace que vous voulez examiner.
Une fois que vous avez sélectionné une trace, le volet droit affiche les détails de la trace. Pour chaque trace, vous pouvez voir le résumé de la trace, les portées et les détails du contenu de la trace.
Sous Résumé de la trace, vous pouvez afficher les métriques suivantes :
Note
Les champs de la page Résumé sont identiques dans les vues Agent, Sessions et Traces.
-
Portées : nombre de portées dans une trace
-
Erreurs serveur : nombre d’erreurs système lors du traitement des requêtes. Un niveau élevé d’erreurs côté serveur peut indiquer des problèmes potentiels d’infrastructure ou de service qui nécessitent une enquête
-
Erreurs client : les erreurs client sont des erreurs résultant de demandes non valides. Un nombre élevé d’erreurs côté client peut indiquer des problèmes de formatage des demandes ou d’autorisations
-
Limites : nombre de demandes limitées pertinentes pour cette session en raison du dépassement du TPS (transactions par seconde) autorisé
-
Latence de portée P95 : latence au 95e centile de toutes les invocations de cette portée particulière. Notez qu’une portée peut être utilisée par plusieurs agents
-
Détails de la trace : métadonnées sur la trace, telles que l’heure de début, l’heure de fin et l’ID de trace
Sélectionnez Chronologie pour afficher la durée de chaque portée et identifier celle qui a pris le plus de temps et contribué à un ralentissement de la réponse.
Pour analyser les relations entre les portées et les appels suivants, sélectionnez Trajectoire afin de comprendre les relations entre les portées et les appels suivants à partir de ces portées.
Sous Portées, sélectionnez un événement de portée individuel pour examiner les données de la portée dans leur forme originale. Examinez les données de la portée dans leur forme originale. Pour un dépannage granulaire, sélectionnez l’onglet Événements afin d’examiner les entrées et les sorties du modèle.
Détails de l’agent – Traces
Chaque agent peut avoir plusieurs traces. Affichez les détails de la trace dans l’onglet Traces. Sélectionnez Filtrer les traces ou triez les colonnes pour trouver la trace requise.