Vue Agent

La Vue Agent fournit un tableau de bord organisé pour les agents de votre compte. Vous pouvez afficher les données provenant des agents hébergés sur des services AWS natifs tels que le service d’exécution AgentCore, Lambda ou Amazon EC2. La vue affiche également les agents qui émettent des données de télémétrie vers CloudWatch.

Présentation

Les métriques et les tableaux de bord affichent les données provenant des portées d’agents échantillonnées. Pour plus d’informations sur les portées d’agents, consultez Portées.

Les métriques d’agent suivantes sont prises en charge :

Agents/Alias : nombre d’agents et d’alias instrumentés et émettant des portées
Sessions : nombre de sessions créées par les agents instrumentés émettant des portées. Une session est similaire à une conversation et contient le contexte général
Traces : nombre de traces créées par les agents instrumentés émettant des portées. Une trace est un cycle de demande-réponse individuel au sein d’une session
Taux d’erreur : pourcentage d’erreurs dans les interactions des agents
Taux de limitation : pourcentage d’interactions des agents limitées

Sélectionnez Afficher les détails pour voir les métriques des agents sous forme de graphiques.

Métriques d’exécution

Les métriques et tableaux de bord Exécution affichent les données provenant de la primitive Exécution. À l’aide de cette primitive, vous pouvez héberger vos agents sur l’exécution Amazon Bedrock AgentCore. Pour plus d’informations, consultez Création d’un service d’exécution AgentCore.

Le service d’exécution AgentCore prend en charge les métriques suivantes

Agents/alias d’exécution : suit le nombre d’agents et d’alias hébergés sur le service d’exécution AgentCore
Sessions d’exécution : suit le nombre de sessions créées par les agents s’exécutant dans le service d’exécution AgentCore. Une session est similaire à une conversation et contient le contexte général de l’ensemble du flux d’interaction. Utile pour surveiller l’utilisation globale de la plateforme, planifier la capacité et comprendre les modèles d’engagement des utilisateurs
Invocations d’exécution : nombre total de demandes effectuées vers l’API Data Plane. Chaque appel d’API compte comme une invocation, quelle que soit la taille des données utiles de la demande ou le statut de la réponse
Erreurs d’exécution : nombre d’erreurs système et utilisateur. Pour les définitions des erreurs système et utilisateur, consultez Métriques d’exécution fournies par le service d’exécution AgentCore
Limitations d’exécution : nombre de demandes limitées par le service en raison d’un dépassement du TPS (transactions par seconde). Ces demandes renvoient une exception ThrottlingException avec le code d’état HTTP 429. Surveillez cette métrique pour déterminer si vous devez revoir vos quotas de service ou optimiser les modèles de demandes

Affichez l’évolution des métriques au fil du temps dans le tableau de bord par défaut. Développez Afficher les détails pour afficher les graphiques des métriques.

Agents

Les agents sont des composants qui collectent et envoient les données de surveillance de vos applications. Le tableau Agents affiche tous les agents configurés dans votre compte. Ces agents peuvent être hébergés sur des services natifs AWS tels que le service d’exécution AgentCore, Lambda ou Amazon EC2. Le tableau affiche également d’autres agents qui sont instrumentés pour émettre des données de télémétrie vers CloudWatch.

Vous pouvez utiliser l’option Filtrer les agents pour trouver un agent spécifique que vous voulez examiner en détail. Vous pouvez également utiliser les noms de colonnes pour trier les agents et trouver celui dont vous avez besoin. Sélectionnez l’icône en forme d’engrenage pour afficher ou masquer des colonnes supplémentaires.

Vous pouvez afficher les détails de l’agent en développant son nom.

Détails de l’agent – Vue d’ensemble

L’onglet Vue d’ensemble affiche des tableaux de bord automatiques pour les métriques de votre agent. Ces métriques proviennent d’intervalles échantillonnés et de métriques d’exécution (lorsque l’agent utilise le service d’exécution AgentCore).

Le tableau de bord Métriques de l’agent comprend des métriques dérivées d’intervalles échantillonnés :

Sessions et traces : nombre de sessions et de traces pour cet agent
Utilisation des jetons FM : nombre total de jetons de modèle de fondation consommés. Vous pouvez filtrer le graphique pour afficher un modèle de fondation particulier
Erreurs système et client : nombre d’erreurs système lors du traitement des demandes. Un nombre élevé d’erreurs côté serveur peut indiquer des problèmes potentiels d’infrastructure ou de service qui nécessitent une enquête. Les erreurs client sont des erreurs résultant de demandes non valides. Un nombre élevé d’erreurs côté client peut indiquer des problèmes de formatage des demandes ou d’autorisations
Erreurs et latence par portée : taux d’erreur et latence pour une portée particulière. Veuillez noter qu’une portée peut apparaître dans plusieurs agents
Limitations : nombre de demandes limitées par le service en raison d’un dépassement du TPS (transactions par seconde) autorisé

Le tableau de bord Métrique d’exécution comprend des métriques générées automatiquement par le service d’exécution AgentCore :

Sessions et invocations d’exécution : nombre de sessions et d’invocations générées par cet agent particulier lorsqu’il est hébergé sur le service d’exécution
Latence d’exécution : latence des demandes par les agents hébergés sur le service d’exécution
Limitations d’exécution : nombre de demandes limitées par le service en raison d’un dépassement du TPS (transactions par seconde) autorisé

Détails de l’agent – Sessions

Un agent peut avoir plusieurs sessions. Affichez la session dans l’onglet Sessions. Utilisez Filtre des sessions ou triez les colonnes pour trouver la session requise.

Sélectionnez l’ID de session pour afficher les métriques récapitulatives de la session et la liste des traces appartenant à cette session. Les métriques des sessions incluent :

Traces : nombre de traces appartenant aux sessions
Erreurs serveur : nombre d’erreurs système lors du traitement des requêtes. Un niveau élevé d’erreurs côté serveur peut indiquer des problèmes potentiels d’infrastructure ou de service qui nécessitent une enquête
Erreurs client : les erreurs client sont des erreurs résultant de demandes non valides. Un nombre élevé d’erreurs côté client peut indiquer des problèmes de formatage des demandes ou d’autorisations
Limitations : nombre de demandes limitées pour cette session en raison d’un dépassement du TPS (transactions par seconde) autorisé
Détails de la session : métadonnées sur la session, telles que l’heure de début, l’heure de fin et l’ID de session

Pour analyser une liste de traces dans une session, sélectionnez Filtrer les traces afin de restreindre ou de trier les colonnes du tableau pour faire apparaître la trace que vous voulez examiner.

Une fois que vous avez sélectionné une trace, le volet droit affiche les détails de la trace. Pour chaque trace, vous pouvez voir le résumé de la trace, les portées et les détails du contenu de la trace.

Sous Résumé de la trace, vous pouvez afficher les métriques suivantes :

Note

Les champs de la page Résumé sont identiques dans les vues Agent, Sessions et Traces.

Portées : nombre de portées dans une trace
Erreurs serveur : nombre d’erreurs système lors du traitement des requêtes. Un niveau élevé d’erreurs côté serveur peut indiquer des problèmes potentiels d’infrastructure ou de service qui nécessitent une enquête
Erreurs client : les erreurs client sont des erreurs résultant de demandes non valides. Un nombre élevé d’erreurs côté client peut indiquer des problèmes de formatage des demandes ou d’autorisations
Limites : nombre de demandes limitées pertinentes pour cette session en raison du dépassement du TPS (transactions par seconde) autorisé
Latence de portée P95 : latence au 95e centile de toutes les invocations de cette portée particulière. Notez qu’une portée peut être utilisée par plusieurs agents
Détails de la trace : métadonnées sur la trace, telles que l’heure de début, l’heure de fin et l’ID de trace

Sélectionnez Chronologie pour afficher la durée de chaque portée et identifier celle qui a pris le plus de temps et contribué à un ralentissement de la réponse.

Pour analyser les relations entre les portées et les appels suivants, sélectionnez Trajectoire afin de comprendre les relations entre les portées et les appels suivants à partir de ces portées.

Sous Portées, sélectionnez un événement de portée individuel pour examiner les données de la portée dans leur forme originale. Examinez les données de la portée dans leur forme originale. Pour un dépannage granulaire, sélectionnez l’onglet Événements afin d’examiner les entrées et les sorties du modèle.

Détails de l’agent – Traces

Chaque agent peut avoir plusieurs traces. Affichez les détails de la trace dans l’onglet Traces. Sélectionnez Filtrer les traces ou triez les colonnes pour trouver la trace requise.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Agents Amazon Bedrock AgentCore

Vue de session