Activation de l’invocation de modèle dans Amazon Bedrock

Invocations de modèles

CloudWatch l'observabilité générative de l'IA vous permet de surveiller les performances des invocations de modèles. Vous pouvez suivre des métriques telles que le nombre d’invocations, l’utilisation des jetons et les erreurs à l’aide de vues prêtes à l’emploi. Pour une visibilité détaillée du contenu des appels, tel que les entrées et les sorties, activez la journalisation des invocations dans Bedrock et envoyez les journaux à. CloudWatch Pour plus d'informations, consultez Configurer une destination pour CloudWatch les journaux et Aider à protéger les données de journal sensibles grâce au masquage.

Activation de l’invocation de modèle dans Amazon Bedrock

Note

Vous devez activer la journalisation des invocations de modèle dans Amazon Bedrock pour afficher les invocations.

Pour activer la journalisation des appels de modèles dans Amazon Bedrock, procédez comme suit.

Ouvrez la console Amazon Bedrock à https://console.aws.amazon.com/bedrock/l'adresse.
Cliquez sur Paramètres.
Sous Journalisation des invocations de modèle, sélectionnez Journalisation des invocations de modèle.
Sélectionnez les types de données à inclure dans les journaux. Choisissez d'envoyer les CloudWatch journaux à Logs uniquement ou à Amazon S3 et CloudWatch Logs si vous publiez déjà sur Amazon S3.
Dans les configurations CloudWatch des journaux, créez un nom de groupe de journaux et sélectionnez les rôles de service appropriés.
Sélectionnez les types de données à inclure dans les journaux.
Choisissez Enregistrer les paramètres

Vous pouvez afficher automatiquement les tableaux de bord préconfigurés lorsque vous commencez à utiliser les invocations Amazon Bedrock. Après avoir activé Model Invocation logging, vous pouvez afficher les tableaux de bord par défaut et accéder au tableau d’invocations situé en dessous.

Nombre d'invocations : nombre de demandes réussies aux opérations Converse, ConverseStream InvokeModel, et API InvokeModelWithResponseStream
Latence d’invocation : latence des invocations
Nombre de jetons par modèle : nombre de jetons par modèle, délimité par le nombre de jetons en entrée et le nombre de jetons en sortie
Nombre quotidien de jetons par ID de modèle : nombre total quotidien de jetons par ID de modèle
InputTokenCount, OutputTokenCount — Nombre total de jetons en entrée et en sortie de ce compte sur les modèles sélectionnés
Demandes, regroupées par jetons d’entrée : nombre de requêtes regroupées par jetons d’entrée en 6 plages. Chaque ligne représente le nombre de requêtes qui entrent dans une plage particulière
Limitations d’invocation : nombre d’invocations limitées par le système. Le nombre de limitations que vous voyez dépendra de vos paramètres de nouvelle tentative dans le kit SDK. Pour plus d'informations, consultez la section Comportement des nouvelles tentatives dans le Guide de AWS référence des SDK et des outils
Nombre d’erreurs d’invocation : nombre d’invocations qui ont entraîné des erreurs côté serveur et côté client

Pour utiliser le modèle de tableau de bord d'invocation, procédez comme suit.

Passez la souris sur n’importe quel graphique de métrique pour afficher les détails de l’invocation. Vous pouvez sélectionner l’icône Alarme pour configurer Alarms afin de surveiller la qualité et les performances de l’application.
Dans le menu déroulant ModelID, vous pouvez sélectionner un ID de modèle pour afficher les métriques correspondantes.
Sélectionnez Afficher dans CloudWatch les métriques pour afficher les métriques du tableau de bord ci-dessous CloudWatch.
Sélectionnez Remplacement de la période pour ajuster la période des métriques (par exemple, 1 minute, 1 heure ou 6 heures).
Sous Invocations, sélectionnez ID de la requête pour afficher les détails de la requête. Vous pouvez afficher les détails d’entrée et de sortie de l’invocation du modèle dans le volet droit.

Modèle d'invocation - Affichage de l'ID de demande.

Sur la page Request ID, sous le menu déroulant Actions, choisissez View in Logs Insights pour afficher les connexions CloudWatch. Pour plus d'informations, consultez la section Analyse des données des CloudWatch journaux avec Logs Insights.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Observabilité de l’IA générative

Amazon Bedrock AgentCore