Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Surveillance des métriques de Step Functions à l'aide d'Amazon CloudWatch
La surveillance joue un rôle important dans le maintien de la fiabilité, de la disponibilité AWS Step Functions et des performances de vos AWS solutions. Vous pouvez collecter des données auprès des AWS services que vous utilisez pour corriger les défaillances multipoints.
Avant de commencer à surveiller Step Functions, vous devez créer un plan de surveillance répondant aux questions suivantes :
-
Quels sont les objectifs de la surveillance ?
-
Quelles sont les ressources à surveiller ?
-
À quelle fréquence les ressources doivent-elles être surveillées ?
-
Quels outils de surveillance utiliser ?
-
Qui exécute les tâches de supervision ?
-
Qui doit être informé en cas de problème ?
La prochaine étape consiste à établir une base pour les performances normales de dans votre environnement. Pour cela, vous devez mesurer les performances à différents moments et sous différentes conditions de charge. Lorsque vous surveillez Step Functions, pensez à stocker des données de surveillance historiques. Ces données peuvent constituer une référence à comparer avec des données de performances actuelles, afin d'identifier les modèles de performance normaux et les anomalies de performance, et de concevoir des solutions pour résoudre les problèmes.
Nous recommandons de surveiller les échecs d'activité et de tâche afin d'établir une base de référence. Lorsque les performances dépassent votre indicateur de référence, définissez une alerte afin de pouvoir en rechercher la cause première.
Pour établir une référence, vous devez au moins surveiller les métriques suivantes :
-
ExecutionsStarted -
ExecutionsTimedOut -
Facultatif (si vous utilisez les activités) -
ActivitiesStarted -
Facultatif (si vous utilisez les activités) -
ActivitiesTimedOut
Types de métriques Step Functions pour CloudWatch
Step Functions fournit les types de métriques suivants à Amazon CloudWatch. Vous pouvez utiliser ces métriques pour suivre les machines d'état et les activités, et définir des alarmes sur les valeurs seuils. Vous pouvez consulter les statistiques à l'aide duAWS Management Console.
Les métriques sont regroupées par un espace de noms, un conteneur pour les CloudWatch métriques, afin que les métriques provenant de différentes applications ne soient pas agrégées par erreur.
Noms non ASCII et journalisation
Step Functions accepte les noms des machines à états, des exécutions, des activités et des étiquettes contenant des caractères non ASCII. Dans la mesure où ces caractères empêcheront Amazon CloudWatch d'enregistrer les données, nous vous recommandons de n'utiliser que des caractères ASCII afin de pouvoir suivre les métriques de Step Functions.
CloudWatch livraison des métriques
Les métriques CloudWatch sont fournies sur la base du meilleur effort.
L’exhaustivité et la ponctualité des métriques ne sont pas garanties. Le point de données d’une demande particulière doit être retourné avec un horodatage ultérieur au moment du traitement de la demande. Le point de données peut être retardé d'une minute avant d'être disponible CloudWatch, ou il se peut qu'il ne soit pas livré du tout. CloudWatchles métriques de demande vous donnent une idée des exécutions de la machine à états en temps quasi réel. Il ne s'agit pas d'un compte rendu complet de tous les indicateurs liés à l'exécution.
Compte tenu de la nature optimale de cette fonctionnalité, les rapports disponibles sur le tableau de bord de gestion de la facturation et des coûts
Indicateurs indiquant un intervalle de temps
Certaines des CloudWatch métriques de Step Functions sont des intervalles de temps, toujours mesurés en millisecondes. Ces métriques correspondent généralement aux étapes de votre exécution pour lesquelles vous pouvez définir les délais d'expiration de la machine à états, de l'activité et des fonctions Lambda, avec des noms descriptifs.
Par exemple, la métrique ActivityRunTime détermine le temps nécessaire pour qu'une activité soit terminée après le début de son exécution. Vous pouvez définir une valeur de délai d'attente pour la même période de temps.
Dans la CloudWatch console, vous pouvez obtenir les meilleurs résultats si vous choisissez la moyenne comme statistique d'affichage pour les mesures d'intervalle de temps.
Indicateurs indiquant un décompte
Certaines CloudWatch métriques de Step Functions indiquent les résultats sous forme de décompte. Par exemple, ExecutionsFailed enregistre le nombre d'exécutions de machine d'état ayant échoué.
Il convient de noter que Step Functions émet deux ExecutionsStarted métriques pour chaque exécution par State Machine. Par conséquent, la SampleCountstatistique de la ExecutionsStarted métrique indiquera la valeur 2 pour chaque exécution de machine à états. La SampleCount statistique s'affiche, ExecutionStarted=1 puis une ExecutionStarted=0 fois l'exécution terminée.
De même, d'autres métriques d'état d'exécution peuvent être émises plusieurs fois en raison at-least-once de la diffusion optimale des CloudWatch métriques.
Astuce
Nous recommandons d'utiliser Sum comme statistique d'affichage pour les métriques qui indiquent un décompte dans la CloudWatch console.
Affichage des métriques de Step Functions dans CloudWatch
Vous pouvez utiliser la CloudWatch console pour consulter les métriques Step Functions relatives aux exécutions, aux activités, aux fonctions et aux intégrations de services.
-
Connectez-vous à la CloudWatch console AWS Management Console et ouvrez-la.
-
Choisissez Metrics (Métriques), puis sous l'onglet All Metrics (Toutes les métriques), choisissez States (États).
Si vous avez effectué des exécutions récemment, vous verrez jusqu'à quatre types de métriques :
-
Execution Metrics (Métriques de l'exécution)
-
Métriques de la fonction de l'activité
-
Métriques de la fonction Lambda
-
Métriques d'intégration des services
-
-
Choisissez un type de métrique pour afficher une liste de métriques.
-
Pour afficher les graphiques d'une métrique, cochez la case en regard de la métrique sur la liste. Vous pouvez modifier les paramètres du graphique à l'aide des contrôles des plages de temps au-dessus de l'affichage du graphique.
Vous pouvez choisir des plages de temps personnalisées à l'aide de valeurs relatives ou absolues (jours et heures spécifiques). Vous pouvez également utiliser la liste déroulante pour afficher les valeurs sous forme de lignes, de zones empilées ou de chiffres (valeurs).
-
Pour afficher les détails d'un graphique, placez le pointeur de la souris sur le code couleur de la métrique qui apparaît sous le graphique pour afficher les détails de la métrique.
-
Pour plus d'informations sur l'utilisation des CloudWatch métriques, consultez la section Utilisation d'Amazon CloudWatch Metrics dans le guide de CloudWatch l'utilisateur Amazon.
Configuration d'alarmes pour les métriques Step Functions dans CloudWatch
Vous pouvez utiliser les CloudWatch alarmes Amazon pour effectuer des actions. Par exemple, si vous souhaitez savoir quand un seuil d'alarme est atteint, vous pouvez configurer une alarme pour envoyer une notification à une rubrique Amazon SNS ou pour envoyer un e-mail lorsque la StateMachinesFailed métrique dépasse un certain seuil.
Pour configurer une alarme sur une métrique
-
Connectez-vous à la CloudWatch console AWS Management Console et ouvrez-la.
-
Choisissez une ou plusieurs mesures à afficher, puis choisissez Mesures graphiques.
-
Cliquez sur l'icône en forme de cloche à côté d'une métrique dans la liste pour afficher la page Créer une alarme.
-
Entrez les valeurs des champs Alarm threshold (Seuil d'alarme) et Actions, puis choisissez Créer une alarme.
Pour plus d'informations sur le paramétrage et l'utilisation des CloudWatch alarmes, consultez la section Création d' CloudWatch alarmes Amazon dans le guide de CloudWatch l'utilisateur Amazon.
Mesures d'utilisation au niveau du compte
L'AWS/Usageespace de noms inclut les métriques Step Functions suivantes.
Les statistiques suivantes sont sans dimension et s'appliquent à l'ensemble de votre compte dans une région.
| Métrique | Description |
|---|---|
StateMachineCount |
Nombre de State Machines actuellement actives sur votre compte. Vous devrez peut-être ajouter ou supprimer une State Machine dans votre compte et attendre quelques minutes avant d'activer cette métrique pour votre compte. |
ActivityCount |
Nombre d'activités actuellement actives sur votre compte. Vous devrez peut-être ajouter ou supprimer une activité dans votre compte et attendre quelques minutes avant d'activer cette métrique pour votre compte. |
OpenExecutionCountPerStateMachine |
Ouvrez des exécutions par machine à états dans votre compte. |
Execution Metrics (Métriques de l'exécution)
L'espace de AWS/States noms inclut les métriques suivantes pour toutes les exécutions de Step Functions.
Les statistiques suivantes sont sans dimension et s'appliquent à l'ensemble de votre compte dans une région.
| Métrique | Description |
|---|---|
OpenExecutionCount |
Nombre approximatif d'exécutions actuellement ouvertes : flux de travail actuellement en cours dans votre compte. L'objectif est de fournir un aperçu du moment où vos flux de travail approchent de la limite d'exécution maximale, afin d'éviter les ExecutionLimitExceedederreurs lors des appels
|
OpenExecutionLimit |
Nombre maximum d'exécutions ouvertes. Pour de plus amples informations, veuillez consulter Quotas liés aux comptes. Cette limite ne s'applique pas aux flux de travail express. |
Mesures d'exécution pour toutes les machines à états
Toutes les machines à états émettent des métriques. La ExecutionThrottled métrique ne sera émise qu'en cas d'exécution limitée.
Les métriques suivantes peuvent être filtrées avec un StateMachineArn pour identifier une machine à états spécifique.
Indicateurs au niveau du compte
Sans ARN de machine à états, les indicateurs suivants sont présentés au niveau du compte. Fournissez un ARN de machine à états à signaler au niveau de la machine à états.
| Métrique | Description |
|---|---|
ExecutionsAborted |
Nombre d'exécutions abandonnées ou interrompues. |
ExecutionsFailed |
Nombre d'exécutions ratées. |
ExecutionsStarted |
Nombre d'exécutions entamées. |
ExecutionsSucceeded |
Nombre d'exécutions terminées avec succès. |
ExecutionsTimedOut |
Nombre d'exécutions dont le délai est expiré pour une raison ou une autre. |
ExecutionThrottled |
Nombre d'StateEnteredévénements et de nouvelles tentatives qui ont été limités. Ceci est lié aux limites StateTransition. Pour de plus amples informations, veuillez consulter Quotas liés à l'étranglement de l'État. |
ExecutionTime |
Intervalle, en millisecondes, entre le début de l'exécution et le moment où elle se termine. |
Mesures d'exécution pour Express Workflows
L'espace de AWS/States noms inclut les métriques suivantes pour les exécutions de Step Functions Express Workflows.
Indicateurs au niveau du compte
Sans ARN de machine à états, le ExpressExecutionBilledMemory rapport ExpressExecutionBilledDuration et au niveau du compte. Fournissez un ARN de machine à états à signaler au niveau de la machine à états.
| Métrique | Description |
|---|---|
ExpressExecutionBilledDuration |
Durée pour laquelle un flux de travail express est facturé. |
ExpressExecutionBilledMemory |
Quantité de mémoire consommée pour laquelle un flux de travail express est facturé. |
ExpressExecutionMemory
|
Mémoire totale consommée par un flux de travail express spécifique. |
Redrivemétriques d'exécution pour les flux de travail standard
Lorsque vous exécutez redriveune machine à états, Step Functions émet les métriques suivantes.
Pour toutes les redriven exécutions, la Executions* métrique est émise. Supposons, par exemple, qu'une redriven exécution soit abandonnée. Cette exécution émettra des points de données non nuls pour les deux et. RedrivenExecutionsAborted ExecutionsAborted
| Métrique | Description |
|---|---|
ExecutionsRedriven |
Nombre d'redrivenexécutions. |
RedrivenExecutionsAborted |
Nombre d'redrivenexécutions annulées ou terminées. |
RedrivenExecutionsTimedOut |
Nombre d'redrivenexécutions dont le délai est expiré pour une raison ou une autre. |
RedrivenExecutionsSucceeded |
Nombre d'redrivenexécutions réussies. |
RedrivenExecutionsFailed |
Nombre d'redrivenexécutions qui ont échoué. |
Mesures d'exécution de Dimension for Step Functions
| Dimension | Description |
|---|---|
StateMachineArn
|
L'Amazon Resource Name (ARN) de la machine d'état pour l'exécution en question. |
Dimensions pour les exécutions avec version
| Dimension | Description |
|---|---|
StateMachineArn
|
Le nom de ressource Amazon (ARN) de la machine d'état dont l'exécution a été lancée par une version. |
Version |
Version de la machine à états utilisée pour démarrer l'exécution. |
Dimensions pour les exécutions avec un alias
| Dimension | Description |
|---|---|
StateMachineArn
|
Le nom de ressource Amazon (ARN) de la machine d'état dont l'exécution a été lancée par un alias. |
Alias |
Alias de machine à états utilisé pour démarrer l'exécution. |
Métriques de course sur la carte
L'espace de AWS/States noms inclut les métriques suivantes pour toutes les exécutions de carte Step Functions. Il s'agit de statistiques sans dimension qui s'appliquent à l'ensemble de votre compte dans une région.
| Métrique | Description |
|---|---|
| ApproximateOpenMapRunCount |
Nombre approximatif de courses cartographiques actuellement ouvertes en cours sur votre compte. Grâce à cette métrique, vous pouvez agir à l'approche du OpenMapRunLimit, afin d'éviter les courses de carte en retard. Pour qu'une alarme vous avertisse si vous approchez de votre cible OpenMapRunLimit, nous vous recommandons d'utiliser la statistique Maximum avec un seuil de 900 ou plus, car la valeur par défaut OpenManRunLimitest de 1 000 courses de carte. |
| OpenMapRunLimit |
Nombre maximum d'exécutions de carte ouvertes. Pour de plus amples informations, veuillez consulter Quotas liés aux comptes. |
| ApproximateMapRunBacklogSize |
Nombre approximatif de courses cartographiques en retard. Les courses de carte en attente attendent pendant l'MapRunStartedévénement que le nombre total de parties de carte ouvertes soit inférieur au quota. Le nombre d'objets sera nul tant que la Map Run est en attente. Le nombre augmentera une fois que le Map Run sera ouvert et commencera à lire ses entrées. |
Métriques de version et d'alias
L'espace de AWS/States noms inclut les métriques suivantes pour le nombre de versions et d'alias d'une machine à états.
Dimension pour les mesures relatives au nombre de ressources pour les versions et les alias
| Dimension | Description |
|---|---|
ResourceArn
|
Le nom de ressource Amazon (ARN) de la machine à états avec une version ou un alias. |
Métriques d'activité
L'espace de AWS/States noms inclut les métriques suivantes pour les activités de Step Functions.
Indicateurs au niveau du compte
Sans ARN de machine à états, les indicateurs suivants sont présentés au niveau du compte. Fournissez un ARN de machine à états à signaler au niveau de la machine à états.
| Métrique | Description |
|---|---|
ActivitiesFailed |
Nombre d'activités ayant échoué. |
ActivitiesHeartbeatTimedOut |
Nombre d'activités qui s'interrompent en raison d'un arrêt du rythme cardiaque. |
ActivitiesScheduled |
Nombre d'activités programmées. |
ActivitiesStarted |
Nombre d'activités démarrées. |
ActivitiesSucceeded |
Nombre d'activités achevées avec succès. |
ActivitiesTimedOut |
Nombre d'activités qui expirent à la fermeture. |
ActivityRunTime
|
Intervalle, en millisecondes, entre le début de l'activité et le moment où elle se termine. |
ActivityScheduleTime |
Intervalle, en millisecondes, pendant lequel l'activité reste dans l'état planifié. |
ActivityTime |
Intervalle, en millisecondes, entre le moment où l'activité est planifiée et celui où elle se termine. |
Mesures d'activité de Dimension for Step Functions
| Dimension | Description |
|---|---|
ActivityArn |
ARN de l'activité. |
Métriques de la fonction Lambda
L'espace de AWS/States noms inclut les métriques suivantes pour les fonctions Lambda auxquelles il est fait référence directement dans le champ Resource d'une définition d'état de tâche. Vous pouvez trouver ces métriques dans les anciennes machines d'état. Dans les machines à états modernes, nous recommandons d'utiliser l'intégration Lambda optimisée qui émet des métriques d'intégration des services.
| Métrique | Description |
|---|---|
LambdaFunctionRunTime |
Intervalle, en millisecondes, entre le moment où la fonction Lambda démarre et celui où elle se ferme. |
LambdaFunctionScheduleTime |
Intervalle, en millisecondes, pendant lequel la fonction Lambda reste dans l'état de planification. |
LambdaFunctionTime |
Intervalle, en millisecondes, entre le moment où la fonction Lambda est planifiée et le moment où elle se ferme. |
LambdaFunctionsFailed |
Nombre de fonctions Lambda ayant échoué. |
LambdaFunctionsScheduled |
Nombre de fonctions Lambda planifiées. |
LambdaFunctionsStarted |
Nombre de fonctions Lambda démarrées. |
LambdaFunctionsSucceeded |
Nombre de fonctions Lambda terminées avec succès. |
LambdaFunctionsTimedOut |
Nombre de fonctions Lambda qui expirent à la fermeture. |
Dimension for Step Functions > Métriques de la fonction Lambda
| Dimension | Description |
|---|---|
LambdaFunctionArn |
L'ARN de la fonction Lambda. |
Note
Les métriques de fonction Lambda sont émises pour les états de tâche qui spécifient l'ARN de la fonction Lambda dans le champ.
Resource États de tâches qui utilisent plutôt "Resource": "arn:aws:states:::lambda:invoke" des métriques d'intégration de services d'émission. Pour de plus amples informations, veuillez consulter Invoquer une AWS Lambda fonction avec Step Functions.
Métriques d'intégration de services
L'espace de AWS/States noms inclut les métriques suivantes pour les intégrations de services Step Functions. Pour de plus amples informations, veuillez consulter Intégrer les services avec Step Functions.
| Métrique | Description |
|---|---|
ServiceIntegrationRunTime |
Intervalle, en millisecondes, entre le début de la tâche de service et le moment où elle se termine. |
ServiceIntegrationScheduleTime |
Intervalle, en millisecondes, pendant lequel la tâche de service reste dans l'état planifié. |
ServiceIntegrationTime |
Intervalle, en millisecondes, entre le moment où la tâche de service est planifiée et celui où elle se termine. |
ServiceIntegrationsFailed |
Nombre de tâches de service ayant échoué. |
ServiceIntegrationsScheduled |
Nombre de tâches de service planifiées. |
ServiceIntegrationsStarted |
Nombre de tâches de service démarrées. |
ServiceIntegrationsSucceeded |
Nombre de tâches de service achevées avec succès. |
ServiceIntegrationsTimedOut |
Nombre de tâches de service qui expirent à la clôture. |
Mesures d'intégration du service Dimension for Step Functions
| Dimension | Description |
|---|---|
ServiceIntegrationResourceArn |
ARN de ressource du service intégré. |
Métriques de service
L'espace de AWS/States noms inclut les métriques suivantes pour les métriques du service Step Functions.
Indicateurs au niveau du compte
Sans ARN de machine à états, les indicateurs suivants sont présentés au niveau du compte. Fournissez un ARN de machine à états à signaler au niveau de la machine à états.
| Métrique | Description |
|---|---|
ConsumedCapacity |
Nombre de demandes par seconde. |
ProvisionedBucketSize |
Nombre de demandes disponibles par seconde. |
ProvisionedRefillRate |
Nombre de demandes autorisées dans le compartiment par seconde. |
ThrottledEvents
|
Nombre de demandes qui ont été limitées. |
Mesures du service Dimension for Step Functions
| Dimension | Description |
|---|---|
ServiceMetric |
Filtre les données à afficher StateTransition. |
StateMachineArn |
Filtre les données pour afficher les transitions pour une State Machine spécifique. |
Métriques d'utilisation de l'API
L'espace de AWS/States noms inclut les métriques suivantes pour l'API Step Functions.
| Métrique | Description |
|---|---|
ThrottledEvents
|
Nombre de demandes qui ont été limitées. |
ProvisionedBucketSize |
Nombre de demandes disponibles par seconde. |
ProvisionedRefillRate |
Nombre de demandes autorisées dans le compartiment par seconde. |
ConsumedCapacity |
Nombre de demandes par seconde. |
Mesures de l'API Dimension for Step Functions
| Dimension | Description |
|---|---|
APIName |
Filtre les données sur une API correspondant au nom d'API spécifié. |