Surveillance d'Amazon DocumentDB avec CloudWatch - Amazon DocumentDB

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance d'Amazon DocumentDB avec CloudWatch

Amazon DocumentDB (compatible avec MongoDB) s'intègre à Amazon CloudWatch afin que vous puissiez collecter et analyser les métriques opérationnelles de vos clusters. Vous pouvez surveiller ces métriques à l'aide de la CloudWatch console, de la console Amazon DocumentDB, du AWS Command Line Interface (AWS CLI) ou de l' CloudWatchAPI.

CloudWatch vous permet également de définir des alarmes afin d'être averti si une valeur métrique dépasse un seuil que vous spécifiez. Vous pouvez même configurer Amazon CloudWatch Events pour prendre des mesures correctives en cas de violation. Pour plus d'informations sur l'utilisation CloudWatch et les alarmes, consultez la CloudWatch documentation Amazon.

Métriques Amazon DocumentDB

Pour surveiller l'état et les performances de votre cluster et de vos instances Amazon DocumentDB, vous pouvez consulter les mesures suivantes dans la console Amazon DocumentDB.

Note

Les mesures présentées dans les tableaux suivants s'appliquent à la fois aux clusters basés sur des instances et aux clusters élastiques.

Métriques d'utilisation des ressources

Métrique Description
BackupRetentionPeriodStorageUsed La quantité totale de stockage de sauvegarde en octets utilisée pour prendre en charge la fonctionnalité de point-in-time restauration dans le cadre de la fenêtre de rétention d'Amazon DocumentDB. Incluse dans le total indiqué par la métrique TotalBackupStorageBilled. Calculée séparément pour chaque cluster Amazon DocumentDB.
ChangeStreamLogSize Quantité de stockage (en Mo) utilisée par votre cluster pour stocker le journal du flux de modifications. Cette valeur est un sous-ensemble du stockage total du cluster (VolumeBytesUsed) et affecte le coût du cluster. Pour obtenir des informations sur les tarifs du stockage, consultez la page produit Amazon DocumentDB. La taille du journal du flux de modifications est fonction de la quantité de modifications qui se produisent sur votre cluster et de la longue durée de rétention du flux de modifications. Pour de plus amples informations sur les flux de modifications, veuillez consulter Utilisation de flux de modifications avec Amazon DocumentDB.
CPUUtilization Pourcentage de l'UC utilisé par une instance.
DatabaseConnections Le nombre de connexions ouvertes sur une instance prise à une fréquence d'une minute.
DatabaseConnectionsMax Nombre maximal de connexions de base de données ouvertes sur une instance sur une période d'une minute.
DatabaseCursors Le nombre de curseurs ouverts sur une instance prise à une fréquence d'une minute.
DatabaseCursorsMax Le nombre maximum de curseurs ouverts sur une instance sur une période d'une minute.
DatabaseCursorsTimedOut Le nombre de curseurs dont le délai a expiré sur une période d'une minute.
FreeableMemory Quantité de mémoire vive disponible, en octets.
FreeLocalStorage

Cette métrique indique la quantité de stockage accessible à chaque instance pour les journaux et les tables temporaires. Cette valeur dépend de la classe d'instance. Vous pouvez augmenter la quantité d'espace de stockage libre pour une instance en choisissant une classe d'instance plus grande pour votre instance.

LowMemThrottleQueueDepth

La profondeur de la file d'attente pour les demandes limitées en raison d'une faible quantité de mémoire disponible traitées à une fréquence d'une minute.

LowMemThrottleMaxQueueDepth

Profondeur de file d'attente maximale pour les demandes limitées en raison d'un manque de mémoire disponible sur une période d'une minute.

LowMemNumOperationsThrottled

Nombre de demandes limitées en raison d'un manque de mémoire disponible sur une période d'une minute.

SnapshotStorageUsed Quantité totale de stockage de sauvegarde en octets consommée par tous les instantanés d'un cluster Amazon DocumentDB donné en dehors de sa fenêtre de conservation des sauvegardes. Incluse dans le total indiqué par la métrique TotalBackupStorageBilled. Calculée séparément pour chaque cluster Amazon DocumentDB.
SwapUsage Quantité d'espace d'échange utilisé sur l'instance.
TotalBackupStorageBilled La quantité totale de stockage de sauvegarde en octets pour laquelle vous êtes facturé pour un cluster Amazon DocumentDB donné. Inclut le stockage de sauvegarde mesuré par les métriques BackupRetentionPeriodStorageUsed et SnapshotStorageUsed. Calculée séparément pour chaque cluster Amazon DocumentDB.
TransactionsOpen Le nombre de transactions ouvertes sur une instance prise à une fréquence d'une minute.
TransactionsOpenMax Le nombre maximum de transactions ouvertes sur une instance au cours d'une période d'une minute.
VolumeBytesUsed Volume de stockage, en octets, utilisé par votre cluster. Cette valeur a une incidence sur le coût du cluster. Pour obtenir des informations sur les tarifs, consultez la page produit Amazon DocumentDB.

Métriques de latence

Métrique Description
DBClusterReplicaLagMaximum Le délai maximal, en millisecondes, entre l'instance principale et chaque instance Amazon DocumentDB du cluster.
DBClusterReplicaLagMinimum Durée minimale du retard, millisecondes, entre l'instance principale et chaque instance de réplica dans le cluster.
DBInstanceReplicaLag La durée du retard, en millisecondes, lors de la réplication des mises à jour à partir de l'instance principale vers une instance de réplica.
ReadLatency Temps moyen nécessaire pour les opérations d'I/O par disque.
WriteLatency Temps moyen, en millisecondes, nécessaire pour les opérations d'E/S par disque.

NVMe-métriques d'instance soutenues

Métrique Description
NVMeStorageCacheHitRatio Pourcentage de demandes traitées par le cache hiérarchisé.
FreeNVMeStorage La quantité de stockage éphémère NVMe disponible.
ReadIOPSNVMeStorage Nombre moyen d'opérations d'E/S de lecture sur disque vers le stockage éphémère NVMe .
ReadLatencyNVMeStorage Durée moyenne par opération d'E/S de lecture sur disque pour le stockage éphémère NVMe .
ReadThroughputNVMeStorage Nombre moyen d'octets lus sur le disque par seconde pour le stockage éphémère NVMe .
WriteIOPSNVMeStorage Nombre moyen d'opérations d'E/S d'écriture sur disque vers le stockage éphémère NVMe .
WriteLatencyNVMeStorage Durée moyenne par opération d'E/S d'écriture sur disque pour le stockage éphémère NVMe .
WriteThroughputNVMeStorage Nombre moyen d'octets écrits sur le disque par seconde pour le stockage éphémère NVMe .

Métriques des opérations

Métrique Description
DocumentsDeleted Le nombre de documents supprimés sur une période d'une minute.
DocumentsInserted Le nombre de documents insérés au cours d'une période d'une minute.
DocumentsReturned Le nombre de documents renvoyés sur une période d'une minute.
DocumentsUpdated Le nombre de documents mis à jour sur une période d'une minute.
OpcountersCommand Le nombre de commandes émises au cours d'une période d'une minute.
OpcountersDelete Nombre d'opérations de suppression effectuées au cours d'une période d'une minute.
OpcountersGetmore Le nombre de getmores émis sur une période d'une minute.
OpcountersInsert Le nombre d'opérations d'insertion effectuées au cours d'une période d'une minute.
OpcountersQuery Le nombre de requêtes émises au cours d'une période d'une minute.
OpcountersUpdate Nombre d'opérations de mise à jour effectuées au cours d'une période d'une minute.
TransactionsStarted Le nombre de transactions démarrées sur une instance au cours d'une période d'une minute.
TransactionsCommitted Le nombre de transactions validées sur une instance au cours d'une période d'une minute.
TransactionsAborted Le nombre de transactions abandonnées sur une instance au cours d'une période d'une minute.
TTLDeletedDocuments Le nombre de documents supprimés par a sur une TTLMonitor période d'une minute.

Métriques de débit

Métrique Description
NetworkReceiveThroughput Quantité de débit réseau reçue des clients par chaque instance du cluster de base de données, en octets par seconde. Ce débit n'inclut pas le trafic réseau entre les instances du cluster et le volume de cluster.
NetworkThroughput Le débit réseau, en octets par seconde, reçu et transmis aux clients par chaque instance du cluster Amazon DocumentDB. Ce débit n'inclut pas le trafic réseau entre les instances du cluster et le volume de cluster.
NetworkTransmitThroughput Quantité de débit réseau envoyée aux clients par chaque instance du cluster, en octets par seconde. Ce débit n'inclut pas le trafic réseau entre les instances du cluster et le volume de cluster.
ReadIOPS Nombre moyen d'opérations d'I/O de lecture de disque par seconde. Amazon DocumentDB signale les IOPS en lecture et en écriture séparément, à intervalles d'une minute.
ReadThroughput Nombre moyen d’octets lus sur le disque par seconde.
StorageNetworkReceiveThroughput Le débit réseau, en octets par seconde, reçu du volume de stockage du cluster Amazon DocumentDB par chaque instance du cluster.
StorageNetworkTransmitThroughput Le débit réseau, en octets par seconde, envoyé au volume de stockage du cluster Amazon DocumentDB par chaque instance du cluster.
StorageNetworkThroughput Le débit réseau, en octets par seconde, reçu et envoyé au volume de stockage du cluster Amazon DocumentDB par chaque instance du cluster Amazon DocumentDB.
VolumeReadIOPs

Nombre moyen d'opérations d'E/S de lecture facturées depuis un volume de cluster, rapportées par intervalles de 5 minutes. Les opérations lues facturées sont calculées au niveau du volume de cluster, regroupées à partir de toutes les instances du cluster, puis rapportées par intervalles de 5 minutes. La valeur est calculée en prenant la valeur de la métrique des opérations de lecture sur une période de 5 minutes. Vous pouvez déterminer la quantité d'opérations lues facturées par seconde en prenant la valeur de la métrique des opérations de lecture facturées et en la divisant par 300 secondes.

Par exemple, si le résultat VolumeReadIOPs renvoie 13 686, le nombre d'opérations de lecture facturées par seconde est de 45 (13 686/300 = 45,62).

Vous cumulez les opérations de lecture facturées pour les requêtes qui demandent des pages de base de données non présentes dans le cache des tampons et qui doivent, par conséquent, être chargées depuis le stockage. Il se peut que vous constatiez des pics dans les opérations de lecture facturées, car les résultats des requêtes sont lus à partir du stockage, puis chargés dans le cache des tampons.

VolumeWriteIOPs

Nombre moyen d'opérations d'E/S de lecture facturées depuis un volume de cluster, rapportées par intervalles de 5 minutes. Les opérations lues facturées sont calculées au niveau du volume de cluster, regroupées à partir de toutes les instances du cluster, puis rapportées par intervalles de 5 minutes. La valeur est calculée en prenant la valeur de la métrique des opérations en écriture sur une période de 5 minutes. Vous pouvez déterminer la quantité d'opérations lues facturées par seconde en prenant la valeur de la métrique des opérations en écriture facturées et en la divisant par 300 secondes.

Par exemple, si le VolumeWriteIOPs renvoie 13 686, le nombre d'opérations d'écriture facturées par seconde est de 45 (13 686/300 = 45,62).

Notez que VolumeReadIOPs les VolumeWriteIOPs métriques sont calculées par la couche de stockage DocumentDB et qu'elles sont également IOs effectuées par l'instance principale et par l'instance de réplique. Les données sont agrégées toutes les 20 à 30 minutes, puis rapportées à intervalles de 5 minutes, émettant ainsi le même point de données pour la métrique au cours de la période. Si vous recherchez une métrique à corréler à vos opérations d'insertion sur un intervalle d'une minute, vous pouvez utiliser la métrique WriteIops au niveau de l'instance. La métrique est disponible dans l'onglet de surveillance de votre instance principale Amazon DocumentDB.

WriteIOPS Nombre moyen d'opérations d'I/O d'écriture de disque par seconde. Lorsqu'ils sont utilisés au niveau du cluster, WriteIOPs ils sont évalués sur toutes les instances du cluster. Les IOPS de lecture et d'écriture sont signalées séparément et à des intervalles d'une minute.
WriteThroughput Nombre moyen d’octets écrits sur le disque par seconde.

Métriques du système

Métrique Description
BufferCacheHitRatio Pourcentage de demandes traitées par le cache de tampon.
DiskQueueDepth Nombre d'opérations d'E/S en attente d'écriture ou de lecture sur le disque.
EngineUptime Temps d'exécution de l'instance, en secondes.
IndexBufferCacheHitRatio Pourcentage de demandes d'index traitées par le cache tampon. Vous pouvez constater un pic supérieur à 100 % pour la métrique juste après la suppression d'un index, d'une collection ou d'une base de données. Cela sera automatiquement corrigé au bout de 60 secondes. Cette limitation sera corrigée lors d'une future mise à jour du correctif.

Métriques de l'instance T3

Métrique Description
CPUCreditUsage Le nombre de crédits CPU dépensés pendant la période de mesure.
CPUCreditBalance Le nombre de crédits CPU accumulés par une instance. Ce solde diminue lorsque les crédits UC sont dépensés plus rapidement qu’ils ne sont gagnés.
CPUSurplusCreditBalance Le nombre de crédits CPU excédentaires dépensés pour maintenir les performances du processeur lorsque la valeur du CPUCredit solde est nulle.
CPUSurplusCreditsCharged Le nombre de crédits CPU excédentaires dépassant le nombre maximum de crédits CPU pouvant être gagnés sur une période de 24 heures, et entraînant ainsi des frais supplémentaires. Pour plus d'informations, consultez la section Surveillance des crédits de votre processeur.

Visualisation CloudWatch des données

Vous pouvez consulter les CloudWatch données Amazon à l'aide de la CloudWatch console, de la console Amazon DocumentDB AWS Command Line Interface (AWS CLI) ou de l' CloudWatch API.

Using the AWS Management Console

Pour consulter CloudWatch les métriques à l'aide de la console de gestion Amazon DocumentDB, procédez comme suit.

  1. Connectez-vous à la AWS Management Console console Amazon DocumentDB et ouvrez-la à https://console.aws.amazon.com l'adresse /docdb.

  2. Dans le panneau de navigation, choisissez Clusters.

    Astuce

    Si vous ne voyez pas le volet de navigation sur le côté gauche de votre écran, choisissez l'icône de menu (Hamburger menu icon with three horizontal lines.) dans le coin supérieur gauche de la page.

  3. Dans la boîte de navigation Clusters, vous verrez la colonne Cluster Identifier. Vos instances sont répertoriées sous des clusters, comme dans la capture d'écran ci-dessous.

    Tableau des clusters indiquant comment une instance est imbriquée sous un cluster.
  4. Dans la liste des instances, choisissez le nom de l'instance pour laquelle vous souhaitez obtenir des métriques.

  5. Sur la page de résumé de l'instance qui s'affiche, choisissez l'onglet Monitoring pour afficher les représentations graphiques des métriques de votre instance Amazon DocumentDB. Étant donné qu'un graphique doit être généré pour chaque métrique, le remplissage CloudWatchdes graphiques peut prendre quelques minutes.

    L'image suivante montre les représentations graphiques de deux CloudWatch métriques dans la console Amazon DocumentDB, etWriteIOPS. ReadIOPS

    Deux graphiques linéaires représentant les métriques WriteIops et CloudWatch ReadiOps dans la console Amazon DocumentDB.
Using the CloudWatch Management Console

Pour consulter CloudWatch les métriques à l'aide CloudWatch de la console de gestion, procédez comme suit.

  1. Connectez-vous à la AWS Management Console console Amazon DocumentDB et ouvrez-la à l'adresse. https://console.aws.amazon.com/cloudwatch

  2. Dans le panneau de navigation, sélectionnez ‎Métriques. Ensuite, dans la liste des noms de service, choisissez DocDB.

  3. Choisissez une dimension métrique (par exemple, Cluster Metrics).

  4. L'onglet Toutes les métriques affiche toutes les métriques pour cette dimension dans DocDB.

    1. Pour trier le tableau, utilisez l’en-tête de colonne.

    2. Pour représenter graphiquement une métrique, cochez la case en regard de la métrique. Pour sélectionner toutes les métriques, cochez la case dans la ligne d’en-tête du tableau.

    3. Pour filtrer par métrique, passez le curseur sur le nom de la métrique et sélectionnez la flèche déroulante à côté du nom de la métrique. Choisissez ensuite Ajouter à la recherche, comme indiqué dans l'image ci-dessous.

      L'onglet Toutes les métriques répertorie les métriques, avec une liste déroulante qui apparaît pour le nom d'une métrique.
Using the AWS CLI

Pour afficher CloudWatch les données d'Amazon DocumentDB, utilisez l' CloudWatch get-metric-statisticsopération avec les paramètres suivants.

Paramètres
  • --namespace — Obligatoire. L'espace de nom du service pour lequel vous voulez les métriques CloudWatch . Pour Amazon DocumentDB, cela doit être le cas. AWS/DocDB

  • --metric-name — Obligatoire. Nom de la métrique pour laquelle vous souhaitez obtenir des données.

  • --start-time — Obligatoire. L'horodatage qui détermine le premier point de données à renvoyer.

    La valeur spécifiée est inclusive ; les résultats incluent des points de données avec l'horodatage spécifié. L'horodatage doit être au format ISO 8601 UTC (par exemple, 2016-10-03T23:00:00Z).

  • --end-time — Obligatoire. L'horodatage qui détermine le dernier point de données à renvoyer.

    La valeur spécifiée est inclusive ; les résultats incluent des points de données avec l'horodatage spécifié. L'horodatage doit être au format ISO 8601 UTC (par exemple, 2016-10-03T23:00:00Z).

  • --period — Obligatoire. La granularité, en secondes, des points de données renvoyés. Pour les métriques avec une résolution standard, une période peut se réduire à une seule minute (60 secondes) et doit être un multiple de 60. Pour les métriques haute résolution qui sont collectées à des intervalles de moins d'une minute, la période peut être 1, 5, 10, 30, 60, ou tout multiple de 60.

  • --dimensions— Facultatif Si la métrique contient plusieurs dimensions, vous devez inclure une valeur pour chaque dimension. CloudWatch traite chaque combinaison unique de dimensions comme une métrique distincte. Vous ne pouvez pas récupérer les statistiques d'une combinaison de dimensions qui n'a pas été spécifiquement publiée. Vous devez spécifier les mêmes dimensions que celles utilisées lorsque les mesures ont été créées.

  • --statistics— Facultatif Statistiques de la métrique, autres que des percentiles. Pour les statistiques sur les centiles, utilisez ExtendedStatistics. En appelant GetMetricStatistics, vous devez spécifier Statistics ou ExtendedStatistics, mais pas les deux.

    Valeurs autorisées :
    • SampleCount

    • Average

    • Sum

    • Minimum

    • Maximum

  • --extended-statistics— Facultatif Les statistiques sur les percentile. Spécifiez des valeurs comprises entre p0.0 et p100. En appelant GetMetricStatistics, vous devez spécifier Statistics ou ExtendedStatistics, mais pas les deux.

  • --unit— Facultatif L'unité pour une métrique donnée. Les métriques peuvent être exprimées en unités multiples. Le fait de ne pas fournir une unité entraîne le renvoi de toutes les unités. Si vous spécifiez uniquement une unité que la métrique ne rapporte pas, les résultats de l'appel sont null.

    Valeurs possibles :
    • Seconds

    • Microseconds

    • Milliseconds

    • Bytes

    • Kilobytes

    • Megabytes

    • Gigabytes

    • Terabytes

    • Bits

    • Kilobytes

    • Megabits

    • Gigabits

    • Terabits

    • Percent

    • Count

    • Bytes/Second

    • Kilobytes/Second

    • Megabytes/Second

    • Gigabytes/Second

    • Terabytes/Second

    • Bits/Second

    • Kilobits/Second

    • Megabits/Second

    • Gigabits/Second

    • Terabits/Second

    • Count/Second

    • None

L'exemple suivant trouve la CPUUtilization maximale pour une période de 2 heures en prélevant un échantillon toutes les 60 secondes.

Pour Linux, macOS ou Unix :

aws cloudwatch get-metric-statistics \ --namespace AWS/DocDB \ --dimensions \ Name=DBInstanceIdentifier,Value=docdb-2019-01-09-23-55-38 \ --metric-name CPUUtilization \ --start-time 2019-02-11T05:00:00Z \ --end-time 2019-02-11T07:00:00Z \ --period 60 \ --statistics Maximum

Pour Windows :

aws cloudwatch get-metric-statistics ^ --namespace AWS/DocDB ^ --dimensions ^ Name=DBInstanceIdentifier,Value=docdb-2019-01-09-23-55-38 ^ --metric-name CPUUtilization ^ --start-time 2019-02-11T05:00:00Z ^ --end-time 2019-02-11T07:00:00Z ^ --period 60 ^ --statistics Maximum

Le résultat de cette opération ressemble à ce qui suit :

{ "Label": "CPUUtilization", "Datapoints": [ { "Unit": "Percent", "Maximum": 4.49152542374361, "Timestamp": "2019-02-11T05:51:00Z" }, { "Unit": "Percent", "Maximum": 4.25000000000485, "Timestamp": "2019-02-11T06:44:00Z" }, ********* some output omitted for brevity ********* { "Unit": "Percent", "Maximum": 4.33333333331878, "Timestamp": "2019-02-11T06:07:00Z" } ] }

Dimensions d'Amazon DocumentDB

Les métriques d'Amazon DocumentDB sont qualifiées par les valeurs du compte ou de l'opération. Vous pouvez utiliser la CloudWatch console pour récupérer les données Amazon DocumentDB filtrées selon l'une des dimensions du tableau suivant.

Dimension Description
DBClusterIdentifier Filtre les données que vous demandez pour un cluster Amazon DocumentDB spécifique.
DBClusterIdentifier, Role Filtre les données que vous demandez pour un cluster Amazon DocumentDB spécifique, en agrégeant la métrique par rôle d'instance (WRITER/READER). Par exemple, vous pouvez regrouper des métriques pour toutes les instances READER qui appartiennent à un cluster.
DBInstanceIdentifier Filtre les données que vous demandez pour une instance de base de données spécifique.

Surveillance des métriques d'Opcounter

Les métriques Opcounter ont une valeur différente de zéro (généralement ~50) pour les clusters inactifs. Cela est dû au fait qu'Amazon DocumentDB effectue des contrôles de santé périodiques, des opérations internes et des tâches de collecte de métriques.

Surveillance des connexions aux bases de données

Lorsque vous visualisez le nombre de connexions à l'aide de commandes du moteur de base de donnéesdb.runCommand( { serverStatus: 1 }), par exemple, vous pouvez voir jusqu'à 10 connexions de plus que ce que vous voyez en DatabaseConnections entrée CloudWatch. Cela se produit parce qu'Amazon DocumentDB effectue des contrôles de santé périodiques et des tâches de collecte de métriques qui ne sont pas prises en compte. DatabaseConnections DatabaseConnectionsreprésente uniquement les connexions initiées par le client.