Amazon Timestream pour InfluxDB 3 - Amazon Timestream

Pour des fonctionnalités similaires à celles d'Amazon Timestream pour, pensez à Amazon Timestream LiveAnalytics pour InfluxDB. Il permet une ingestion simplifiée des données et des temps de réponse aux requêtes à un chiffre en millisecondes pour des analyses en temps réel. Pour en savoir plus, cliquez ici.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon Timestream pour InfluxDB 3

Qu'est-ce que Timestream pour InfluxDB 3 ?

Amazon Timestream pour InfluxDB 3 est un service de base de données chronologique géré qui permet aux développeurs d'applications DevOps et aux équipes d'exécuter facilement des bases AWS de données InfluxDB 3 pour des applications d'analyse de séries chronologiques à grande échelle utilisant l'open source. APIs Avec Amazon Timestream pour InfluxDB 3, vous pouvez facilement configurer, exploiter et dimensionner des charges de travail chronologiques conçues pour gérer des données à cardinalité élevée et des requêtes analytiques complexes.

InfluxDB 3 représente une réinvention architecturale complète du moteur de base de données InfluxDB. Contrairement aux versions 1 et 2, qui utilisaient un moteur de stockage TSM (Time-Structured Merge Tree), InfluxDB 3 repose sur des bases technologiques totalement différentes. Cette nouvelle version utilise Apache Arrow pour le traitement des données en mémoire, Apache Data Fusion pour l'exécution des requêtes et un format de stockage en colonnes (Parquet) pour la persistance des données dans le stockage d'objets (Amazon S3). Ce changement d'architecture permet à InfluxDB 3 de fournir des performances améliorées pour les données à haute cardinalité et d'évoluer efficacement pour les charges de travail analytiques importantes. L'architecture InfluxDB 3 améliore les performances des requêtes et l'utilisation des ressources pour les cas d'utilisation gourmands en données.

Amazon Timestream pour InfluxDB 3 vous donne accès aux fonctionnalités de ce moteur de base de données de séries chronologiques de nouvelle génération. La transformation architecturale permet des charges de travail d'analyse de séries chronologiques à grande échelle et tire parti des capacités de compression, de partitionnement et d'optimisation des requêtes inhérentes au format de stockage en colonnes Parquet. En découplant le calcul du stockage, InfluxDB 3 peut évoluer pour gérer des volumes de données pratiquement illimités tout en préservant la rentabilité.

Amazon Timestream pour InfluxDB 3 peut sauvegarder automatiquement votre base de données et maintenir votre logiciel de base de données à jour avec la dernière version. Comme pour tout Services AWS, aucun investissement initial n'est requis et vous ne payez que pour les ressources que vous utilisez.

Clusters DB

Un cluster de base de données est l'élément fondamental de Timestream pour InfluxDB 3. Contrairement aux instances de base de données traditionnelles, InfluxDB 3 utilise une architecture basée sur des clusters qui sépare le calcul du stockage, en tirant parti d'Amazon S3 pour un stockage de données pratiquement illimité et rentable.

Vous pouvez configurer vos déploiements InfluxDB 3 dans les versions Core ou Enterprise :

Version de base

La version Core d'InfluxDB 3 est limitée aux déploiements de clusters à nœud unique et ne dispose pas de capacités de compactage, ce qui a un impact sur son adéquation à certaines charges de travail. En raison de ces limites, la version Core est principalement conçue pour les charges de travail en temps quasi réel axées sur des données récentes (généralement datant de quelques jours). Il n'est pas recommandé pour les cas d'utilisation impliquant un stockage et une analyse à long terme, car les performances se dégraderont au fil du temps sans processus de compactage pour optimiser le stockage.

Version d'entreprise

La version Enterprise d'InfluxDB 3 prend en charge les configurations de clusters à nœuds multiples et inclut des fonctionnalités de compactage essentielles, permettant une mise à l'échelle horizontale pour les opérations de lecture et d'écriture. Ces déploiements multi-nœuds offrent une disponibilité améliorée, des performances améliorées pour les requêtes simultanées et une meilleure résilience globale du système. La fonctionnalité de compactage de la version Enterprise la rend adaptée aux données à haute cardinalité et aux cas d'utilisation d'analyses à long terme, car elle optimise en permanence le format de stockage sous-jacent. Les clusters d'entreprise peuvent être étendus en ajoutant des nœuds pour faire face à des charges de travail croissantes sans perturber les opérations en cours.

Chaque cluster de base de données possède un identifiant de cluster de base de données. Ce nom généré automatiquement identifie de manière unique le cluster de base de données lors de l'interaction avec l'API et les commandes Amazon Timestream for InfluxDB. AWS CLI L'identifiant du cluster de base de données est unique pour ce client dans un Région AWS.

Timestream for InfluxDB alloue un point de terminaison DNS à votre cluster. L'identifiant généré par le service fait partie du point de terminaison DNS du cluster. Par exemple, si l'identifiant généré par le service du cluster estxghozx1v79, le point de terminaison DNS l'est. xghozx1v79-3ksj4dla5nfjhi.timestream-influxdb3.us-east-1.on.aws

Amazon Timestream for InfluxDB 3 vous permet de créer un compte utilisateur principal et un mot de passe pour votre cluster de base de données dans le cadre du processus de création. Cet utilisateur principal est autorisé à créer des bases de données, des tables et à effectuer des opérations de lecture, d'écriture, de suppression et d'insertion sur vos données.

Pour accéder à une interface utilisateur visuelle basée sur le Web, vous pouvez utiliser InfluxDB Explore, qui peut être téléchargé InfluxDataet exécuté sur vos propres instances.

Catégories de clusters de bases de données

La classe de cluster de base de données détermine le calcul et la capacité de mémoire des nœuds de votre Amazon Timestream pour les clusters InfluxDB 3. La classe de cluster appropriée dépend de votre puissance de traitement et de vos besoins en mémoire.

Classes de cluster InfluxDB 3

Les clusters InfluxDB 3 utilisent des classes d'instances spécifiquement optimisées pour l'architecture de stockage basée sur Amazon S3. Ces classes, désignées commedb.influxIOIncluded, sont conçues pour équilibrer les ressources de calcul avec les I/O exigences liées à l'utilisation du stockage d'objets. Le prix des instances de db.influxIOIncluded calcul inclut déjà toutes les I/O opérations effectuées sur Amazon S3, offrant ainsi aux clients des coûts prévisibles, quels que soient leurs modèles d'E/S spécifiques.

Le tableau suivant présente les détails matériels des classes de nœuds de cluster InfluxDB 3 :

Classe d'instance vCPU Mémoire (Gio) Type de stockage Bande passante réseau (Gbit/s)
db.influx .medium IOIncluded 1 8 Stockage d'objets S3 12
db.influx .large IOIncluded 2 16 Stockage d'objets S3 12
db.influx .xlarge IOIncluded 3 32 Stockage d'objets S3 15
db.influx .2xlarge IOIncluded 8 64 Stockage d'objets S3 20
db.influx 4 x large IOIncluded 16 128 Stockage d'objets S3 25
db.influx 8 x large IOIncluded 32 256 Stockage d'objets S3 30
db.influx .12 x large IOIncluded 48 384 Stockage d'objets S3 22,5
db.influx .16 x large IOIncluded 64 512 Stockage d'objets S3 30
db.influx .24 x large IOIncluded 96 768 Stockage d'objets S3 40

Les classes d'db.influxIOIncludedinstances sont spécifiquement conçues pour :

  1. Gérez efficacement les I/O opérations entre les nœuds de calcul et le stockage d'objets Amazon S3.

  2. Fournissez des memory-to-CPU ratios optimaux pour le traitement des données de séries chronologiques à l'aide du framework Apache Arrow.

  3. Support des exigences informatiques du moteur de requête Data Fusion.

Pour les déploiements d'entreprise avec des clusters à nœuds multiples, tous les nœuds utilisent la même classe d'instance afin de garantir des performances équilibrées au sein du cluster. À mesure que votre charge de travail augmente, vous pouvez l'augmenter en sélectionnant une classe d'instance plus grande pour tous les nœuds du cluster ou l'étendre en ajoutant d'autres nœuds de la même classe à votre cluster.

Spécifications matérielles pour les classes de clusters de base de données

La terminologie suivante décrit les spécifications matérielles des classes de clusters de base de données :

  • vCPU — Nombre d'unités centrales virtuelles ()CPUs. Un processeur virtuel est une unité de capacité que vous pouvez utiliser pour comparer les classes de clusters de bases de données.

  • Mémoire (GiB) : RAM, en gibioctets, allouée au nœud du cluster de base de données. Il existe souvent un ratio cohérent entre la mémoire et le processeur virtuel.

  • Type de stockage — InfluxDB 3 utilise le stockage d'objets S3, qui est distinct des nœuds de calcul.

  • Bande passante réseau : vitesse du réseau par rapport aux autres classes de clusters de base de données.

Stockage en cluster de base de

Amazon Timestream pour InfluxDB 3 introduit une architecture de stockage différente qui dissocie le calcul du stockage en tirant parti d'Amazon S3 pour le stockage d'objets. Cette architecture fournit une capacité de stockage pratiquement illimitée tout en maîtrisant les coûts lors de déploiements à grande échelle.

Stockage d'objets InfluxDB

Les clusters InfluxDB 3 utilisent une seule classe de stockage appelée InfluxDB Object Storage, basée sur Amazon S3. Cette option de stockage offre :

  • Capacité de stockage pratiquement illimitée

  • Stockage rentable pour les gros volumes de données (jusqu'à 75 % d'économies pour les déploiements supérieurs à 16 To par rapport à InfluxDB 2.x)

  • Durabilité de 99,999999999 % (11 minutes)

  • Données stockées au format Colonnaire Parquet pour une compression et des performances de requête efficaces

Contrairement aux architectures de base de données traditionnelles où le stockage est directement attaché aux nœuds de calcul, le stockage d'objets d'InfluxDB 3 est partagé entre tous les nœuds du cluster. Chaque nœud gère des caches locaux en mémoire pour les données fréquemment consultées afin d'optimiser les performances des requêtes pendant que les données sous-jacentes restent dans Amazon S3.

La tarification du stockage d'objets InfluxDB est basée sur :

  • Volume de données total stocké (Go/mois), avec une charge mensuelle minimale équivalente à 200 Go

I/O les coûts d'exploitation sont inclus dans les tarifs de calcul pour les classes d'IOIncluded instances db.influx, ce qui permet aux clients de bénéficier de coûts plus prévisibles, quels que soient leurs modèles spécifiques. I/O

Avantages de l'architecture de stockage

L'architecture de stockage basée sur Amazon S3 dans InfluxDB 3 est particulièrement avantageuse pour :

  • Charges de travail d'analyse de séries chronologiques à grande échelle

  • Exigences en matière de données à cardinalité élevée

  • Scénarios de conservation des données à long terme

  • Stockage rentable de grands ensembles de données chronologiques

Ce modèle de stockage est comparable à Timestream for LiveAnalytics 'Magnetic Storage Tier, qui est également basé sur le stockage d'objets et optimisé pour les cas d'utilisation du stockage et de l'analyse à long terme. L'économie de stockage d'InfluxDB 3 est conçue pour être compétitive par rapport à la « tarification magnétique LiveAnalytics », un modèle qui s'est avéré adapté aux clients qui souhaitent exécuter et stocker des charges de travail et des données de séries chronologiques à grande échelle pendant de longues périodes.

Dimensionnement du cluster de bases de données

La configuration optimale d'un cluster Timestream pour InfluxDB 3 dépend de divers facteurs, notamment le taux d'ingestion, la taille des lots, la cardinalité des séries chronologiques, les requêtes simultanées et les types de requêtes.

Lors du dimensionnement des clusters InfluxDB 3, tenez compte de ces facteurs supplémentaires en raison de leur architecture différente :

  • Efficacité du stockage : pour les déploiements contenant plus de 16 To de données, le stockage d'objets d'InfluxDB 3 peut permettre de réaliser jusqu'à 75 % d'économies par rapport à Timestream pour les déploiements d'InfluxDB 2.

  • Caractéristiques de la charge de travail : InfluxDB 3 est optimisé pour les données à haute cardinalité et les requêtes analytiques sur de grands ensembles de données, tout en offrant des performances comparables à celles des versions 1.x et 2.x pour les requêtes de courte durée. En outre, des fonctionnalités telles que les caches de dernière valeur et de valeur distincte permettent de maintenir des latences de requête inférieures à 10 ms pour des cas d'utilisation spécifiques tels que la récupération des points de données les plus récents ou des valeurs de métadonnées uniques.

  • Modèles de requêtes : déterminez si votre charge de travail est continue (surveillance 24 heures sur 24, 7 jours sur 7) ou intermittente (analyses périodiques)

  • Exigences de compactage : La version Enterprise inclut des fonctionnalités de compactage essentielles pour le stockage de données à long terme et les charges de travail à cardinalité élevée. Pour les déploiements comportant des clusters à 3 nœuds ou plus, il est recommandé d'utiliser un nœud compacteur dédié afin de maximiser les performances du rédacteur et du lecteur sur les autres nœuds individuels, en veillant à ce que les processus de compactage ne soient pas en concurrence pour les ressources avec les opérations de requête et d'ingestion.

Pour fournir des recommandations de dimensionnement, considérons une charge de travail exemplaire présentant les caractéristiques suivantes :

  • Les données sont collectées et écrites par une flotte d'agents Telegraf rassemblant le système, le processeur, la mémoire, le disque, les E/S, etc. à partir d'un centre de données.

  • Chaque demande d'écriture contient 5 000 lignes.

  • Les requêtes exécutées sur le système sont classées dans la catégorie des requêtes « de complexité modérée », présentant les caractéristiques suivantes :

    • Ils ont plusieurs fonctions et une ou deux expressions régulières.

    • Ils peuvent inclure des clauses groupées ou des exemples sur une période de plusieurs semaines.

    • Leur exécution prend généralement de quelques centaines de millisecondes à quelques milliers de millisecondes.

    • Le processeur favorise principalement les performances des requêtes.

    • Tous les tests ont été réalisés avec un ensemble de données contenant une cardinalité de 30 millions de séries chronologiques.

Écritures (lignes par seconde) Lectures (requêtes par seconde) Classe d'instance Version
~150 000 <25 db.influx .large IOIncluded Principal
~200 000 ~25 db.influx .xlarge IOIncluded Principal
~250 000 ~35 db.influx .2xlarge IOIncluded Enterprise
~500 000 ~50 db.influx 4 x large IOIncluded Enterprise
<750 000 <100 db.influx 8 x large IOIncluded Enterprise
> 750 000 >100 Cluster d'entreprise à nœuds multiples Enterprise

Facturation du cluster de bases de données pour Amazon Timestream pour InfluxDB 3

Les clusters Amazon Timestream pour InfluxDB 3 sont facturés sur la base des composants suivants :

  • Heures de nœud de cluster de base de données (par heure) : basées sur la classe de nœud de cluster de base de données, par exemple db.influx .largeIOIncluded. La tarification est indiquée selon une base horaire, mais les factures sont calculées à la seconde près et affichent les heures sous une forme décimale. L'utilisation est facturée par tranches d'une seconde, avec un minimum de 10 minutes. Pour les déploiements Core à nœud unique ou les déploiements d'entreprise à nœuds multiples, chaque nœud est facturé séparément en fonction de sa durée de fonctionnement.

  • Stockage d'objets (par Go par mois) — Volume de données réel stocké dans InfluxDB Object Storage, plutôt que dans la capacité allouée. Ce modèle vous permet de payer uniquement pour le stockage que vous utilisez, sans qu'il soit nécessaire de préprovisionner de la capacité de stockage. Remarque : des frais de stockage mensuels minimaux équivalent à 200 Go sont facturés, même si votre utilisation réelle du stockage est inférieure.

  • Transfert de données sortantes (par Go) — Transfert de données depuis votre cluster de base de données vers Internet ou autre Régions AWS. Le transfert de données ou le trafic au sein d'un même VPC ou entre des zones de disponibilité au sein d'un même VPC Région AWS sont gratuits.

  • Licence InfluxDB 3 Enterprise (par vCPU par heure) — Pour les déploiements InfluxDB 3 Enterprise, un InfluxData coût de licence supplémentaire est facturé par vCPU et par heure. Ces frais de licence sont facturés directement AWS Marketplace et apparaissent sur une ligne distincte sur votre AWS facture. La licence active des fonctionnalités d'entreprise telles que le clustering multi-nœuds, les capacités de compactage et les fonctionnalités de sécurité avancées.

Pour les clusters InfluxDB 3 Enterprise dotés de plusieurs nœuds, chaque nœud est facturé séparément en fonction de sa classe d'instance et du nombre de vCPU (pour les frais de licence), tandis que les coûts de stockage sont consolidés puisque tous les nœuds partagent le même stockage d'objets sous-jacent.

Récapitulatif des composants de facturation
Composant de facturation InfluxDB 3 cœurs InfluxDB 3 Entreprise
Calculer la facturation Par heure de nœud (classes db.influxIOIncluded ) Par heure de nœud (classes db.influxIOIncluded )
Facturation du stockage Par Go de données stockées (200 Go minimum) Par Go de données stockées (200 Go minimum)
I/O Opérations Inclus dans la tarification des nœuds de calcul Inclus dans la tarification des nœuds de calcul
Dimensionnement du stockage Pas nécessaire, ne payez que pour le stockage utilisé Pas nécessaire, ne payez que pour le stockage utilisé
Transfert de données vers Free Free
Transfert de données au sein de VPC/AZ Free Free
Transfert de données sortantes (Internet/entre régions) Facturé par Go Facturé par Go
Facturation minimale 10 minutes 10 minutes
Granularité de facturation Incréments d'une seconde Incréments d'une seconde
Support multi-nœuds Non (nœud unique uniquement) Oui
Licence supplémentaire Aucune Par vCPU et par heure via AWS Marketplace

Stratégies d'optimisation des coûts

  • Dimensionnement correct : sélectionnez la classe de nœud appropriée en fonction de vos exigences en matière de charge de travail afin d'éviter le surprovisionnement. Nous vous recommandons également de choisir une instance qui maintient une utilisation moyenne du processeur et de la mémoire d'environ 65 %, afin de garantir la résilience face aux pics d'utilisation et de laisser une marge de manœuvre pour une planification saine des capacités.

  • Efficacité du stockage — Pour les déploiements comportant plus de 16 To de données, le stockage d'objets d'InfluxDB 3 peut permettre de réaliser jusqu'à 75 % d'économies par rapport aux solutions EBS traditionnelles.

  • Optimisation du trafic réseau : maintenez le transfert de données au sein du même VPC ou de la même région dans la mesure du possible afin d'éviter les frais de transfert de données sortants.

  • Stratégie de mise à l'échelle — Pour InfluxDB 3 Enterprise, déterminez si la mise à l'échelle (plus grande classe de nœuds) ou la mise à l'échelle externe (plus de nœuds) est plus rentable pour vos modèles de charge de travail spécifiques.

  • Optimisation des licences — Pour InfluxDB 3 Enterprise, choisissez des classes de nœuds offrant un équilibre optimal entre le nombre de vCPU (qui affecte les coûts de licence) et les exigences de performance.

Pour obtenir des informations sur les tarifs d'Amazon Timestream pour InfluxDB 3, consultez la page de tarification d'Amazon Timestream pour InfluxDB.

Régions AWS et zones de disponibilité

Les ressources de cloud computing Amazon sont hébergées dans plusieurs emplacements à travers le monde. Ces emplacements sont composés Régions AWS de zones de disponibilité. Chacune Région AWS constitue une zone géographique distincte. Chacune Région AWS possède plusieurs emplacements isolés appelés zones de disponibilité.

Amazon Timestream pour InfluxDB 3 vous permet de placer des ressources, telles que des clusters de bases de données, et des données à plusieurs emplacements. Pour les déploiements d'entreprise avec des clusters à nœuds multiples, les nœuds sont répartis sur plusieurs zones de disponibilité afin d'améliorer la disponibilité.

Pour plus d'informations sur les Régions AWS endroits où Amazon Timestream pour InfluxDB 3 est disponible et sur les points de terminaison pour chaque région, consultez la section Points de terminaison et quotas Amazon Timestream.