Für ähnliche Funktionen wie Amazon Timestream für sollten Sie Amazon Timestream for LiveAnalytics InfluxDB in Betracht ziehen. Es bietet eine vereinfachte Datenaufnahme und Antwortzeiten im einstelligen Millisekundenbereich für Analysen in Echtzeit. Erfahren Sie hier mehr.
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Amazon Timestream für InfluxDB 3
Was ist Timestream für InfluxDB 3?
Amazon Timestream for InfluxDB 3 ist ein verwalteter Zeitreihen-Datenbankservice, der es Anwendungsentwicklern und DevOps Teams leicht macht, InfluxDB 3-Datenbanken AWS für umfangreiche Zeitreihenanalyseanwendungen unter Verwendung von Open Source auszuführen. APIs Mit Amazon Timestream for InfluxDB 3 können Sie auf einfache Weise Zeitreihen-Workloads einrichten, betreiben und skalieren, die für die Verarbeitung von Daten mit hoher Kardinalität und komplexen analytischen Abfragen konzipiert sind.
InfluxDB 3 stellt eine komplette architektonische Neuinterpretation der InfluxDB-Datenbank-Engine dar. Im Gegensatz zu den Versionen 1 und 2, die eine Time-Structured Merge Tree (TSM) -Speicher-Engine verwendeten, wurde InfluxDB 3 von Grund auf auf völlig anderen technologischen Grundlagen aufgebaut. Diese neue Version nutzt Apache Arrow für die speicherinterne Datenverarbeitung, Apache Data Fusion für die Abfrageausführung und ein spaltenförmiges Speicherformat (Parquet) für die Datenpersistenz im Objektspeicher (Amazon S3). Dieser architektonische Wandel ermöglicht es InfluxDB 3, eine verbesserte Leistung für Daten mit hoher Kardinalität zu bieten und für große analytische Workloads effizient zu skalieren. Die InfluxDB 3-Architektur bietet eine verbesserte Abfrageleistung und Ressourcennutzung für datenintensive Anwendungsfälle.
Amazon Timestream for InfluxDB 3 bietet Ihnen Zugriff auf die Funktionen dieser Zeitreihen-Datenbank-Engine der nächsten Generation. Die architektonische Transformation ermöglicht umfangreiche Arbeitslasten für Zeitreihenanalysen und nutzt die Funktionen zur Komprimierung, Partitionierung und Abfrageoptimierung, die dem spaltenförmigen Parquet-Speicherformat innewohnen. Durch die Entkopplung von Rechenleistung und Speicher kann InfluxDB 3 skaliert werden, um praktisch unbegrenzte Datenmengen zu verarbeiten und gleichzeitig die Kosteneffizienz aufrechtzuerhalten.
Amazon Timestream for InfluxDB 3 kann Ihre Datenbank automatisch sichern und Ihre Datenbanksoftware mit der neuesten Version auf dem neuesten Stand halten. Wie bei allen AWS-Services sind keine Vorabinvestitionen erforderlich, und Sie zahlen nur für die Ressourcen, die Sie nutzen.
DB-Cluster
Ein DB-Cluster ist der grundlegende Baustein von Timestream für InfluxDB 3. Im Gegensatz zu herkömmlichen Datenbank-Instances verwendet InfluxDB 3 eine clusterbasierte Architektur, die Rechenleistung vom Speicher trennt und Amazon S3 für praktisch unbegrenzten, kostengünstigen Datenspeicher nutzt.
Sie können Ihre InfluxDB 3-Bereitstellungen entweder in Core- oder Enterprise-Versionen einrichten:
Kernversion
Die Core-Version von InfluxDB 3 ist auf Cluster-Bereitstellungen mit einem Knoten beschränkt und es fehlen Komprimierungsfunktionen, was sich auf ihre Eignung für bestimmte Workloads auswirkt. Aufgrund dieser Einschränkungen ist die Core-Version in erster Linie für Workloads nahezu in Echtzeit konzipiert, die sich auf aktuelle Daten konzentrieren (in der Regel einige Tage alt). Sie wird nicht für Anwendungsfälle mit langfristiger Speicherung und Analyse empfohlen, da sich die Leistung im Laufe der Zeit verschlechtert, wenn keine Verdichtungsprozesse zur Speicheroptimierung vorgenommen werden.
Version für Unternehmen
Die Enterprise-Version von InfluxDB 3 unterstützt Cluster-Konfigurationen mit mehreren Knoten und enthält wichtige Komprimierungsfunktionen, die eine horizontale Skalierung sowohl für Lese- als auch für Schreibvorgänge ermöglichen. Diese Bereitstellungen mit mehreren Knoten bieten eine verbesserte Verfügbarkeit, eine verbesserte Leistung für gleichzeitige Abfragen und eine höhere allgemeine Systemstabilität. Durch die Komprimierungsfunktion der Enterprise-Version eignet sie sich für Anwendungsfälle mit hoher Datenkardinalität und Langzeitanalysen, da sie das zugrunde liegende Speicherformat kontinuierlich optimiert. Unternehmenscluster können durch Hinzufügen von Knoten skaliert werden, um wachsenden Workloads gerecht zu werden, ohne den laufenden Betrieb zu unterbrechen.
Jeder DB-Cluster hat eine DB-Cluster-ID. Dieser automatisch generierte Name identifiziert den DB-Cluster eindeutig, wenn er mit der Amazon Timestream for InfluxDB-API und den Befehlen interagiert. AWS CLI Die DB-Cluster-ID ist für diesen Kunden in einem eindeutig. AWS-Region
Timestream for InfluxDB weist Ihrem Cluster einen DNS-Endpunkt zu. Die vom Dienst generierte Kennung ist Teil des DNS-Endpunkts des Clusters. Wenn die vom Dienst generierte Kennung des Clusters beispielsweise lautetxghozx1v79, dann ist es auch der DNS-Endpunkt. xghozx1v79-3ksj4dla5nfjhi.timestream-influxdb3.us-east-1.on.aws
Amazon Timestream for InfluxDB 3 ermöglicht es Ihnen, im Rahmen des Erstellungsprozesses ein Master-Benutzerkonto und ein Passwort für Ihren DB-Cluster zu erstellen. Dieser Master-Benutzer ist berechtigt, Datenbanken und Tabellen zu erstellen und Lese-, Schreib-, Lösch- und Upsert-Operationen für Ihre Daten durchzuführen.
Um auf eine visuelle, webbasierte Benutzeroberfläche zuzugreifen, können Sie den InfluxDB Explore verwenden, der von Ihren eigenen Instanzen heruntergeladen InfluxData
DB-Cluster-Klassen
Die DB-Cluster-Klasse bestimmt die Berechnungs- und Speicherkapazität von Knoten in Ihrem Amazon Timestream für InfluxDB 3-Cluster. Die geeignete Clusterklasse hängt von Ihrer Rechenleistung und Ihren Speicheranforderungen ab.
InfluxDB 3-Cluster-Klassen
InfluxDB 3-Cluster verwenden Instance-Klassen, die speziell für die Amazon S3-basierte Speicherarchitektur optimiert wurden. Diese Klassen, die als bezeichnet werdendb.influxIOIncluded, sind darauf ausgelegt, Rechenressourcen mit den I/O Anforderungen der Arbeit mit Objektspeicher in Einklang zu bringen. Die db.influxIOIncluded Compute-Instances sind so bepreist, dass sie bereits alle mit Amazon S3 ausgeführten I/O Operationen beinhalten, sodass Kunden unabhängig von ihren spezifischen I/O-Mustern vorhersehbare Kosten haben.
Die folgende Tabelle zeigt die Hardwaredetails für InfluxDB 3-Cluster-Knotenklassen:
| Instance-Klasse | vCPU | Arbeitsspeicher (GiB) | Speichertyp | Netzwerkbandbreite (Gbit/s) |
|---|---|---|---|---|
| db.influx .medium IOIncluded | 1 | 8 | S3-Objektspeicher | 12 |
| db.influx .large IOIncluded | 2 | 16 | S3-Objektspeicher | 12 |
| db.influx .xlarge IOIncluded | 3 | 32 | S3-Objektspeicher | 15 |
| db.influx 2.xlarge IOIncluded | 8 | 64 | S3-Objektspeicher | 20 |
| db.influx 4.xlarge IOIncluded | 16 | 128 | S3-Objektspeicher | 25 |
| db.influx 8.8x groß IOIncluded | 32 | 256 | S3-Objektspeicher | 30 |
| db.influx 1.2xlarge IOIncluded | 48 | 384 | S3-Objektspeicher | 22.5 |
| db.influx 1.6x groß IOIncluded | 64 | 512 | S3-Objektspeicher | 30 |
| db.influx 2.4xlarge IOIncluded | 96 | 768 | S3-Objektspeicher | 40 |
Die db.influxIOIncluded Instanzklassen wurden speziell für folgende Zwecke entwickelt:
-
Verwalten Sie effizient die I/O Operationen zwischen Rechenknoten und Amazon S3 S3-Objektspeicher.
-
Stellen Sie mithilfe des Apache Arrow-Frameworks optimale memory-to-CPU Verhältnisse für die Verarbeitung von Zeitreihendaten bereit.
-
Support die Rechenanforderungen der Data Fusion-Abfrage-Engine.
Bei Enterprise-Bereitstellungen mit Clustern mit mehreren Knoten verwenden alle Knoten dieselbe Instanzklasse, um eine ausgewogene Leistung im gesamten Cluster sicherzustellen. Wenn Ihre Arbeitslast wächst, können Sie nach oben skalieren, indem Sie eine größere Instanzklasse für alle Knoten im Cluster auswählen, oder horizontal skalieren, indem Sie Ihrem Cluster weitere Knoten derselben Klasse hinzufügen.
Hardwarespezifikationen für DB-Cluster-Klassen
Die folgende Terminologie beschreibt die Hardwarespezifikationen für DB-Cluster-Klassen:
-
vCPU — Die Anzahl der virtuellen Zentraleinheiten (CPUs). Eine virtuelle CPU ist eine Kapazitätseinheit, mit der Sie DB-Cluster-Klassen vergleichen können.
-
Arbeitsspeicher (GiB) — Der RAM in Gibibyte, der dem DB-Clusterknoten zugewiesen ist. Häufig ist das Verhältnis zwischen Arbeitsspeicher- und vCPU konsistent.
-
Speichertyp — InfluxDB 3 verwendet S3 Object Storage, der von den Rechenknoten getrennt ist.
-
Netzwerkbandbreite — Die Netzwerkgeschwindigkeit im Vergleich zu anderen DB-Cluster-Klassen.
DB-Cluster-Speicher
Amazon Timestream for InfluxDB 3 führt eine andere Speicherarchitektur ein, die Rechenleistung vom Speicher entkoppelt, indem Amazon S3 für die Objektspeicherung genutzt wird. Diese Architektur bietet praktisch unbegrenzte Speicherkapazität und hält gleichzeitig die Kosten bei groß angelegten Bereitstellungen unter Kontrolle.
InfluxDB-Objektspeicher
InfluxDB 3-Cluster verwenden eine einzige Speicherklasse namens InfluxDB Object Storage, die auf Amazon S3 basiert. Diese Speicheroption bietet:
-
Praktisch unbegrenzte Speicherkapazität
-
Kosteneffizienter Speicher für große Datenmengen (bis zu 75% Einsparungen bei Bereitstellungen über 16 TB im Vergleich zu InfluxDB 2.x)
-
Haltbarkeit von 99,999999999% (11 Neun)
-
Daten werden im parquet-spaltenbasierten Format gespeichert, um eine effiziente Komprimierung und Abfrageleistung zu gewährleisten
Im Gegensatz zu herkömmlichen Datenbankarchitekturen, bei denen der Speicher direkt an Rechenknoten angeschlossen ist, wird der Objektspeicher von InfluxDB 3 von allen Knoten im Cluster gemeinsam genutzt. Jeder Knoten unterhält lokale In-Memory-Caches für häufig aufgerufene Daten, um die Abfrageleistung zu optimieren, während die zugrunde liegenden Daten in Amazon S3 verbleiben.
Die Preise für InfluxDB Object Storage basieren auf:
-
Gesamtes gespeichertes Datenvolumen (GB/Monat), mit einer monatlichen Mindestgebühr von 200 GB
I/O Die Betriebskosten sind in den Computing-Preisen für die IOIncluded db.influx-Instance-Klassen zusammengefasst, sodass Kunden unabhängig von ihren spezifischen Mustern vorhersehbare Kosten haben. I/O
Vorteile der Speicherarchitektur
Die Amazon S3-basierte Speicherarchitektur in InfluxDB 3 ist besonders vorteilhaft für:
-
Umfangreiche Workloads für Zeitreihenanalysen
-
Datenanforderungen mit hoher Kardinalität
-
Szenarien zur langfristigen Datenspeicherung
-
Kostengünstige Speicherung großer Zeitreihendatensätze
Dieses Speichermodell ist vergleichbar mit Timestream für LiveAnalytics Magnetic Storage Tier, das ebenfalls auf Objektspeichern basiert und für Langzeitspeicher- und Analyseanwendungen optimiert ist. Die Speicherökonomie von InfluxDB 3 ist so konzipiert, dass es mit der Preisgestaltung von Magnetic Store konkurrieren kann, einem Modell, das sich für Kunden als geeignet erwiesen hat, die umfangreiche LiveAnalytics Zeitreihen-Workloads und Daten über lange Zeiträume ausführen und speichern möchten.
Größe des DB-Clusters
Die optimale Konfiguration eines Timestream-Clusters für InfluxDB 3 hängt von verschiedenen Faktoren ab, darunter Aufnahmerate, Batchgröße, Kardinalität von Zeitreihen, gleichzeitigen Abfragen und Abfragetypen.
Berücksichtigen Sie bei der Dimensionierung von InfluxDB 3-Clustern aufgrund der unterschiedlichen Architektur diese zusätzlichen Faktoren:
-
Speichereffizienz: Bei Bereitstellungen mit mehr als 16 TB Daten kann der Objektspeicher von InfluxDB 3 bis zu 75% Kosteneinsparungen im Vergleich zu Timestream für InfluxDB 2-Bereitstellungen bieten.
-
Workload-Merkmale: InfluxDB 3 ist für Daten mit hoher Kardinalität und analytische Abfragen über große Datensätze optimiert und bietet gleichzeitig eine vergleichbare Leistung wie die Versionen 1.x und 2.x für Abfragen mit kürzerem Zeitraum. Darüber hinaus ermöglichen Funktionen wie der Last-Value- und der Distinct-Value-Caches
anhaltende Abfragelatenzen von unter 10 ms für bestimmte Anwendungsfälle wie das Abrufen der neuesten Datenpunkte oder eindeutiger Metadatenwerte . -
Abfragemuster: Überlegen Sie, ob Ihre Arbeitslast kontinuierlich (Überwachung rund um die Uhr) oder intermittierend (regelmäßige Analysen) ist
-
Anforderungen an die Komprimierung: Die Enterprise-Version enthält Komprimierungsfunktionen, die für die langfristige Datenspeicherung und Workloads mit hoher Kardinalität unerlässlich sind. Für Bereitstellungen mit Clustern mit 3 Knoten und mehr wird ein spezieller Compactor-Knoten empfohlen, um die Schreib- und Leseleistung auf den anderen einzelnen Knoten zu maximieren und sicherzustellen, dass Verdichtungsprozesse nicht mit Abfrage- und Aufnahmevorgängen um Ressourcen konkurrieren.
Sehen wir uns als Größenempfehlung einen beispielhaften Workload mit den folgenden Merkmalen an:
-
Daten werden von einer Flotte von Telegraf-Agenten gesammelt und geschrieben, die System, CPU, Speicher, Festplatte, I/O usw. aus einem Rechenzentrum sammeln.
-
Jede Schreibanforderung enthält 5000 Zeilen.
-
Die auf dem System ausgeführten Abfragen werden als Abfragen mit „mäßiger Komplexität“ eingestuft und weisen die folgenden Merkmale auf:
-
Sie haben mehrere Funktionen und einen oder zwei reguläre Ausdrücke.
-
Sie können nach Klauseln gruppiert werden oder eine Stichprobe für einen Zeitraum von mehreren Wochen enthalten.
-
Ihre Ausführung dauert in der Regel einige hundert Millisekunden bis zu einigen tausend Millisekunden.
-
Die CPU bevorzugt in erster Linie die Abfrageleistung.
-
Alle Tests wurden mit einem Datensatz durchgeführt, der eine Kardinalität von 30 Millionen Zeitreihen enthielt.
-
| Schreibvorgänge (Zeilen pro Sekunde) | Lesevorgänge (Abfragen pro Sekunde) | Instance-Klasse | Version |
|---|---|---|---|
| ~150.000 | <25 | db.influx .large IOIncluded | Core |
| ~200.000 | ~25 | db.influx.large IOIncluded | Core |
| ~250.000 | ~35 | db.influx 2.x groß IOIncluded | Enterprise |
| ~500.000 | ~50 | db.influx 4.x groß IOIncluded | Enterprise |
| <750.000 | <100 | db.influx 0,8 x groß IOIncluded | Enterprise |
| > 750.000 | >100 | Unternehmenscluster mit mehreren Knoten | Enterprise |
DB-Cluster-Abrechnung für Amazon Timestream für InfluxDB 3
Amazon Timestream für InfluxDB 3-Cluster werden auf der Grundlage der folgenden Komponenten abgerechnet:
-
Stunden des DB-Cluster-Knotens (pro Stunde) — Basierend auf der DB-Cluster-Knotenklasse, zum Beispiel db.influx .large. IOIncluded Die Preise werden auf Stundenbasis aufgeführt, aber Rechnungen werden jetzt auf die Sekunde genau kalkuliert und zeigen die Zeiten im Dezimalformat an. Die Nutzung wird in 1-Sekunden-Schritten mit einer Mindestdauer von 10 Minuten abgerechnet. Bei Core-Bereitstellungen mit einem Knoten oder Enterprise-Bereitstellungen mit mehreren Knoten wird jeder Knoten auf der Grundlage seiner Laufzeit separat in Rechnung gestellt.
-
Objektspeicher (pro GB pro Monat) — Das tatsächliche Datenvolumen, das im InfluxDB Object Storage gespeichert wird, und nicht die bereitgestellte Kapazität. Dieses Modell ermöglicht es Ihnen, nur für den von Ihnen genutzten Speicher zu zahlen, ohne dass Speicherkapazität vorab bereitgestellt werden muss. Hinweis: Es fällt eine monatliche Mindestspeichergebühr in Höhe von 200 GB an, auch wenn Ihre tatsächliche Speichernutzung geringer ist.
-
Ausgehende Datenübertragung (pro GB) — Datenübertragung aus Ihrem DB-Cluster ins Internet oder in andere AWS-Regionen Bereiche. Die Datenübertragung innerhalb derselben VPC oder zwischen Availability Zones innerhalb derselben AWS-Region ist kostenlos.
-
InfluxDB 3 Enterprise-Lizenz (pro vCPU pro Stunde) — Für InfluxDB 3 Enterprise-Bereitstellungen fallen zusätzliche InfluxData Lizenzkosten pro vCPU und Stunde an. Diese Lizenzgebühr wird direkt in Rechnung gestellt AWS Marketplace und erscheint als separater Posten auf Ihrer Rechnung. AWS Die Lizenz ermöglicht Unternehmensfunktionen wie Clustering mit mehreren Knoten, Komprimierungsfunktionen und erweiterte Sicherheitsfunktionen.
Bei InfluxDB 3 Enterprise-Clustern mit mehreren Knoten wird jeder Knoten separat auf der Grundlage seiner Instanzklasse und der Anzahl der vCPUs (für Lizenzgebühren) in Rechnung gestellt, während die Speicherkosten konsolidiert werden, da sich alle Knoten denselben zugrunde liegenden Objektspeicher teilen.
Zusammenfassung der Abrechnungskomponenten
| Komponente „Abrechnung“ | InfluxDB 3-Kern | InfluxDB 3 Enterprise |
|---|---|---|
| Abrechnung berechnen | Pro Knotenstunde (IOIncluded db.influx-Klassen) | Pro Knotenstunde (db.influx-Klassen) IOIncluded |
| Abrechnung des Speichers | Pro GB gespeicherter Daten (mindestens 200 GB) | Pro GB gespeicherter Daten (mindestens 200 GB) |
| I/O Operationen | In der Preisgestaltung für Rechenknoten enthalten | Im Preis für Compute Nodes enthalten |
| Speicherskalierung | Nicht erforderlich, zahlen Sie nur für den genutzten Speicherplatz | Nicht erforderlich, zahlen Sie nur für den genutzten Speicherplatz |
| Eingehende Datenübertragung | Kostenfrei | Kostenfrei |
| Datenübertragung innerhalb VPC/AZ | Kostenfrei | Kostenfrei |
| Ausgehende Datenübertragung (Internet/regionsübergreifend) | Wird pro GB berechnet | Wird pro GB berechnet |
| Mindestabrechnung | 10 Minuten | 10 Minuten |
| Granularität der Abrechnung | In Schritten von 1 Sekunde | In Schritten von 1 Sekunde |
| Support mehrerer Knoten | Nein (nur ein Knoten) | Ja |
| Zusätzliche Lizenz | Keine | Pro vCPU pro Stunde über AWS Marketplace |
Strategien zur Kostenoptimierung
-
Richtige Dimensionierung — Wählen Sie die passende Knotenklasse auf der Grundlage Ihrer Workload-Anforderungen aus, um eine übermäßige Bereitstellung zu vermeiden. Wir empfehlen außerdem, eine Instance zu wählen, die eine durchschnittliche CPU- und Speicherauslastung von etwa 65% beibehält. Dadurch wird die Widerstandsfähigkeit gegenüber Auslastungsspitzen gewährleistet und Spielraum für eine solide Kapazitätsplanung geschaffen.
-
Speichereffizienz — Bei Bereitstellungen mit mehr als 16 TB Daten kann der Objektspeicher von InfluxDB 3 im Vergleich zu herkömmlichen EBS-basierten Lösungen Kosteneinsparungen von bis zu 75% ermöglichen.
-
Optimierung des Netzwerkverkehrs — Halten Sie die Datenübertragung nach Möglichkeit innerhalb derselben VPC oder Region aufrecht, um Gebühren für ausgehende Datenübertragungen zu vermeiden.
-
Skalierungsstrategie — Überlegen Sie sich für InfluxDB 3 Enterprise, ob eine Skalierung (größere Knotenklasse) oder eine Skalierung (mehr Knoten) für Ihre spezifischen Workload-Muster kostengünstiger ist.
-
Lizenzoptimierung — Wählen Sie für InfluxDB 3 Enterprise Knotenklassen, die das optimale Gleichgewicht zwischen der Anzahl der vCPU (was sich auf die Lizenzkosten auswirkt) und den Leistungsanforderungen bieten.
Preisinformationen zu Amazon Timestream für InfluxDB 3 finden Sie auf der Preisseite für Amazon Timestream for
AWS-Regionen und Availability Zones
Amazon Cloud Computing-Ressourcen werden an mehreren Standorten weltweit gehostet. Diese Standorte bestehen aus AWS-Regionen Availability Zones. Jeder AWS-Region ist ein separates geografisches Gebiet. Jedes AWS-Region hat mehrere isolierte Standorte, die als Availability Zones bezeichnet werden.
Amazon Timestream for InfluxDB 3 ermöglicht es Ihnen, Ressourcen wie DB-Cluster und Daten an mehreren Standorten zu platzieren. Bei Unternehmensbereitstellungen mit Clustern mit mehreren Knoten werden die Knoten auf mehrere Availability Zones verteilt, um die Verfügbarkeit zu erhöhen.
Informationen darüber, AWS-Regionen wo Amazon Timestream für InfluxDB 3 verfügbar ist und welche Endpunkte für jede Region gelten, finden Sie unter Amazon Timestream Timestream-Endpunkte und Kontingente.