View a markdown version of this page

Kostenoptimierung für Tabellen mit Intelligent-Tiering - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Kostenoptimierung für Tabellen mit Intelligent-Tiering

Mithilfe von S3 Intelligent-Tiering können Sie die Speicherkosten für Tabellen automatisch optimieren. Die Intelligent-Tiering Speicherklasse S3 Tables verschiebt Daten automatisch auf die kostengünstigste Zugriffsebene, wenn sich die Zugriffsmuster ändern. Wenn Sie S3 verwenden Intelligent-Tiering, werden Daten, auf die seltener zugegriffen wird, automatisch in kostengünstigere Stufen verschoben und bei jedem erneuten Zugriff wieder in die Stufe für häufigen Zugriff verschoben.

Alle Daten werden ohne Abrufgebühren, Leistungseinbußen oder Änderungen der Verfügbarkeit zwischen den Stufen verschoben. Darüber hinaus werden Tabellenverwaltungsvorgänge wie die Komprimierung auf der Grundlage von Zugriffsmustern optimiert, sodass nur aktiv abgerufene Daten in der Stufe für häufigen Zugriff verarbeitet werden, während die Wartungskosten für Daten, auf die seltener zugegriffen wird, in kostengünstigeren Stufen reduziert werden.

S3-Tabellen greifen auf Stufen zu Intelligent-Tiering

Wenn Ihre Tabelle in der Intelligent-Tiering Speicherklasse S3 gespeichert ist, überwacht Amazon S3 kontinuierlich die Zugriffsmuster und verschiebt Tabellendaten automatisch zwischen den Zugriffsebenen.

Das Tiering erfolgt auf der Ebene der einzelnen Dateien, sodass eine einzelne Tabelle je nach Zugriffsmustern Dateien in unterschiedlichen Stufen enthalten kann. Tabellendaten werden basierend auf Zugriffsmustern automatisch auf eine der folgenden Zugriffsebenen verschoben:

  • Häufiger Zugriff: Die Standardstufe für alle Dateien. Dateien in anderen Stufen werden beim Zugriff automatisch wieder in die Stufe für häufigen Zugriff verschoben.

  • Seltener Zugriff: Wenn Sie an 30 aufeinanderfolgenden Tagen nicht auf eine Datei zugreifen, wird sie in die Stufe für seltenen Zugriff verschoben.

  • Archive Instant Access: Wenn Sie an 90 aufeinanderfolgenden Tagen nicht auf eine Datei zugreifen, wird sie der Stufe Archive Instant Access zugeordnet.

Alle Stufen bieten Latenz im Millisekundenbereich, hohe Durchsatzleistung und sind für eine Verfügbarkeit von 99,9% und eine Beständigkeit von 99,999999999% konzipiert.

Auto-tiering Verhalten mit S3 Intelligent-Tiering

Bei den folgenden Aktionen handelt es sich um einen Zugriff, bei dem Dateien automatisch von der Stufe Infrequent Access oder der Stufe Archive Instant Access zurück in die Stufe für häufigen Zugriff verschoben werden:

  • Alle Lese- oder Schreibvorgänge an Tabellendaten- oder Metadatendateien mithilfe von GetObjectPutObject, oder CompleteMultipartUpload

  • LoadTableoder UpdateTable Aktionen mithilfe von Iceberg REST API-Operationen

  • Replikationsvorgänge für S3-Tabellen

Bei anderen Aktionen handelt es sich nicht um einen Zugriff, bei dem Dateien automatisch von der Stufe Infrequent Access oder der Stufe Archive Instant Access zurück in die Stufe für häufigen Zugriff verschoben werden.

Anmerkung

Dateien, die kleiner als 128 KB sind, kommen nicht für Auto-Tiering in Frage und verbleiben im Tarif für häufigen Zugriff. Bei der Komprimierung können diese Dateien zu weniger, aber größeren Objekten zusammengefasst und als neuer Snapshot wieder in Ihre Tabelle übernommen werden. Die neu komprimierten Dateien kommen für das Auto-Tiering in Frage, wenn die neue Datei 128 KB oder größer ist.

Verhalten bei der Tabellenverwaltung

Automatische Tabellenverwaltungsvorgänge, die von Amazon S3 ausgeführt werden, wie z. B. Snapshot-Verwaltung, Entfernung unreferenzierter Dateien und Ablauf von Datensätzen, werden unabhängig von der Stufe weiterhin auf Ihren Tabellen ausgeführt. Die Komprimierung wird nur für Dateien der Stufe „Häufiger Zugriff“ ausgeführt. Dadurch wird die Leistung für Daten, auf die häufig zugegriffen wird, optimiert und gleichzeitig die Wartungskosten für Daten in kostengünstigeren Stufen gesenkt.

Wartungsvorgänge wirken sich nicht auf die Zugriffsebene der Dateien in Ihrer Tabelle aus. Bei Wartungsvorgängen durchgeführte Lesevorgänge führen nicht dazu, dass Dateien die Stufen wechseln. Wenn jedoch bei einem Wartungsvorgang, wie z. B. Komprimierung oder Ablaufen von Datensätzen, eine neue Datei geschrieben wird, wird diese Datei in der Stufe „Häufiger Zugriff“ erstellt.

Anmerkung

Da bei der Komprimierung nur Dateien der Stufe „Häufiger Zugriff“ verarbeitet werden, führen Löschvorgänge an Daten in kostengünstigeren Stufen zu Löschdateien, die nicht automatisch komprimiert werden. Diese gelöschten Dateien kommen für die Komprimierung in Frage, wenn auf die zugehörigen Datendateien zugegriffen wird, und sie werden wieder in die Stufe für häufigen Zugriff verschoben. Für Tabellen, auf die nicht häufig zugegriffen wird, können Sie die Komprimierung mithilfe von Amazon EMR manuell ausführen, um diese gelöschten Dateien mit den zugehörigen Datendateien zu komprimieren. Weitere Informationen finden Sie unter Tabellen mithilfe der Komprimierung verwalten. Sie können das Dateiwachstum in Ihrer Tabelle anhand von CloudWatch Amazon-Metriken überwachen, um zu ermitteln, wann eine manuelle Komprimierung von Vorteil sein kann.

Geben Sie S3 Intelligent-Tiering als Ihre Speicherklasse an

Standardmäßig werden alle Tabellen in der Speicherklasse S3 Standard erstellt und können nicht nach S3 verschoben werden Intelligent-Tiering. Um S3 zu verwenden Intelligent-Tiering, müssen Sie es bei der Tabellenerstellung angeben. Sie können S3 auch Intelligent-Tiering als Standardspeicherklasse für Ihren Tabellen-Bucket festlegen, um alle dort erstellten neuen Tabellen automatisch in der Intelligent-Tiering S3-Speicherklasse zu speichern.

S3 Intelligent-Tiering für Tabellen-Buckets angeben

Sie können S3 Intelligent-Tiering als Standardspeicherklasse angeben, wenn Sie einen neuen Tabellen-Bucket erstellen, indem Sie den storage-class-configuration Header mit der CreateTableBucket Operation verwenden.

Verwenden Sie den GetTableBucketStorageClass Vorgang, um die Standardspeicherklasse für einen vorhandenen Tabellen-Bucket zu überprüfen. Verwenden Sie den PutTableBucketStorageClass Vorgang, um die Standardspeicherklasse eines vorhandenen Tabellen-Buckets zu ändern.

Anmerkung

Wenn Sie die Standard-Speicherklasse für einen Tabellen-Bucket ändern, gilt diese Einstellung nur für neue Tabellen, die in diesem Bucket erstellt wurden. Die Speicherklasse für bereits vorhandene Tabellen wird nicht geändert.

S3 Intelligent-Tiering für Tabellen angeben

Sie können S3 Intelligent-Tiering als Speicherklasse angeben, wenn Sie eine neue Tabelle mithilfe des storage-class-configuration Headers mit der CreateTable Operation erstellen.

Wenn Sie bei der Tabellenerstellung keine Speicherklasse angeben, wird die Tabelle in der Standardspeicherklasse erstellt, die zu diesem Zeitpunkt im Tabellen-Bucket konfiguriert ist. Sobald eine Tabelle erstellt wurde, können Sie ihre Speicherklasse nicht mehr ändern.

Verwenden Sie den GetTableBucketStorageClass Vorgang, um die Standardspeicherklasse für einen vorhandenen Tabellen-Bucket zu überprüfen.

Überwachung der Speichernutzung

Sie können die Aufschlüsselung Ihrer Speichernutzung nach Zugriffsebenen in den AWS Kosten- und Nutzungsberichten für Ihr Konto einsehen. Weitere Informationen finden Sie unter Erstellen von Kosten- und Nutzungsberichten im AWS Data Exports User Guide.

Die folgenden Nutzungsarten sind in Ihren Abrechnungsberichten verfügbar:

Verwendungstyp Einheit Granularity Description
region-Tables-TimedStorage-INT-FA-ByteHrs GB-Month Täglich Die Anzahl GB-months dieser Daten wurde im S3 Intelligent-Tiering Frequent Access of Intelligent-Tiering S3-Speicher gespeichert
region-Tables-TimedStorage-INT-IA-ByteHrs GB-Month Täglich Die Anzahl GB-months dieser Daten wurde im Speicher S3 Intelligent-Tiering Infrequent Access of S3 Intelligent-Tiering gespeichert
region-Tables-TimedStorage-INT-AIA-ByteHrs GB-Month Täglich Die Anzahl GB-months dieser Daten wurde im S3 Intelligent-Tiering Archive Instant Access des S3-Speichers gespeichert Intelligent-Tiering
region-Tables-Requests-INT-Tier1 Anzahl Stündlich Die Anzahl der PUTCOPY, oder POST -Anfragen für S3 Intelligent-Tiering Tables-Objekte
region-Tables-Requests-INT-Tier2 Anzahl Stündlich Die Anzahl GET und alle anderen Nicht-Tier1-Anfragen für S3-Tabelles-Objekte Intelligent-Tiering