Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Überlegungen und Einschränkungen für Wartungsarbeiten
Amazon S3 bietet Wartungsvorgänge, die dazu dienen, die Leistung Ihrer S3-Tabellen oder Tabellen-Buckets zu verbessern. Zu diesen Optionen gehören die Dateikomprimierung, die Snapshot-Verwaltung und die Entfernung nicht referenzierter Dateien. Im Folgenden werden die Einschränkungen und Überlegungen zu diesen Verwaltungsoptionen beschrieben.
Themen
Überlegungen zur Komprimierung
Folgende Überlegungen betreffen die Komprimierung. Weitere Informationen zur Komprimierung finden Sie unter Wartung für Tabellen.
-
Die Komprimierung wird nur für Apache Parquet-Dateitypen unterstützt.
-
Die Komprimierung unterstützt Datentypen nicht: Behoben.
-
Die Komprimierung unterstützt Komprimierungstypen nicht:
brotli
,lz4
Hinweise zur Snapshot-Verwaltung
Folgende Überlegungen betreffen die Snapshot-Verwaltung: Weitere Informationen zur Snapshot-Verwaltung finden Sie unter Wartung für Tabellen.
-
Snapshots werden nur aufbewahrt, wenn beide Kriterien erfüllt sind: die Mindestanzahl der aufzubewahrenden Snapshots und der festgelegte Aufbewahrungszeitraum.
-
Die Snapshot-Verwaltung löscht abgelaufene Snapshot-Metadaten aus Apache Iceberg, wodurch Zeitreiseabfragen für abgelaufene Snapshots verhindert und zugehörige Datendateien optional gelöscht werden.
-
Die Snapshot-Verwaltung unterstützt keine Aufbewahrungswerte, die Sie als Eigenschaften von Iceberg-Tabellen in der Datei
metadata.json
oder über den SQL-BefehlALTER TABLE SET TBLPROPERTIES
konfigurieren. Dies gilt auch für die verzweigungs- oder Tag-basierte Aufbewahrung. Die Snapshot-Verwaltung ist deaktiviert, wenn Sie eine verzweigungs- oder tagbasierte Aufbewahrungsrichtlinie oder eine Aufbewahrungsrichtlinie für die Dateimetadata.json
konfigurieren, die länger ist als die über diePutTableMaintenanceConfiguration
-API konfigurierten Werte. In diesen Fällen lässt S3 Snapshots nicht ablaufen oder entfernen. Sie müssen die Snapshots manuell löschen oder die Eigenschaften aus Ihrer Iceberg-Tabelle entfernen, um Speichergebühren zu vermeiden.
Überlegungen zum Entfernen von nicht referenzierten Dateien
Die folgenden Überlegungen betreffen das Entfernen von Dateien, die nicht referenziert sind. Weitere Informationen zum Entfernen nicht referenzierter Dateien finden Sie unter Wartung für Tischeimer.
-
Beim Entfernen nicht referenzierter Dateien werden Daten- und Metadatendateien gelöscht, die nicht mehr durch Iceberg-Metadaten referenziert sind, wenn ihr Erstellungsdatum vor dem Aufbewahrungszeitraum liegt.
Beschränkungen für die Wartung von S3-Tabellen und Tabellen-Buckets
Wartungsoperation | Eigenschaft | Auf Tabellen-Bucket-Ebene konfigurierbar? | Auf Tabellenebene konfigurierbar? | Standardwert | Mindestwert |
---|---|---|---|---|---|
Komprimierung | targetFileSizeMB | Nein | Ja | 512 MB | 64 MB |
Snapshot-Verwaltung | minimumSnapshots | Nein | Ja | 1 | 1 |
Snapshot-Verwaltung | maximumSnapshotAge | Nein | Ja | 120 Stunden | 1 Stunde |
Entfernung nicht referenzierter Dateien | Unreferenzierte Tage | Ja | Nein | 3 Tage | 1 Tag |
Entfernung nicht referenzierter Dateien | nonCurrentDays | Ja | Nein | 10 Tage | 1 Tag |
Anmerkung
S3 Tables verwendet die row-group-default Parkettgröße von 128 MB.