Löschen verwaister Dateien - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Löschen verwaister Dateien

AWS Glue Data Catalog ermöglicht es Ihnen, verwaiste Dateien aus Ihren Iceberg-Tabellen zu entfernen. Verwaiste Dateien sind Dateien, die in Ihrer Amazon S3 S3-Datenquelle unter dem angegebenen Tabellenspeicherort vorhanden sind, nicht von den Iceberg-Tabellenmetadaten verfolgt werden und älter sind als Ihre konfigurierte Altersbeschränkung. Diese verwaisten Dateien können sich im Laufe der Zeit aufgrund von Vorgängen wie Komprimieren, Löschen von Partitionen oder Neuschreiben von Tabellen ansammeln und unnötigen Speicherplatz beanspruchen.

Der Optimierer für das Löschen verwaister Dateien AWS Glue scannt die Tabellenmetadaten und die eigentlichen Datendateien, identifiziert die verwaisten Dateien und löscht sie, um Speicherplatz zurückzugewinnen.

Sie können das Löschen verwaister Dateien initiieren, indem Sie im Datenkatalog einen Tabellenoptimierer für das Löschen verwaister Dateien erstellen.

Wichtig

Standardmäßig werden beim Löschen verwaister Dateien Dateien an Ihrem gesamten Tabellenspeicherort ausgewertet. AWS Glue Sie können zwar ein Unterpräfix konfigurieren, um den Umfang der Auswertung einzuschränken, müssen jedoch sicherstellen, dass Ihr Tabellenspeicherort keine Dateien aus anderen Datenquellen oder Tabellen enthält. Wenn sich der Speicherort Ihrer Tabelle mit anderen Datenquellen überschneidet, identifiziert und löscht der Dienst möglicherweise Dateien, die nichts miteinander zu tun haben, als verwaiste Dateien.