Generieren von Spaltenstatistiken für Iceberg-Tabellen - AWS Glue

Generieren von Spaltenstatistiken für Iceberg-Tabellen

Befolgen Sie diese Schritte, um einen Zeitplan für die Generierung von Statistiken im Datenkatalog mithilfe der AWS Glue-Konsole oder der AWS CLI zu konfigurieren oder den Vorgang StartColumnStatisticsTaskRun auszuführen.

Generieren von Spaltenstatistiken
  1. Melden Sie sich bei der AWS Glue-Konsole unter https://console.aws.amazon.com/glue/ an.

  2. Wählen Sie unter „Datenkatalog“ die Option Tabellen aus.

  3. Wählen Sie eine Iceberg-Tabelle aus der Liste aus.

  4. Wählen Sie im Menü Aktionen die Option Spaltenstatistiken, Auf Abruf generieren aus.

    Sie können auch im unteren Bereich der Seite Tabellen auf der Registerkarte Spaltenstatistiken die Schaltfläche Statistik generieren auswählen.

  5. Geben Sie auf der Seite Statistiken generieren die Details zur Statistikgenerierung an. Folgen Sie den Schritten 6–11 im Abschnitt Planmäßige Generierung von Spaltenstatistiken, um einen Zeitplan für die Statistikgenerierung für Iceberg-Tabellen zu konfigurieren.

    Sie können sich auch dafür entscheiden, Spaltenstatistiken bei Bedarf zu generieren, indem Sie den Anweisungen unter On-Demand-Generierung von Spaltenstatistiken folgen.

    Anmerkung

    Die Probenahmeoption ist für Iceberg-Tabellen nicht verfügbar.

    AWS Glue berechnet die Anzahl der eindeutigen Werte für jede Spalte der Iceberg-Tabelle in einer neuen Puffin-Datei, die an die angegebene Snapshot-ID in Ihrem Amazon-S3-Speicherort übermittelt wird.