Anzeigen von automatisierten Einstellungen auf Tabellenebene - AWS Glue

Anzeigen von automatisierten Einstellungen auf Tabellenebene

Wenn die Erfassung von Statistiken auf Katalogebene aktiviert ist, wird jedes Mal, wenn eine Apache-Hive- oder Apache-Iceberg-Tabelle über die CreateTable- oder UpdateTable-API über die AWS Management Console, SDK oder AWS-Glue-Crawler erstellt oder aktualisiert wird, eine entsprechende Einstellung auf Tabellenebene für diese Tabelle erstellt.

Tabellen mit aktivierter automatischer Statistikgenerierung müssen eine der folgenden Eigenschaften aufweisen:

  • Verwenden eine InputSerdeLibrary, die mit org.apache.hadoop beginnt und bei der TableType EXTERNAL_TABLE entspricht.

  • Verwenden eine InputSerdeLibrary, die mit com.amazon.ion beginnt und bei der TableType EXTERNAL_TABLE entspricht.

  • Enthalten table_type: „ICEBERG“ in der Parameterstruktur.

Nachdem Sie eine Tabelle erstellt oder aktualisiert haben, können Sie die Tabellendetails überprüfen, um die Statistikgenerierung zu bestätigen. Die Statistics generation summary zeigt die Schedule-Eigenschaft an, die als AUTO festgelegt ist und deren Statistics configuration-Wert Inherited from catalog lautet. Jede Tabelleneinstellung mit der folgenden Konfiguration würde intern automatisch von Glue ausgelöst werden.

Ein Bild einer Hive-Tabelle mit Katalog-Level-Statistiksammlung wurde angewendet und Statistiken wurden gesammelt.