Überlegungen und Einschränkungen - AWS Glue

Überlegungen und Einschränkungen

Die folgenden Überlegungen und Einschränkungen gelten für die Generierung von Spaltenstatistiken.

Überlegungen
  • Die Verwendung von Stichproben zur Generierung von Statistiken reduziert die Laufzeit, kann jedoch zu ungenauen Statistiken führen.

  • Data Catalog speichert keine unterschiedlichen Versionen der Statistiken.

  • Sie können pro Tabelle nur jeweils eine Aufgabe zur Erstellung von Statistiken gleichzeitig ausführen.

  • Wenn eine Tabelle mit einem in Data Catalog registrierten AWS KMS-Kundenschlüssel verschlüsselt ist, wird derselbe Schlüssel von AWS Glue zum Verschlüsseln von Statistiken verwendet.

Die Aufgabe für Spaltenstatistiken unterstützt das Generieren von Statistiken:
  • Wenn die IAM-Rolle über vollständige Tabellenberechtigungen verfügt (IAM oder Lake Formation).

  • Wenn die IAM-Rolle im Lake-Formation-Hybridzugriffsmodus über Berechtigungen für die Tabelle verfügt.

Die Aufgabe für Spaltenstatistiken unterstützt das Generieren von Statistiken in folgenden Fällen nicht:
  • Tabellen mit zellbasierter Zutrittskontrolle von Lake Formation

  • Transaktionale Data Lakes – Linux Foundation Delta Lake, Apache Hudi

  • Tabellen in Verbunddatenbanken – Hive Metastore, Amazon Redshift Datashares

  • Verschachtelte Spalten, Arrays und Strukturdatentypen.

  • Tabellen, die von einem anderen Konto mit Ihnen geteilt werden