Überlegungen und Einschränkungen
Die folgenden Überlegungen und Einschränkungen gelten für die Generierung von Spaltenstatistiken.
Überlegungen
Die Verwendung von Stichproben zur Generierung von Statistiken reduziert die Laufzeit, kann jedoch zu ungenauen Statistiken führen.
Data Catalog speichert keine unterschiedlichen Versionen der Statistiken.
Sie können pro Tabelle nur jeweils eine Aufgabe zur Erstellung von Statistiken gleichzeitig ausführen.
Wenn eine Tabelle mit einem in Data Catalog registrierten AWS KMS-Kundenschlüssel verschlüsselt ist, wird derselbe Schlüssel von AWS Glue zum Verschlüsseln von Statistiken verwendet.
Die Aufgabe für Spaltenstatistiken unterstützt das Generieren von Statistiken:
Wenn die IAM-Rolle über vollständige Tabellenberechtigungen verfügt (IAM oder Lake Formation).
Wenn die IAM-Rolle im Lake-Formation-Hybridzugriffsmodus über Berechtigungen für die Tabelle verfügt.
Die Aufgabe für Spaltenstatistiken unterstützt das Generieren von Statistiken in folgenden Fällen nicht:
Tabellen mit zellbasierter Zutrittskontrolle von Lake Formation
Transaktionale Data Lakes – Linux Foundation Delta Lake, Apache Hudi
Tabellen in Verbunddatenbanken – Hive Metastore, Amazon Redshift Datashares
Verschachtelte Spalten, Arrays und Strukturdatentypen.
Tabellen, die von einem anderen Konto mit Ihnen geteilt werden