考慮事項と制限事項
列統計の生成には、次の考慮事項と制限事項が適用されます。
考慮事項
サンプリングを使用して統計を生成すると、実行時間は短縮されますが、不正確な統計が生成される可能性があります。
データカタログは、異なるバージョンの統計を保存しません。
テーブルごとに一度に 1 つの統計生成タスクのみを実行できます。
データカタログに登録されているカスタマー AWS KMS キーを使用してテーブルが暗号化されている場合、AWS Glue は同じキーを使用して統計を暗号化します。
列統計タスクは、次の場合に統計の生成をサポートします。
完全なテーブル許可が IAM ロールに付与されている場合 (IAM または Lake Formation)。
Lake Formation ハイブリッドアクセスモードを使用するテーブルに対する許可が IAM ロールに付与されている場合。
列統計タスクは、次についての統計の生成をサポートしていません。
Lake Formation のセルベースのアクセスコントロールを備えたテーブル
トランザクションのデータレイク – Linux Foundation Delta Lake、Apache Hudi
フェデレーテッドデータベース内のテーブル - Hive メタストア、Amazon Redshift データ共有
ネストされた列、配列、および構造体のデータ型。
別のアカウントからユーザーと共有されるテーブル