為 Iceberg 資料表產生資料欄統計資料
請遵循下列步驟,使用 AWS Glue 主控台或 AWS CLI 或者執行 StartColumnStatisticsTaskRun 操作,在 Data Catalog 中設定產生統計資料的排程。
若要產生資料欄統計資料
-
登入 AWS Glue 主控台,請前往:https://console.aws.amazon.com/glue/
。 -
選擇 Data Catalog 下方的資料表。
-
從清單中選擇 Iceberg 資料表。
-
選擇動作功能表下方的資料欄統計資料、隨需產生。
您也可選擇資料表頁面下半區段之資料欄統計資料索引標籤下的產生統計資料按鈕。
-
在產生統計資料頁面中,提供統計資料產生詳細資訊。請遵循 根據排程產生資料欄統計資料 部分中的步驟 6-11,為 Iceberg 資料表設定統計資料產生排程。
也可以遵循 隨需產生資料欄統計資料 中的說明,選擇隨需產生資料欄統計資料
注意
取樣選項不適用於 Iceberg 資料表。
AWS Glue 會計算 Iceberg 資料表每個資料欄的不同值數目,並將其儲存到遞交至 Amazon S3 位置中指定快照 ID 的新 Puffin 檔案。