檢視自動資料表層級設定 - AWS Glue

檢視自動資料表層級設定

啟用型錄層級統計資料收集時,只要透過 CreateTableUpdateTable API 使用 AWS Management Console、SDK 或 AWS Glue 編目程式 建立或更新 Apache Hive 資料表或 Apache Iceberg 資料表,就會為該資料表建立同等的資料表層級設定。

啟用產生自動統計資料的資料表必須遵循下列其中一個屬性:

  • 使用開頭為 org.apache.hadoop 且 TableType 等於 EXTERNAL_TABLEInputSerdeLibrary

  • 使用開頭為 com.amazon.ionTableType 等於 EXTERNAL_TABLEInputSerdeLibrary

  • 在其參數結構中包含 table_type:"ICEBERG"。

建立或更新資料表之後,您可以驗證資料表詳細資訊以確認統計資料產生。Statistics generation summary 會顯示 Schedule 屬性設定為 AUTO,且 Statistics configuration 值為 Inherited from catalog。Glue 會在內部自動觸發具有下列設定的任何資料表設定。

已套用型錄層級統計資料收集的 Hive 資料表影像,且已收集統計資料。