Iceberg テーブルの列統計の生成
以下の手順に従って、AWS Glue コンソールまたは AWS CLI を使用してデータカタログで統計を生成するスケジュールを設定するか、StartColumnStatisticsTaskRun オペレーションを実行します。
列統計を生成するには
-
AWS Glue コンソール (https://console.aws.amazon.com/glue/
) にサインインします。 -
[データカタログ] の下の [テーブル] を選択します。
-
リストから Iceberg テーブルを選択します。
-
[アクション] メニューで、[列の統計] の [オンデマンドで生成] を選択します。
[テーブル] ページの下のセクションにある [列統計] タブで [統計を生成] ボタンを選択することもできます。
-
[統計を生成] ページで、統計の生成の詳細を入力します。「スケジュールで列統計の生成」セクションのステップ 6~11 に従って、Iceberg テーブルの統計生成にスケジュールを設定します。
オンデマンドでの列統計の生成 の手順に従って、オンデマンドで列統計を生成することも選択できます。
注記
[サンプリング] オプションは Iceberg テーブルでは使用できません。
AWS Glue は、Amazon S3 の場所内の指定されたスナップショット ID にコミットされた新しい Puffin ファイルに対して、Iceberg テーブルの各列にある個別の値の数を計算します。