Iceberg テーブルの列統計の生成 - AWS Glue

Iceberg テーブルの列統計の生成

以下の手順に従って、AWS Glue コンソールまたは AWS CLI を使用してデータカタログで統計を生成するスケジュールを設定するか、StartColumnStatisticsTaskRun オペレーションを実行します。

列統計を生成するには
  1. AWS Glue コンソール (https://console.aws.amazon.com/glue/) にサインインします。

  2. [データカタログ] の下の [テーブル] を選択します。

  3. リストから Iceberg テーブルを選択します。

  4. [アクション] メニューで、[列の統計][オンデマンドで生成] を選択します。

    [テーブル] ページの下のセクションにある [列統計] タブで [統計を生成] ボタンを選択することもできます。

  5. [統計を生成] ページで、統計の生成の詳細を入力します。「スケジュールで列統計の生成」セクションのステップ 6~11 に従って、Iceberg テーブルの統計生成にスケジュールを設定します。

    オンデマンドでの列統計の生成 の手順に従って、オンデマンドで列統計を生成することも選択できます。

    注記

    [サンプリング] オプションは Iceberg テーブルでは使用できません。

    AWS Glue は、Amazon S3 の場所内の指定されたスナップショット ID にコミットされた新しい Puffin ファイルに対して、Iceberg テーブルの各列にある個別の値の数を計算します。