列統計の表示
統計が正常に生成されると、データカタログは、Amazon Athena と Amazon Redshift のコストベースのオプティマイザーがクエリを実行する際に最適な選択を行うことができるように、この情報を保存します。統計は列のタイプによって異なります。
- AWS Management Console
-
テーブルの列統計を表示するには
-
列統計タスクを実行すると、[テーブルの詳細] ページの [列統計] タブにテーブルの統計が表示されます。
次の統計を使用できます。
[列名]: 統計を生成するために使用される列名
[最終更新日時]: 統計が生成された日時
[平均長]: 列内の値の平均長
[個別の値]: 列内の個別の値の合計数。列内の個別の値の数を 5% の相対誤差で推定します。
[最大値]: 列内の最大値。
[最小値]: 列内の最小値。
[最大長]: 列内の最大値の長さ。
[Null 値]: 列内の null 値の合計数。
[True 値]: 列内の true 値の合計数。
[False 値]: 列内の false 値の合計数。
-
[numFiles]: テーブル内のファイルの合計数。この値は、[詳細プロパティ] タブで使用できます。
-
- AWS CLI
-
次の例は、AWS CLI を使用して列統計を取得する方法を示しています。
aws glue get-column-statistics-for-table \ --database-namedatabase_name\ --table-nametable_name\ --column-names<column_name>GetColumnStatisticsForTable API オペレーションを使用して列統計を表示することもできます。
オンデマンドでの列統計の生成
列統計タスクの実行の表示