SELECT * FROM ステートメントを使用しないクエリの問題を特定するクエリの概要情報を取得するクロス結合を避けるクエリ述語で関数を使用しない不要なキャスト変換を避ける複雑な集計には CASE 式を使用するサブクエリを使用する述語を使用する述語を追加して結合を使用するテーブルをフィルタリングする述語には最も安価な演算子を使用する GROUP BY 句でソートキーを使用するマテリアライズドビューの利点 GROUP BY 句と ORDER BY 句の列に注意する

Amazon Redshift クエリの設計のベストプラクティス

このセクションでは、クエリの設計に関するベストプラクティスの概要を説明します。最適なクエリのパフォーマンスと効率性を実現するには、このセクションのベストプラクティスに従うことをお勧めします。

SELECT * FROM ステートメントを使用しない

SELECT * FROM ステートメントは使用しないことをお勧めします。代わりに、分析する列を必ず一覧表示してください。これにより、クエリの実行時間が短縮され、Amazon Redshift Spectrum クエリのスキャンコストが削減されます。

避けるべき内容の例


select * 
from sales;

ベストプラクティスの例


select sales_date, sales_amt
from sales;

クエリの問題を特定する

STL_ALERT_EVENT_LOG ビューを確認し、クエリで発生する可能性のある問題を特定して修正することをお勧めします。

クエリの概要情報を取得する

クエリの概要情報を取得するには、SVL_QUERY_SUMMARY ビューと SVL_QUERY_REPORT ビューを使用することをお勧めします。この情報を使用して、クエリを最適化できます。

クロス結合を避ける

やむを得ない場合を除き、クロス結合を使用することは避けてください。クロス結合は、2 つのテーブルの直積集合を算出する結合条件のない結合です。クロス結合は通常ネステッドループ結合として実行されますが、これは使用可能な結合タイプで最も低速な結合です。

避けるべき内容の例


select c.c_name, 
          n.n_name 
from tpch.customer c, 
        tpch.nation n;

ベストプラクティスの例


select c.c_name, 
           n.n_name 
from tpch.customer c, 
join tpch.nation n
  on n.n_nationkey = c.c_nationkey;

クエリ述語で関数を使用しない

クエリ述語では関数を使用しないことをお勧めします。通常、関数は各行に処理オーバーヘッドを追加し、クエリの実行全体を遅くするため、クエリ述語で関数を使用すると、パフォーマンスに悪影響を及ぼす可能性があります。

避けるべき内容の例


select sum(o_totalprice)
from tpch.orders
where datepart(year, o_orderdate) = 1992;

ベストプラクティスの例


select sum(o_totalprice)
from tpch.orders
where o_orderdate between '1992-01-01' and '1992-12-31';

不要なキャスト変換を避ける

データ型のキャストには時間とリソースがかかり、クエリの実行が遅くなるため、クエリで不要なキャスト変換を使用しないことをお勧めします。

避けるべき内容の例


select sum(o_totalprice)
from tpch.orders
where o_ordertime::date = '1992-01-01';

ベストプラクティスの例


select sum(o_totalprice)
from tpch.orders
where o_ordertime between '1992-01-01 00:00:00' and '1992-12-31 23:59:59';

複雑な集計には CASE 式を使用する

同じテーブルから複数回選択するのではなく、CASE 式を使用して複雑な集計を実行することをお勧めします。

避けるべき内容の例


select sum(sales_amt) as us_sales
from sales
where country = 'US';

select sum(sales_amt) as ca_sales
from sales
where country = 'CA';

ベストプラクティスの例


select sum(case when country = 'US' then sales_amt end) as us_sales,
           sum(case when country = 'CA' then sales_amt end) as ca_sales
from sales;

サブクエリを使用する

クエリのテーブル 1 つが述語条件のみで使用されている場合には、サブクエリを使用することをお勧めします。この場合、サブクエリはわずかな数の行を返します (ほぼ 200 行未満)。

避けるべき内容の例

サブクエリが 200 行未満を返す場合:


select sum(order_amt) as total_sales
from sales
where region_key IN
        (select region_key
         from regions
         where state = 'CA');

ベストプラクティスの例

サブクエリが 200 行以上を返す場合:


select sum(o.order_amt) as total_sales
from sales o
join regions r
  on r.region_key = o.region_key
  and r.state = 'CA';

述語を使用する

述語を使用してデータセットをできるだけ制限することをお勧めします。述語は SQL で使用され、クエリで返されるデータをフィルタリングおよび制限します。述語で条件を指定することで、指定された条件に基づいてクエリ結果に含める必要がある行を指定できます。これにより、関心のあるデータのみを取得でき、クエリの効率と精度が向上します。詳細については、Amazon Redshift ドキュメントの「Conditions」を参照してください。

述語を追加して結合を使用するテーブルをフィルタリングする

述語が同じフィルタを適用する場合でも、述語を追加して結合に関与するテーブルをフィルタリングすることをお勧めします。述語を使用して SQL で結合を使用するテーブルをフィルタリングすると、処理する必要があるデータの量と中間結果セットのサイズを減らして、クエリのパフォーマンスを向上させることができます。WHERE 句で結合オペレーションの条件を指定することで、クエリ実行エンジンは、結合前に条件に一致しない行を削除できます。これにより、結果セットが小さくなり、クエリの実行が高速化されます。

避けるべき内容の例


select p.product_name, sum(o.order_amt)
from sales o
join product p
   on r.product_key = o.product_key
where o.order_date > '2022-01-01';

ベストプラクティスの例


select p.product_name, sum(o.order_amt)
from sales o
join product p
  on p.product_key = o.product_key
  and p.added_date > '2022-01-01'
where o.order_date > '2022-01-01';

述語には最も安価な演算子を使用する

述語では、できる限りコストのかからない演算子を使用します。比較条件演算子は LIKE 演算子よりも優先されます。LIKE 演算子は、SIMILAR TO 演算子または POSIX 演算子よりも優先されます。

GROUP BY 句でソートキーを使用する

GROUP BY 句でソートキーを使用すると、クエリプランナーがより効率的な集計を使用できます。GROUP BY リストにソートキー列のみが含まれており、そのうち 1 つが分散キーでもある場合、クエリは 1 フェーズ集計の対象となる可能性があります。GROUP BY リストのソートキー列には、1 番目のソートキーの後に、ソートキー順序で使用する他のソートキーが含まれている必要があります。

マテリアライズドビューの利点

可能であれば、複雑なコードをマテリアライズドビューに置き換えてクエリを書き換えます。これにより、クエリのパフォーマンスが大幅に向上します。詳細については、Amazon Redshift のドキュメントの「Amazon Redshift でのマテリアライズドビューの作成」を参照してください。

GROUP BY 句と ORDER BY 句の列に注意する

ORDER BY 句と GROUP BY 句の両方を使用する場合は、列を GROUP BY 句と ORDER BY 句の両方に同じ順序で配置してください。GROUP BY では、データを暗黙的にソートする必要があります。ORDER BY 句が異なる場合は、データを 2 回ソートする必要があります。

避けるべき内容の例


select a, b, c, sum(d)
from a_table
group by b, c, a
order by a, b, c

ベストプラクティスの例


select a, b, c, sum(d)
from a_table
group by a, b, c
order by a, b, c

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

テーブルのベストプラクティス

Redshift Spectrum のベストプラクティス