ソートキー順序でのデータのロード - Amazon Redshift

Amazon Redshift は、パッチ 198 以降、新しい Python UDF の作成をサポートしなくなります。既存の Python UDF は、2026 年 6 月 30 日まで引き続き機能します。詳細については、ブログ記事を参照してください。

ソートキー順序でのデータのロード

ソートキー順序でデータをロードし、バキュームの必要性をなくします。

新しいデータの各バッチがテーブルの既存の行に続き、かつ COPY 操作が特定のロード最適化をトリガーするほど大容量でない場合、データはソート順に適切に保存されます。ユーザーはバキュームを実行する必要はありません。COPY により入ってくるデータの各バッチがロード時にソートされるため、各ロードの行を事前にソートする必要はありません。

例えば、本日のアクティビティに基づいて毎日データをロードするとします。ソートキーがタイムスタンプ列で、COPY 操作が特定のロード最適化をトリガーするほど大容量でない場合、データはソート順に保存されます。この順序が発生するのは、現在の日付のデータは常に前日のデータの末尾に付加されるためです。詳細については、「ソートキー順序でデータをロードする」を参照してください。バキュームオペレーションの詳細については、「テーブルのバキューム処理」を参照してください。