Amazon Redshift は、パッチ 198 以降、新しい Python UDF の作成をサポートしなくなります。既存の Python UDF は、2026 年 6 月 30 日まで引き続き機能します。詳細については、ブログ記事
ソートキー順序でのデータのロード
ソートキー順序でデータをロードし、バキュームの必要性をなくします。
新しいデータの各バッチがテーブルの既存の行に続き、かつ COPY 操作が特定のロード最適化をトリガーするほど大容量でない場合、データはソート順に適切に保存されます。ユーザーはバキュームを実行する必要はありません。COPY により入ってくるデータの各バッチがロード時にソートされるため、各ロードの行を事前にソートする必要はありません。
例えば、本日のアクティビティに基づいて毎日データをロードするとします。ソートキーがタイムスタンプ列で、COPY 操作が特定のロード最適化をトリガーするほど大容量でない場合、データはソート順に保存されます。この順序が発生するのは、現在の日付のデータは常に前日のデータの末尾に付加されるためです。詳細については、「ソートキー順序でデータをロードする」を参照してください。バキュームオペレーションの詳細については、「テーブルのバキューム処理」を参照してください。