順次ブロックでのデータのロード - Amazon Redshift

Amazon Redshift は、2025 年 11 月 1 日以降、新しい Python UDF の作成をサポートしなくなります。Python UDF を使用する場合は、その日付より前に UDF を作成してください。既存の Python UDF は引き続き通常どおり機能します。詳細については、ブログ記事を参照してください。

順次ブロックでのデータのロード

大量のデータを追加する必要がある場合、ソート順序に基づいて順次ブロックでデータをロードすればバキュームの必要性がなくなります。

例えば、2017 年 1 月から 2017 年 12 月までのイベントのあるテーブルをロードする必要があるとします。各月が 1 つのファイルに含まれていると仮定して、1 月、2 月などと、行をロードします。ロードが完了したとき、テーブルは完全にソートされています。バキュームを実行する必要はありません。詳細については、「時系列テーブルの使用」を参照してください。

非常に大量のデータセットをロードするとき、ソートに必要な領域が利用可能な領域の合計を超えることがあります。小さなブロックでデータをロードすれば、各ロードの際、中間のソート領域が少なくて済みます。また、小さなブロックをロードする場合、COPY が失敗してロールバックされるときに簡単に再開できます。