Laden von Daten in sequenziellen Blöcken - Amazon Redshift

Amazon Redshift unterstützt ab dem 1. November 2025 nicht mehr die Erstellung neuer Python-UDFs. Wenn Sie Python-UDFs verwenden möchten, erstellen Sie die UDFs vor diesem Datum. Bestehende Python-UDFs funktionieren weiterhin wie gewohnt. Weitere Informationen finden Sie im Blog-Posting.

Laden von Daten in sequenziellen Blöcken

Wenn Sie große Mengen von Daten laden müssen, laden Sie die Daten in sequenziellen Blöcken gemäß der Sortierreihenfolge, damit keine Bereinigung erforderlich ist.

Nehmen Sie beispielsweise an, Sie müssen eine Tabelle mit Ereignissen von Januar 2017 bis Dezember 2017 laden. Wenn sich jeder Monat in einer einzigen Datei befindet, laden Sie die Zeilen für Januar, dann Februar usw. Ihre Tabelle ist nach Abschluss des Ladevorgangs vollständig sortiert und Sie müssen keine Bereinigung durchführen. Weitere Informationen finden Sie unter Verwenden von Zeitreihentabellen.

Beim Laden sehr großer Datasets kann der für die Sortierung erforderliche Platz den gesamten verfügbaren Platz überschreiten. Durch das Laden in kleineren Blöcken verwenden Sie sehr viel weniger temporären Sortierplatz bei jedem Ladevorgang. Darüber hinaus erleichtert das Laden kleinerer Blöcke den Neustart, wenn COPY fehlschlägt und zurückgefahren wird.