Utiliser une seule commande COPY pour charger à partir de plusieurs fichiers - Amazon Redshift

Amazon Redshift ne prendra plus en charge la création de nouveaux Python UDFs à compter du 1er novembre 2025. Si vous souhaitez utiliser Python UDFs, créez la version UDFs antérieure à cette date. Le Python existant UDFs continuera à fonctionner normalement. Pour plus d'informations, consultez le billet de blog.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser une seule commande COPY pour charger à partir de plusieurs fichiers

Amazon Redshift charge automatiquement en parallèle à partir de plusieurs fichiers de données compressés. Vous pouvez spécifier les fichiers à charger en utilisant un préfixe d’objet Amazon S3 ou un fichier manifeste.

Toutefois, si vous utilisez plusieurs commandes COPY simultanées pour charger une table à partir de plusieurs fichiers, Amazon Redshift est obligé d'effectuer un chargement sérialisé. Ce type de chargement est beaucoup plus lent et requiert un processus VACUUM à la fin si la table possède une colonne de tri définie. Pour plus d'informations sur l'utilisation de COPY pour charger les données en parallèle, consultez Chargement des données à partir d’Amazon S3.