COPY da formati di dati a colonna - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuovi Python a UDFs partire dal 1° novembre 2025. Se vuoi usare Python UDFs, crea la UDFs data precedente a quella data. Python esistente UDFs continuerà a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

COPY da formati di dati a colonna

COPY può caricare i dati da Amazon S3 nei seguenti formati di colonna:

  • ORC

  • Parquet

Per esempi di utilizzo di COPY con formati di dati colonnari, consulta Esempi di COPY.

COPY supporta dati in formato colonnare con le seguenti considerazioni:

  • Il bucket Amazon S3 deve trovarsi nella stessa AWS regione del database Amazon Redshift.

  • Per accedere ai dati Amazon S3 tramite un endpoint VPC, configurare l'accesso utilizzando le policy e i ruoli IAM come descritto in Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato nella Guida alla gestione di Amazon Redshift.

  • COPY non applica automaticamente le codifiche di compressione.

  • Sono supportati solo i seguenti parametri COPY:

  • Se COPY rileva un errore durante il caricamento, il comando fallisce. ACCEPTANYDATE e MAXERROR non sono supportati per i tipi di dati colonnari..

  • I messaggi di errore vengono inviati al client SQL. Alcuni errori vengono registrati in STL_LOAD_ERRORS e STL_ERROR.

  • COPY inserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui si presentano le colonne nei file di dati a colonna. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.

  • Se il file specificato per l'operazione COPY include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:

    • .gz

    • .snappy

    • .bz2

  • Il COPY dai formati di file Parquet e ORC utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzare COPY per questi formati, assicurati che non vi siano policy IAM che blocchino l'uso di Amazon S3 presigned. URLs I URLs prefirmati generati da Amazon Redshift sono validi per 1 ora, in modo che Amazon Redshift abbia abbastanza tempo per caricare tutti i file dal bucket Amazon S3. Viene generato un URL predefinito univoco per ogni file scansionato da COPY da formati di dati colonnari. Per le policy bucket che includono un's3:signatureAgeazione, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consultare Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato.

  • Il parametro REGION non è supportato con COPY dai formati di dati colonnari. Anche se il bucket Amazon S3 e il database si trovano nello stesso database, è possibile che si verifichi un errore Regione AWS, ad esempio, l'argomento REGION non è supportato per COPY basato su PARQUET.