COPY da formati di dati a colonna - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuovi Python UDFs a partire dalla Patch 198. Python esistente UDFs continuerà a funzionare fino al 30 giugno 2026. Per ulteriori informazioni, consulta il post del blog.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

COPY da formati di dati a colonna

COPY può caricare i dati da Amazon S3 nei seguenti formati di colonna:

  • ORC

  • Parquet

Per esempi di utilizzo di COPY con formati di dati colonnari, consulta Esempi di COPY.

COPY supporta i dati formattati a colonna con le seguenti restrizioni:

  • Il bucket Amazon S3 deve trovarsi nella stessa AWS regione del database Amazon Redshift.

  • Per accedere ai dati Amazon S3 tramite un endpoint VPC, configurare l'accesso utilizzando le policy e i ruoli IAM come descritto in Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato nella Guida alla gestione di Amazon Redshift.

  • COPY non applica automaticamente le codifiche di compressione.

  • Sono supportati solo i seguenti parametri COPY:

  • Se COPY rileva un errore durante il caricamento, il comando fallisce. ACCEPTANYDATE e MAXERROR non sono supportati per i tipi di dati colonnari..

  • I messaggi di errore vengono inviati al client SQL. Alcuni errori vengono registrati in STL_LOAD_ERRORS e STL_ERROR.

  • COPY inserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui si presentano le colonne nei file di dati a colonna. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.

  • Se il file specificato per l'operazione COPY include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:

    • .gz

    • .snappy

    • .bz2

  • Il COPY dai formati di file Parquet e ORC utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzare COPY per questi formati, assicurati che non vi siano policy IAM che blocchino l'uso di Amazon S3 presigned. URLs I URLs prefirmati generati da Amazon Redshift sono validi per 1 ora, in modo che Amazon Redshift abbia abbastanza tempo per caricare tutti i file dal bucket Amazon S3. Viene generato un URL prefirmato univoco per ogni file scansionato da COPY da formati di dati a colonna. Per le policy di bucket che includono un’azione s3:signatureAge, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consultare Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato.

  • Il parametro REGION non è supportato con COPY da formati di dati a colonna. Anche se il bucket Amazon S3 e il database si trovano nello stesso database, è possibile che si verifichi un errore Regione AWS, ad esempio, l'argomento REGION non è supportato per COPY basato su PARQUET.

  • COPY da formati a colonna ora supporta il dimensionamento simultaneo. Per abilitare il dimensionamento simultaneo, consulta Configurazione delle code di dimensionamento simultaneo.