COPY da formati di dati a colonna

COPY può caricare i dati da Amazon S3 nei seguenti formati di colonna:

ORC
Parquet

Per esempi di utilizzo di COPY con formati di dati colonnari, consulta Esempi di COPY.

COPY supporta i dati formattati a colonna con le seguenti restrizioni:

Il bucket Amazon S3 deve trovarsi nella stessa AWS regione del database Amazon Redshift.
Per accedere ai dati Amazon S3 tramite un endpoint VPC, configurare l'accesso utilizzando le policy e i ruoli IAM come descritto in Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato nella Guida alla gestione di Amazon Redshift.
COPY non applica automaticamente le codifiche di compressione.
Sono supportati solo i seguenti parametri COPY:
- ACCEPTINVCHARS durante la copia da un file ORC o Parquet.
- FILLRECORD
- FROM
- IAM_ROLE
- CREDENTIALS
- STATUPDATE
- MANIFEST
- EXPLICIT_IDS
Se COPY rileva un errore durante il caricamento, il comando fallisce. ACCEPTANYDATE e MAXERROR non sono supportati per i tipi di dati colonnari..
I messaggi di errore vengono inviati al client SQL. Alcuni errori vengono registrati in STL_LOAD_ERRORS e STL_ERROR.
COPY inserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui si presentano le colonne nei file di dati a colonna. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.
Se il file specificato per l'operazione COPY include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:
- .gz
- .snappy
- .bz2
Il COPY dai formati di file Parquet e ORC utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzare COPY per questi formati, assicurati che non vi siano policy IAM che bloccano l’uso degli URL prefirmati di Amazon S3. Gli URL prefirmati generati da Amazon Redshift sono validi per un’ora in modo che Amazon Redshift abbia tempo sufficiente per caricare tutti i file dal bucket Amazon S3. Viene generato un URL prefirmato univoco per ogni file scansionato da COPY da formati di dati a colonna. Per le policy di bucket che includono un’azione s3:signatureAge, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consultare Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato.
Il parametro REGION non è supportato con COPY da formati di dati a colonna. Anche se il bucket Amazon S3 e il database si trovano nello stesso database, è possibile che si verifichi un errore Regione AWS, ad esempio, l'argomento REGION non è supportato per COPY basato su PARQUET.
COPY da formati a colonna ora supporta il dimensionamento simultaneo. Per abilitare il dimensionamento simultaneo, consulta Configurazione delle code di dimensionamento simultaneo.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

COPY da JSON

Stringhe DATEFORMAT e TIMEFORMAT