Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog
COPY da formati di dati a colonna
COPY può caricare i dati da Amazon S3 nei seguenti formati di colonna:
-
ORC
-
Parquet
Per esempi di utilizzo di COPY con formati di dati colonnari, consulta Esempi di COPY.
COPY supporta i dati formattati a colonna con le seguenti restrizioni:
-
I bucket Amazon S3 devono trovarsi nella stessa regione AWS del database Amazon Redshift.
-
Per accedere ai dati Amazon S3 tramite un endpoint VPC, configurare l'accesso utilizzando le policy e i ruoli IAM come descritto in Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato nella Guida alla gestione di Amazon Redshift.
-
COPY non applica automaticamente le codifiche di compressione.
-
Sono supportati solo i seguenti parametri COPY:
-
ACCEPTINVCHARS durante la copia da un file ORC o Parquet.
-
-
Se COPY rileva un errore durante il caricamento, il comando fallisce. ACCEPTANYDATE e MAXERROR non sono supportati per i tipi di dati colonnari..
I messaggi di errore vengono inviati al client SQL. Alcuni errori vengono registrati in STL_LOAD_ERRORS e STL_ERROR.
-
COPY inserisce i valori nelle colonne della tabella di destinazione nello stesso ordine in cui si presentano le colonne nei file di dati a colonna. Il numero di colonne nella tabella di destinazione e il numero di colonne nel file di dati devono corrispondere.
-
Se il file specificato per l'operazione COPY include una delle seguenti estensioni, decomprimiamo i dati senza la necessità di aggiungere alcun parametro:
.gz.snappy.bz2
Il COPY dai formati di file Parquet e ORC utilizza Redshift Spectrum e l'accesso al bucket. Per utilizzare COPY per questi formati, assicurati che non vi siano policy IAM che bloccano l’uso degli URL prefirmati di Amazon S3. Gli URL prefirmati generati da Amazon Redshift sono validi per un’ora in modo che Amazon Redshift abbia tempo sufficiente per caricare tutti i file dal bucket Amazon S3. Viene generato un URL prefirmato univoco per ogni file scansionato da COPY da formati di dati a colonna. Per le policy di bucket che includono un’azione
s3:signatureAge, assicurati di impostare il valore su almeno 3.600.000 millisecondi. Per ulteriori informazioni, consultare Utilizzo di Amazon Redshift Spectrum con il routing VPC avanzato.-
Il parametro REGION non è supportato con COPY da formati di dati a colonna. Anche se il bucket Amazon S3 e il database si trovano nella stessa Regione AWS, è possibile che si verifichi un errore, ad esempio
REGION argument is not supported for PARQUET based COPY. -
COPY da formati a colonna ora supporta il dimensionamento simultaneo. Per abilitare il dimensionamento simultaneo, consulta Configurazione delle code di dimensionamento simultaneo.