

 Amazon Redshift non supporterà più la creazione di nuovi Python UDFs a partire dalla Patch 198. Python esistente UDFs continuerà a funzionare fino al 30 giugno 2026. Per ulteriori informazioni, consulta il [post del blog](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/). 

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Integrazione con Amazon Redshift per Apache Spark
<a name="spark-redshift-connector"></a>

 [Apache Spark](https://aws.amazon.com/emr/features/spark/) è un framework di elaborazione distribuito e un modello di programmazione che ti aiuta ad eseguire attività come machine learning, elaborazione di flussi o analisi di grafici. Come Apache Hadoop, Spark è un sistema di elaborazione distribuito open source utilizzato in genere per carichi di lavoro di Big Data. Spark dispone di un motore di esecuzione basato su grafo aciclico orientato (DAG) ottimizzato e memorizza attivamente i dati nella cache. Ciò può migliorare le prestazioni, in particolare per determinati algoritmi e per le query interattive. 

 Questa integrazione ti fornisce un connettore Spark che puoi usare per creare applicazioni Apache Spark in grado di leggere e scrivere dati in Amazon Redshift e Amazon Redshift serverless. Queste applicazioni non compromettono le prestazioni delle applicazioni o la coerenza transazionale dei dati. Questa integrazione è inclusa automaticamente in [Amazon EMR](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/) e [AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/), pertanto puoi eseguire immediatamente i processi di Apache Spark che accedono e caricano i dati in Amazon Redshift nell'ambito delle tue pipeline di importazione e trasformazione dei dati. 

Attualmente, puoi usare le versioni 3.3.x, 3.4.x, 3.5.x e 4.0.0 di Spark con questa integrazione.

 Questa integrazione offre i seguenti vantaggi: 
+  AWS Identity and Access Management autenticazione (IAM). Per ulteriori informazioni, consulta [Identity and access management in Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/redshift-iam-authentication-access-control.html). 
+ Pushdown dei predicati e delle query per migliorare le prestazioni.
+  Tipi di dati di Amazon Redshift. 
+ Connettività ad Amazon Redshift e Amazon Redshift serverless.

## Considerazioni e limitazioni relative all'utilizzo del connettore Spark
<a name="spark-redshift-connector-considerations"></a>
+  La URI tempdir punta a una posizione Amazon S3. Questa directory temporanea non viene pulita automaticamente e potrebbe comportare costi aggiuntivi. Si consiglia di utilizzare le [Policy del ciclo di vita di Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) nella *Amazon Simple Storage Service User Guide* (Guida per l'utente di Amazon Simple Storage Service) per definire le regole di conservazione del bucket Amazon S3. 
+  Per impostazione predefinita, le copie tra Amazon S3 e Redshift non funzionano se il bucket S3 e il cluster Redshift si trovano in regioni diverse. AWS Per utilizzare AWS regioni separate, imposta il `tempdir_region` parametro sulla regione del bucket S3 utilizzato per. `tempdir`
+ Scritture tra regioni tra S3 e Redshift se si scrivono dati Parquet utilizzando il parametro `tempformat`.
+ Si consiglia di utilizzare [Crittografia lato server di Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/serv-side-encryption.html) per crittografare i bucket Amazon S3 utilizzati. 
+ Si consiglia di [bloccare l'accesso pubblico ai bucket Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/access-control-block-public-access.html). 
+  Si consiglia di non rendere accessibile pubblicamente il cluster Amazon Redshift. 
+  Si consiglia di abilitare la [registrazione dell'audit di Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/db-auditing.html). 
+  Si consiglia di abilitare la [crittografia dei dati inattivi di Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/security-server-side-encryption.html). 
+  Si consiglia di abilitare SSL per la connessione JDBC da Spark su Amazon EMR ad Amazon Redshift. 
+ Si consiglia di passare un ruolo IAM utilizzando il parametro `aws_iam_role` per il parametro di autenticazione di Amazon Redshift.