Amazon Redshift non supporterà più la creazione di nuovi Python a UDFs partire dal 1° novembre 2025. Se vuoi usare Python UDFs, crea la UDFs data precedente a quella data. Python esistente UDFs continuerà a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Considerazioni generali per la condivisione dei dati in Amazon Redshift
Di seguito sono riportate alcune considerazioni generali relative all'utilizzo di condivisioni di dati in Amazon Redshift:
-
Database predefinito: quando leggi i dati da un datashare, rimani connesso al database del cluster locale. Per ulteriori informazioni sulla configurazione e la lettura da un database creato da un datashare, vedere Interrogazione di oggetti datashare e. Visualizzazioni materializzate su tabelle di data lake esterne in Amazon Redshift Spectrum
-
Connessioni: è necessario connettersi direttamente a un database datashare o eseguire il comando USE per scrivere su datashare. È inoltre possibile utilizzare una notazione in tre parti. Il comando USE non è supportato su tabelle esterne.
-
Prestazioni: le prestazioni delle query sui dati condivisi dipendono dalla capacità di elaborazione dei cluster di consumatori.
-
Costi di trasferimento dati: la condivisione dei dati tra regioni include costi aggiuntivi per il trasferimento di dati tra regioni.
-
Questi costi per il trasferimento dei dati non si applicano all'interno della stessa regione, ma solo tra regioni. Per ulteriori informazioni, consulta Gestione del controllo dei costi per la condivisione dei dati tra regioni.
-
Al consumer vengono addebitati tutti i costi di calcolo e di trasferimento di dati tra regioni necessari per eseguire query sui dati del producer. Al producer vengono addebitati i costi per l'archiviazione sottostante dei dati nel cluster con provisioning o nello spazio dei nomi serverless.
-
-
Condivisione dei dati all'interno e tra i cluster: le condivisioni di dati sono necessarie solo quando condividi dati tra diversi cluster o gruppi di lavoro serverless con provisioning di Amazon Redshift. All'interno dello stesso cluster, è possibile eseguire query su un altro database utilizzando una semplice notazione in tre parti
database.schema.table
purché si disponga delle autorizzazioni richieste per gli oggetti dell'altro database. -
Metadata Discovery: se sei un consumatore connesso direttamente a un database di datashare tramite i driver JDBC, ODBC o Python Redshift, puoi visualizzare i dati del catalogo nei seguenti modi:
-
Comandi SQL SHOW.
-
Query su tabelle e viste information_schema.
-
Query su viste SVV dei metadati.
-
-
Visibilità delle autorizzazioni: i consumatori possono visualizzare le autorizzazioni concesse ai datashare tramite il comando SQL SHOW GRANTS.
-
Gestione della crittografia dei cluster per la condivisione dei dati: per condividere i dati su un cluster Account AWS, sia il cluster di produttori che quello di consumatori devono essere crittografati.
-
Se i cluster di produttori e consumatori e gli spazi dei nomi serverless si trovano nello stesso account, devono avere lo stesso tipo di crittografia (entrambi non crittografati o entrambi crittografati). In tutti gli altri casi, comprese le condivisioni di dati gestite da Lake Formation, sia il consumatore che il produttore devono essere crittografati. Questo è per motivi di sicurezza. Tuttavia, non è necessario che condividano la stessa chiave di crittografia.
-
Per proteggere i dati in transito, tutti i dati vengono crittografati in transito attraverso lo schema di crittografia del cluster producer. Il cluster consumer adotta questo schema di crittografia quando vengono caricati i dati. Il cluster consumer funziona quindi come un normale cluster crittografato. Anche le comunicazioni tra produttore e consumatore vengono crittografate utilizzando uno schema a chiave condivisa. Per ulteriori informazioni sulla crittografia in transito, consultare Crittografia in transito.
-