Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog
Redshift Spectrum e AWS Lake Formation
In questo argomento viene descritto come utilizzare Redshift Spectrum con Lake Formation. Lake Formation è un servizio per la condivisione di dati analitici.
È possibile utilizzare AWS Lake Formation per definire centralmente e consolidare le policy di accesso a livello di database, tabella e colonna ai dati archiviati in Amazon S3. Dopo aver registrato i dati con AWS Glue Data Catalog abilitato con Lake Formation, è possibile eseguire query utilizzando diversi servizi, incluso Redshift Spectrum.
Lake Formation offre la sicurezza e la governance del catalogo di dati. All'interno di Lake Formation, è possibile concedere e revocare le autorizzazioni per gli oggetti del catalogo di dati, come database, tabelle, colonne e archiviazione Amazon S3 sottostante.
Importante
È possibile utilizzare Redshift Spectrum solo con un catalogo di dati abilitato per Lake Formation nelle regioni AWS in cui è disponibile Lake Formation. Per l'elenco delle regioni disponibili, consulta Endpoint e quote di AWS Lake Formation in Riferimenti generali di AWS.
Utilizzando Redshift Spectrum con Lake Formation, è possibile effettuare le seguenti operazioni:
Utilizzare Lake Formation come luogo centralizzato in cui concedere e revocare le autorizzazioni e accedere alle policy di controllo su tutti i dati del data lake. Lake Formation offre una gerarchia alle autorizzazioni per controllare l'accesso a database e tabelle in un catalogo di dati. Per ulteriori informazioni, consulta la pagina relativa alla panoramica delle autorizzazioni di Lake Formation nella Guida per gli sviluppatori di AWS Lake Formation.
Crea tabelle esterne ed esegui query sui dati nel data lake. Prima che gli utenti nell'account possano eseguire le query, un amministratore dell'account data lake registra i percorsi Amazon S3 esistenti contenenti dati di origine con Lake Formation. L'amministratore crea anche tabelle e concede le autorizzazioni ai tuoi utenti. L'accesso può essere concesso per database, tabelle o colonne. L'amministratore può utilizzare i filtri di dati in Lake Formation per garantire un controllo granulare dell'accesso ai dati sensibili memorizzati in Amazon S3. Per ulteriori informazioni, consulta Utilizzo di filtri di dati per la sicurezza a livello di riga e cella.
Dopo che i dati sono stati registrati nel catalogo dati, ogni volta che gli utenti provano a eseguire le query, Lake Formation verifica l'accesso alla tabella per quel principal specifico. Lake Formation fornisce credenziali temporanee a Redshift Spectrum e la query viene eseguita.
-
Esegui le query Redshift Spectrum su un AWS Glue Data Catalog montato automaticamente utilizzando le credenziali IAM ottenute con
GetCredentialsoGetClusterCredentialse gestisci le autorizzazioni Lake Formation in base all'utente del database (IAMR:username o IAM:username).
Quando si utilizza Redshift Spectrum con un catalogo di dati abilitato per Lake Formation, deve essere soddisfatta una delle seguenti condizioni:
Un ruolo IAM associato al cluster con autorizzazione al catalogo dati.
Un'identità IAM federata configurata per gestire l'accesso a risorse esterne. Per maggiori informazioni, consulta Utilizzo di un'identità federata per gestire l'accesso di Amazon Redshift alle risorse locali e alle tabelle esterne di Amazon Redshift Spectrum.
Importante
Non è possibile collegare i ruoli IAM quando si utilizza Redshift Spectrum con un catalogo di dati abilitato per Lake Formation.
Per ulteriori informazioni sui passaggi richiesti per configurare AWS Lake Formation per l'utilizzo con Redshift Spectrum, consulta Tutorial: Creating a data lake from a JDBC source in Lake Formation nella Guida per gli sviluppatori di AWS Lake Formation. In particolare, consulta Esecuzione di query sui dati nel data lake utilizzando Amazon Redshift Spectrum per i dettagli sull'integrazione con Redshift Spectrum. I dati e le risorse AWS presenti in questo argomento dipendono dalle fasi precedenti del tutorial.
Utilizzo di filtri di dati per la sicurezza a livello di riga e cella
È possibile definire filtri di dati in AWS Lake Formation per controllare l'accesso a livello di riga e di cella delle query Redshift Spectrum ai dati definiti nel tuo catalogo dati. Per configurare questo controllo, eseguirai le seguenti attività:
Creazione di un filtro di dati in Lake Formation con le seguenti informazioni:
Una specifica di colonna con un elenco di colonne da includere o escludere dai risultati della query.
Un'espressione di filtro di riga che specifica le righe da includere nei risultati della query.
Per ulteriori informazioni su come creare un filtro di dati, consulta Filtri di dati in Lake Formation nella Guida per gli sviluppatori di AWS Lake Formation.
Creazione di una tabella esterna in Amazon Redshift che faccia riferimento a una tabella nel tuo catalogo dati abilitato per Lake Formation. Per dettagli su come eseguire query su una tabella di Lake Formation utilizzando Redshift Spectrum, consulta Esecuzione di query sui dati nel data lake utilizzando Amazon Redshift Spectrum nella Guida per gli sviluppatori di AWS Lake Formation.
Dopo aver definito la tabella in Amazon Redshift, puoi eseguire query sulla tabella di Lake Formation e accedere solo alle righe e alle colonne consentite dal filtro di dati.
Per una guida dettagliata su come configurare la sicurezza a livello di riga e di cella in Lake Formation e quindi eseguire query mediante Redshift Spectrum, consulta la pagina relativa all'utilizzo di Amazon Redshift Spectrum con policy di sicurezza a livello di riga e di cella definite in AWS Lake Formation