Compatibilità con Apache Iceberg per Amazon Redshift - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Compatibilità con Apache Iceberg per Amazon Redshift

Puoi registrare interi cluster con provisioning Amazon Redshift o namespace serverless nel AWS Glue Data Catalog per creare cataloghi che condividono in modo sicuro i dati in tempo reale tra gli account AWS. Puoi accedere a questi cataloghi da qualsiasi motore di query SQL che supporti la REST API Apache Iceberg. AWS Lake Formation gestisce le autorizzazioni per i cataloghi, consentendoti di gestire una singola copia dei dati con un unico set di autorizzazioni, sfruttando al contempo le funzionalità di Amazon Redshift come le viste materializzate e le integrazioni Zero-ETL.

Tutti i cataloghi creati da cluster con provisioning Amazon Redshift e namespace serverless registrati nel AWS Glue Data Catalog vengono montati automaticamente come database esterni su tutti i cluster con provisioning e i gruppi di lavoro serverless nella stessa Regione AWS dello stesso account. I cataloghi creati nel AWS Glue Data Catalog per archiviare i dati in Redshift Managed Storage (RMS) vengono montati in modo analogo ai database esterni. Una volta che hai montato i cataloghi, puoi connetterti direttamente a questi database ed eseguire query sugli oggetti utilizzando la notazione in tre parti database@namespace-catalog.schema.table.

Regioni in cui è disponibile la compatibilità con Apache Iceberg

La compatibilità di Apache Iceberg con Amazon Redshift è disponibile nelle seguenti Regioni AWS:

  • Stati Uniti orientali (Virginia settentrionale)

  • Stati Uniti orientali (Ohio)

  • Stati Uniti occidentali (California settentrionale)

  • Asia Pacifico (Hong Kong)

  • Asia Pacifico (Seoul)

  • Asia Pacifico (Singapore)

  • Asia Pacifico (Sydney)

  • Asia Pacifico (Tokyo)

  • Canada (Centrale)

  • Europa (Francoforte)

  • Europa (Irlanda)

  • Europe (London)

  • Europe (Stockholm)

  • Sud America (San Paolo)

Considerazioni e limitazioni sull’utilizzo dei cataloghi di Amazon Redshift nel AWS Glue Data Catalog

Quando utilizzi i cataloghi di Amazon Redshift nel AWS Glue Data Catalog, considera quanto segue:

  • I data warehouse registrati nel AWS Glue Data Catalog seguono la sintassi in tre parti per l’accesso alle tabelle (database@namespace-catalog.schema.table). Ad esempio, se hai registrato un namespace Amazon Redshift denominato a, popolato da un database denominato b, che contiene uno schema denominato c, in cui è presente una tabella denominata d, devi selezionare da d utilizzando la dichiarazione seguente:

    SELECT * FROM b@a.c.d;

    Tieni presente che la lunghezza combinata della parte database@namespace-catalog della sintassi deve essere pari o inferiore a 127 caratteri.

  • Quando registri un namespace o un cluster nel AWS Glue Data Catalog, Amazon Redshift registra tutti i database e le relazioni in tale cluster o namespace.

  • Puoi registrare più cluster e namespace Redshift nel AWS Glue Data Catalog.

  • La registrazione di un cluster o un namespace include solo le relazioni e gli schemi interni in tale cluster o namespace. Non vengono registrati gli elementi seguenti:

    • Schemi esterni.

    • Tabelle esterne. Tieni presente che verranno registrate le viste con associazione tardiva create da tabelle esterne.

    • Funzioni create dall’utente.

    • Procedure.

    • Tabelle con la sicurezza a livello di riga o politiche di mascheramento dinamico dei dati allegate.

    • Oggetti di database con nomi in maiuscolo o maiuscolo e minuscolo. Le tabelle contenenti colonne con maiuscole o maiuscole e minuscole non vengono registrate. Ciò vale anche quando enable_case_sensitive_identifier è disabilitato.

  • Le autorizzazioni del database Amazon Redshift, ad esempio i ruoli concessi dal controllo degli accessi basato su ruoli, non vengono trasferite nei cataloghi nel AWS Glue Data Catalog. Utilizza AWS Lake Formation per configurare le autorizzazioni per il AWS Glue Data Catalog. Per ulteriori informazioni sull’utilizzo di Lake Formation per configurare le autorizzazioni, consulta Configurazione delle autorizzazioni per le unità di condivisione dati Amazon Redshift nella Guida per gli sviluppatori di AWS Lake Formation.

  • Quando crei un catalogo da un cluster o un namespace serverless registrato, il AWS Glue Data Catalog crea un gruppo di lavoro gestito da Amazon Redshift utilizzando le risorse di calcolo Amazon Redshift per gestire i requisiti di calcolo durante l’esecuzione di query su tale catalogo. Puoi visualizzare il gruppo di lavoro gestito nella console Amazon Redshift serverless e gestirlo in AWS Glue.

  • Quando registri un cluster in pausa, il AWS Glue Data Catalog non lo monta come catalogo finché il cluster non viene ripreso.

  • Quando registri un namespace serverless che non viene utilizzato attivamente, il AWS Glue Data Catalog non lo installa come catalogo finché non viene riutilizzato.

  • Per accedere alle tabelle nei data warehouse registrati nel AWS Glue Data Catalog, il livello di isolamento del database deve essere SNAPSHOT. Il tentativo di accedere a tabelle con un livello di isolamento SERIALIZABLE genera un errore. Per ulteriori informazioni sull’isolamento serializzabile, consulta Livelli di isolamento in Amazon Redshift. Per informazioni sulla modifica del livello di isolamento di un database, consulta ALTER DATABASE.

    Tieni presente che il livello di isolamento del database dev predefinito non può essere modificato. Di conseguenza ciò significa che le tabelle del database dev non vengono incluse nei dati accessibili durante la registrazione dei data warehouse nel AWS Glue Data Catalog.