Compatibilité d’Apache Iceberg pour Amazon Redshift - Amazon Redshift

Amazon Redshift ne prendra plus en charge la création de nouvelles fonctions Python définies par l’utilisateur à compter du 1er novembre 2025. Si vous souhaitez utiliser des fonctions Python définies par l’utilisateur, créez-les avant cette date. Les fonctions Python définies par l’utilisateur existantes continueront de fonctionner normalement. Pour plus d’informations, consultez le billet de blog .

Compatibilité d’Apache Iceberg pour Amazon Redshift

Vous pouvez enregistrer l’intégralité des clusters Amazon Redshift alloués ou des espaces de noms sans serveur dans le AWS Glue Data Catalog afin de créer des catalogues qui partagent en toute sécurité les données en temps réel entre les comptes AWS. Vous pouvez accéder à ces catalogues à partir de n’importe quel moteur de requête SQL prenant en charge l’API REST d’Apache Iceberg. AWS Lake Formation gère les autorisations pour les catalogues, vous permettant de gérer une seule copie des données avec un seul ensemble d’autorisations tout en tirant parti des fonctionnalités d’Amazon Redshift telles que les vues matérialisées et les intégrations zéro ETL.

Tous les catalogues créés à partir de clusters Amazon Redshift alloués enregistrés et d’espaces de noms sans serveur dans le AWS Glue Data Catalog sont automatiquement montés en tant que bases de données externes sur tous les clusters alloués et les groupes de travail sans serveur dans la même Région AWS sous le même compte. Les catalogues créés dans le AWS Glue Data Catalog pour stocker des données dans Redshift Managed Storage (RMS) sont montés de la même manière que des bases de données externes. Une fois le montage terminé, vous pouvez vous connecter directement à ces bases de données et interroger les objets à l’aide de la notation en trois parties database@namespace-catalog.schema.table.

Régions dans lesquelles la compatibilité avec Apache Iceberg est disponible

La compatibilité d’Apache Iceberg avec Amazon Redshift est disponible dans les Régions AWS suivantes :

  • USA Est (Virginie du Nord)

  • USA Est (Ohio)

  • USA Ouest (Californie du Nord)

  • Asie-Pacifique (Hong Kong)

  • Asie-Pacifique (Séoul)

  • Asie-Pacifique (Singapour)

  • Asie-Pacifique (Sydney)

  • Asie-Pacifique (Tokyo)

  • Canada (Centre)

  • Europe (Francfort)

  • Europe (Irlande)

  • Europe (Londres)

  • Europe (Stockholm)

  • Amérique du Sud (São Paulo)

Considérations et limites de l’utilisation des catalogues Amazon Redshift dans le AWS Glue Data Catalog

Lorsque vous utilisez les catalogues Amazon Redshift dans le AWS Glue Data Catalog, prenez en considération les éléments suivants :

  • Les entrepôts de données enregistrés dans le AWS Glue Data Catalog suivent la syntaxe en trois parties pour accéder aux tables (database@namespace-catalog.schema.table). Par exemple, si vous avez enregistré un espace de noms Amazon Redshift nommé a, alimenté par une base de données nommée b, qui contenait un schéma nommé c, dans lequel se trouvait une table nommée d, vous devez sélectionner l’espace d en utilisant l’instruction suivante :

    SELECT * FROM b@a.c.d;

    Notez que la longueur combinée de la partie database@namespace-catalog de la syntaxe doit être inférieure ou égale à 127 caractères.

  • Lorsque vous enregistrez un cluster ou un espace de noms dans le AWS Glue Data Catalog, Amazon Redshift enregistre toutes les bases de données et relations de ce cluster ou espace de noms.

  • Vous pouvez enregistrer plusieurs clusters et espaces de noms Redshift dans le AWS Glue Data Catalog.

  • L’enregistrement d’un cluster ou d’un espace de noms enregistre uniquement les schémas internes et les relations dans ce cluster ou cet espace de noms. Les éléments suivants ne sont pas enregistrés :

    • Schémas externes.

    • Tables externes. Notez que les vues à liaison tardive créées à partir de tables externes seront enregistrées.

    • Fonctions créées par l’utilisateur.

    • Procédures.

    • Tables auxquelles sont jointes des politiques de sécurité au niveau des lignes ou de masquage dynamique des données.

    • Objets de base de données dont les noms sont en majuscules ou en casse mixte. Les tables contenant des colonnes en majuscules ou en casse mixte ne sont pas enregistrées. Cela s’applique même lorsque enable_case_sensitive_identifier est désactivé.

  • Les autorisations de base de données Amazon Redshift, telles que les rôles accordés par le contrôle d’accès basé sur les rôles, ne sont pas transférées vers les catalogues du AWS Glue Data Catalog. Utilisez AWS Lake Formation pour configurer des autorisations pour le AWS Glue Data Catalog. Pour plus informations sur l’utilisation de Lake Formation pour configurer les permissions, consultez Configuration des autorisations pour les unités de partage des données d’Amazon Redshift dans le Guide du développeur AWS Lake Formation.

  • Lorsque vous créez un catalogue à partir d’un cluster enregistré ou d’un espace de noms sans serveur, le AWS Glue Data Catalog crée un groupe de travail géré dans Amazon Redshift en utilisant les ressources de calcul d’Amazon Redshift pour répondre aux exigences de calcul lors de l’interrogation de ce catalogue. Vous pouvez consulter le groupe de travail géré dans la console Amazon Redshift sans serveur et le gérer dans AWS Glue.

  • Lorsque vous enregistrez un cluster suspendu, le AWS Glue Data Catalog ne montera pas ce cluster en tant que catalogue tant que le cluster ne sera pas rétabli.

  • Lorsque vous enregistrez un espace de noms sans serveur qui n’est pas utilisé activement, le AWS Glue Data Catalog ne ne monteras pas cet espace de noms en tant que catalogue tant que l’espace de noms ne sera pas réutilisé.

  • Pour accéder aux tables des entrepôts de données enregistrés dans le AWS Glue Data Catalog, le niveau d’isolation de la base de données doit être SNAPSHOT. Toute tentative d’accès à des tables dont le niveau d’isolation est SERIALIZABLE entraînera une erreur. Pour plus d’informations sur l’isolation sérialisable, consultez Niveaux d’isolement dans Amazon Redshift. Pour plus d’informations sur la modification du niveau d’isolation d’une base de données, consultez ALTER DATABASE.

    Notez que le niveau d’isolation par défaut de la base de données dev ne peut pas être modifié. Par conséquent, cela signifie que les tables de la base de données dev ne seront pas incluses dans les données accessibles lors de l’enregistrement des entrepôts de données dans le AWS Glue Data Catalog.