Considérations générales relatives à l’unité de partage des données dans Amazon Redshift - Amazon Redshift

Amazon Redshift ne prendra plus en charge la création de nouvelles fonctions Python définies par l’utilisateur à compter du 1er novembre 2025. Si vous souhaitez utiliser des fonctions Python définies par l’utilisateur, créez-les avant cette date. Les fonctions Python définies par l’utilisateur existantes continueront de fonctionner normalement. Pour plus d’informations, consultez le billet de blog .

Considérations générales relatives à l’unité de partage des données dans Amazon Redshift

Voici des considérations générales lors de l’utilisation des unités de partage des données dans Amazon Redshift :

  • Base de données par défaut : lorsque vous lisez les données d’une unité de partage des données, vous restez connecté à votre base de données de cluster locale. Pour plus d’informations sur la configuration et la lecture d’une base de données créée à partir d’une unité de partage des données, voir Interrogation d’objets d’unité de partage des données et Vues matérialisées sur des tables de lacs de données externes dans Amazon Redshift Spectrum.

  • Connexions : vous devez être connecté directement à une base de données d’unité de partage des données, ou exécuter la commande USE pour écrire dans les unités de partage des données. Vous pouvez également utiliser la notation en trois parties. La commande USE n’est pas prise en charge sur les tables externes.

  • Performances : les performances des requêtes sur les données partagées dépendent de la capacité de calcul des clusters consommateur.

  • Frais de transfert de données : le partage de données entre régions inclut des frais supplémentaires.

    • Ces frais de transfert de données ne s’appliquent pas au sein d’une même région, mais uniquement entre les régions. Pour de plus amples informations, consultez Gestion du contrôle des coûts pour le partage de données entre régions.

    • Le consommateur est redevable de tous les frais de calcul et de transfert de données inter-région nécessaires pour interroger les données du producteur. Le producteur est facturé pour le stockage sous-jacent des données dans son cluster mis en service ou son espace de noms sans serveur.

  • Partage de données au sein et entre des clusters : vous n’avez besoin d’unités de partage de données que pour partager des données entre différents clusters mis en service ou des groupes de travail sans serveur Amazon Redshift. Dans un même cluster, vous pouvez interroger une autre base de données en utilisant une notation simple en trois parties database.schema.table, à condition de disposer des autorisations nécessaires sur les objets de l’autre base de données.

  • Découverte des métadonnées : lorsque vous êtes un consommateur connecté directement à une base de données d’unité de partage des données via des pilotes Redshift JDBC, ODBC ou Python, vous pouvez consulter les données du catalogue de la façon suivante :

  • Visibilité des autorisations : les consommateurs peuvent voir les autorisations accordées aux unités de partage des données via la commande SQL SHOW GRANTS.

  • Gestion du chiffrement de cluster pour le partage de données : pour partager des données entre un Compte AWS, il faut chiffrer à la fois le cluster producteur et consommateur.

    • Si les clusters producteurs et consommateurs et les espaces de noms sans serveur se trouvent dans le même compte, ils doivent avoir le même type de chiffrement (soit non chiffrés, soit tous deux chiffrés). Dans tous les autres cas, y compris les unités de partage des données gérées par Lake Formation, le consommateur et le producteur doivent être chiffrés. ceci à des fins de sécurité. Cependant, ils ne sont pas tenus de partager la même clé de chiffrement.

    • Pour protéger les données en transit, toutes les données sont chiffrées en transit via le schéma de chiffrement du cluster producteur. Le cluster consommateur adopte ce schéma de chiffrement lorsque les données sont chargées. Le cluster consommateur fonctionne ensuite comme un cluster chiffré normal. Les communications entre le producteur et le consommateur sont également chiffrées à l’aide d’un schéma de clé partagée. Pour plus d’informations sur le chiffrement en transit, consultez Chiffrement en transit.