Considérations générales relatives au partage de données dans Amazon Redshift - Amazon Redshift

Amazon Redshift ne prendra plus en charge la création de nouveaux Python UDFs à compter du 1er novembre 2025. Si vous souhaitez utiliser Python UDFs, créez la version UDFs antérieure à cette date. Le Python existant UDFs continuera à fonctionner normalement. Pour plus d'informations, consultez le billet de blog.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Considérations générales relatives au partage de données dans Amazon Redshift

Voici quelques considérations générales à prendre en compte lors de l'utilisation de partages de données dans Amazon Redshift :

  • Base de données par défaut : lorsque vous lisez les données d'un partage de données, vous restez connecté à votre base de données de cluster locale. Pour plus d'informations sur la configuration et la lecture d'une base de données créée à partir d'un partage de données, consultez les sections Interrogation d'objets de partage de données et. Vues matérialisées sur des tables de lacs de données externes dans Amazon Redshift Spectrum

  • Connexions : vous devez être connecté directement à une base de données de partage de données ou exécuter la commande USE pour écrire dans des partages de données. Vous pouvez également utiliser la notation en trois parties. La commande USE n'est pas prise en charge sur les tables externes.

  • Performances — Les performances des requêtes sur les données partagées dépendent de la capacité de calcul des clusters consommateurs.

  • Frais de transfert de données — Le partage de données entre régions inclut des frais supplémentaires de transfert de données entre régions.

    • Ces frais de transfert de données ne s'appliquent pas au sein d'une même région, mais uniquement entre les régions. Pour de plus amples informations, veuillez consulter Gestion du contrôle des coûts pour le partage de données entre régions.

    • Le consommateur est redevable de tous les frais de calcul et de transfert de données inter-région nécessaires pour interroger les données du producteur. Le producteur est facturé pour le stockage sous-jacent des données dans son cluster mis en service ou son espace de noms sans serveur.

  • Partage de données au sein des clusters et entre ceux-ci : vous n'avez besoin de partages de données que lorsque vous partagez des données entre différents clusters provisionnés par Amazon Redshift ou des groupes de travail sans serveur. Dans un même cluster, vous pouvez interroger une autre base de données en utilisant une notation simple en trois parties database.schema.table, à condition de disposer des autorisations nécessaires sur les objets de l’autre base de données.

  • Découverte des métadonnées : lorsque vous êtes un consommateur connecté directement à une base de données de partage de données via les pilotes Redshift JDBC, ODBC ou Python, vous pouvez consulter les données du catalogue de la manière suivante :

  • Visibilité des autorisations — Les consommateurs peuvent voir les autorisations accordées aux partages de données via la commande SQL SHOW GRANTS.

  • Gestion du chiffrement des clusters pour le partage des données : pour partager des données entre un cluster Compte AWS, le producteur et le cluster consommateur doivent être chiffrés.

    • Si les clusters producteurs et consommateurs et les espaces de noms sans serveur se trouvent dans le même compte, ils doivent avoir le même type de chiffrement (soit non chiffrés, soit tous deux chiffrés). Dans tous les autres cas, y compris les partages de données gérés par Lake Formation, le consommateur et le producteur doivent être chiffrés. ceci à des fins de sécurité. Cependant, ils ne sont pas tenus de partager la même clé de chiffrement.

    • Pour protéger les données en transit, toutes les données sont chiffrées en transit via le schéma de chiffrement du cluster producteur. Le cluster consommateur adopte ce schéma de chiffrement lorsque les données sont chargées. Le cluster consommateur fonctionne ensuite comme un cluster chiffré normal. Les communications entre le producteur et le consommateur sont également chiffrées à l’aide d’un schéma de clé partagée. Pour plus d’informations sur le chiffrement en transit, consultez Chiffrement en transit.