Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création et gestion d'une source de DataZone données Amazon pour Amazon Redshift
Dans Amazon DataZone, vous pouvez créer une source de données Amazon Redshift afin d'importer les métadonnées techniques des tables et des vues de base de données depuis l'entrepôt de données Amazon Redshift. Pour ajouter une source de DataZone données Amazon pour Amazon Redshift, l'entrepôt de données source doit déjà exister dans Amazon Redshift.
Lorsque vous créez et gérez une source de données Amazon Redshift, vous ajoutez des actifs de l'entrepôt de données Amazon Redshift source à l'inventaire de votre projet DataZone Amazon. Vous pouvez exécuter vos sources de données Amazon Redshift selon un calendrier défini ou à la demande pour créer ou mettre à jour les métadonnées techniques de vos actifs. Pendant l'exécution des sources de données, vous pouvez éventuellement choisir de publier les actifs de l'inventaire de votre projet dans le DataZone catalogue Amazon afin de les rendre accessibles à tous les utilisateurs du domaine. Vous pouvez également publier vos actifs d'inventaire après avoir modifié leurs métadonnées commerciales. Les utilisateurs du domaine peuvent rechercher et découvrir vos actifs publiés et demander des abonnements à ces actifs.
Pour ajouter une source de données Amazon Redshift
-
Accédez à l'URL du portail de DataZone données Amazon et connectez-vous à l'aide de l'authentification unique (SSO) ou de vos AWS informations d'identification. Si vous êtes un DataZone administrateur Amazon, vous pouvez accéder à la DataZone console Amazon à l'adresse https://console.aws.amazon.com/datazone
et vous connecter avec l' Compte AWS endroit où le domaine a été créé, puis choisir Open data portal. -
Choisissez Sélectionner un projet dans le volet de navigation supérieur et sélectionnez le projet auquel vous souhaitez ajouter la source de données.
-
Accédez à l'onglet Données du projet.
-
Choisissez Sources de données dans le volet de navigation de gauche, puis choisissez Créer une source de données.
-
Configurez les champs suivants :
-
Nom : nom de la source de données.
-
Description — Description de la source de données.
-
-
Sous Type de source de données, sélectionnez Amazon Redshift.
-
Sous Sélectionnez un environnement, spécifiez un environnement dans lequel publier les tables Amazon Redshift.
-
En fonction de l'environnement que vous sélectionnez, Amazon DataZone appliquera automatiquement les informations d'identification Amazon Redshift et les autres paramètres directement depuis l'environnement ou vous donnera la possibilité de choisir les vôtres.
-
Si vous avez sélectionné un environnement qui autorise uniquement la publication à partir du schéma Amazon Redshift par défaut de l'environnement, Amazon DataZone appliquera automatiquement les informations d'identification Amazon Redshift et d'autres paramètres, notamment le nom du cluster ou du groupe de travail Amazon Redshift, le secret AWS , le nom de la base de données et le nom du schéma. Vous ne pouvez pas modifier ces paramètres remplis automatiquement.
-
Si vous sélectionnez un environnement qui n'autorise pas la publication de données, vous ne pourrez pas procéder à la création de la source de données.
-
Si vous sélectionnez un environnement qui permet de publier des données à partir de n'importe quel schéma, vous aurez la possibilité d'utiliser les informations d'identification et les autres paramètres Amazon Redshift de l'environnement ou de saisir vos propres identifiants/paramètres.
-
-
Si vous choisissez d'utiliser vos propres informations d'identification pour créer la source de données, fournissez les informations suivantes :
-
Sous Fournir les informations d'identification Amazon Redshift, choisissez d'utiliser un cluster Amazon Redshift provisionné ou un espace de travail sans serveur Amazon Redshift comme source de données.
-
En fonction de votre sélection à l'étape ci-dessus, choisissez votre cluster ou espace de travail Amazon Redshift dans le menu déroulant, puis choisissez le secret à utiliser pour l'authentification dans AWS Secrets Manager. Vous pouvez choisir un secret existant ou en créer un nouveau.
-
Pour que le secret existant apparaisse dans le menu déroulant, assurez-vous que votre secret dans AWS Secrets Manager inclut les balises suivantes (clé/valeur) :
-
AmazonDataZoneProject: <projectID>
-
AmazonDataZoneDomain: <domainID>
Si vous choisissez de créer un nouveau secret, celui-ci est automatiquement étiqueté avec les balises référencées ci-dessus et aucune étape supplémentaire n'est nécessaire. Pour plus d'informations, consultez la section Stockage des informations d'identification de base de données dans AWS Secrets Manager.
Les utilisateurs d'Amazon Redshift dont le code AWS secret a été fourni pour créer la source de données doivent disposer d'
SELECT
autorisations sur les tables à publier. Si vous souhaitez qu'Amazon DataZone gère également les abonnements (accès) en votre nom, les utilisateurs de la base de données AWS secrète doivent également disposer des autorisations suivantes :-
CREATE DATASHARE
-
ALTER DATASHARE
-
DROP DATASHARE
-
-
-
Sous Sélection des données, fournissez une base de données Amazon Redshift, un schéma et entrez les critères de sélection de votre table ou de votre vue. Par exemple, si vous choisissez Inclure et entrez
*corporate
, la ressource inclura toutes les tables sources qui se terminent par le motcorporate
.Vous pouvez ajouter plusieurs règles d'inclusion pour les tables d'une même base de données. Vous pouvez également ajouter plusieurs bases de données à l'aide du bouton Ajouter une autre base de données.
-
Choisissez Suivant.
-
Pour les paramètres de publication, choisissez si les actifs sont immédiatement détectables dans le catalogue de données. Si vous les ajoutez uniquement à l'inventaire, vous pourrez choisir les conditions d'abonnement ultérieurement et les publier dans le catalogue de données commerciales.
-
Pour la génération automatique de noms commerciaux, choisissez si vous souhaitez générer automatiquement des métadonnées pour les actifs au fur et à mesure de leur publication et de leur mise à jour à partir de la source.
-
(Facultatif) Pour les formulaires de métadonnées, ajoutez des formulaires pour définir les métadonnées collectées et enregistrées lorsque les actifs sont importés dans Amazon DataZone. Pour de plus amples informations, veuillez consulter Création d'un formulaire de métadonnées dans Amazon DataZone.
-
Pour la préférence Exécuter, choisissez quand exécuter la source de données.
-
Exécuter selon un calendrier : spécifiez les dates et heures d'exécution de la source de données.
-
Exécuter à la demande : vous pouvez lancer manuellement des exécutions de sources de données.
-
-
Choisissez Suivant.
-
Vérifiez la configuration de votre source de données et choisissez Create.
Note
Lorsqu'une source de données Amazon Redshift est créée, Amazon DataZone accorde un accès en lecture seule à l'environnement utilisé pour créer la source de données afin d'accéder à toutes les tables des schémas Amazon Redshift utilisés dans la source de données. Vous pouvez suivre l'état de ces subventions dans les sources de données sur la page de détails de votre environnement.
Lorsque vous utilisez un cluster Amazon Redshift ou un groupe de travail sans serveur différent de celui utilisé pour créer l'environnement, vous devez vous assurer que la AWS balise suivante est ajoutée au cluster ou au groupe de travail. Cela est nécessaire pour que les utilisateurs de l'environnement puissent consulter la base de données autorisée dans Amazon Redshift Query Editor V2 : DataZoneDiscoverable_${domainId}: true
Pour les environnements créés avant la version actuelle d'Amazon DataZone, les membres du projet ne pourront pas voir les tables attribuées dans Amazon Redshift.