Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création d'une table configuée — Source de données Amazon S3
Dans cette procédure, le membre effectue les tâches suivantes :
-
Configure une AWS Glue table existante à utiliser dans. AWS Clean Rooms(Cette étape peut être effectuée avant ou après avoir rejoint une collaboration, sauf si vous utilisez l'informatique cryptographique pourClean Rooms.)
Note
AWS Clean Rooms supporte AWS Glue les tables. Pour plus d'informations sur l'introduction de vos données AWS Glue, consultezÉtape 3 : Chargez votre tableau de données sur Amazon S3.
-
Nomme la table configurée et choisit les colonnes à utiliser dans la collaboration.
La procédure suivante part du principe que :
-
Le membre de la collaboration a déjà chargé ses tables de données sur Amazon S3 et en a créé une AWS Glue.
Note
Si vous utilisez le moteur d'analyse Spark, la destination des résultats dans Amazon S3 ne peut pas se trouver dans le même compartiment S3 que n'importe quelle source de données.
-
(Facultatif) Pour les tables de données chiffrées uniquement, le membre de la collaboration a déjà préparé des tables de données chiffrées à l'aide du client de chiffrement C3R.
Vous pouvez utiliser la génération de statistiques fournie par AWS Glue pour calculer les statistiques au niveau des colonnes pour les tables. AWS Glue Data Catalog Après avoir AWS Glue généré des statistiques pour les tables du catalogue de données, Amazon Redshift Spectrum utilise automatiquement ces statistiques pour optimiser le plan de requête. Pour plus d'informations sur le calcul des statistiques au niveau des colonnes à l'aide de statistiques AWS Glue, consultez la section Optimisation des performances des requêtes à l'aide des statistiques des colonnes dans le Guide de l'AWS Glue utilisateur. Pour plus d'informations AWS Glue, consultez le manuel AWS Glue Developer Guide.
Pour créer une table configurée — Source de données Amazon S3
-
Connectez-vous à la AWS Clean Rooms console AWS Management Console et ouvrez-la
avec votre Compte AWS (si ce n'est pas encore fait). -
Dans le volet de navigation de gauche, choisissez Tables.
-
Dans le coin supérieur droit, choisissez Configurer une nouvelle table.
-
Pour Source de données, sous Sources de AWS données, choisissez Amazon S3.
-
Dans le tableau Amazon S3 :
-
Choisissez la base de données dans la liste déroulante.
-
Choisissez la table que vous souhaitez configurer dans la liste déroulante.
Note
Pour vérifier que ce tableau est correct, effectuez l'une des opérations suivantes :
-
Choisissez Afficher dans AWS Glue.
-
Activez Afficher le schéma depuis AWS Glue pour afficher le schéma.
-
-
Pour les colonnes et les méthodes d'analyse autorisées dans les collaborations,
-
Pour quelles colonnes souhaitez-vous autoriser les collaborations ?
-
Choisissez Toutes les colonnes pour autoriser toutes les colonnes à être interrogées dans le cadre de la collaboration.
-
Choisissez Liste personnalisée pour autoriser une ou plusieurs colonnes de la liste déroulante Spécifier les colonnes autorisées à être interrogées dans la collaboration.
-
-
Pour les méthodes d'analyse autorisées,
-
Choisissez Requête directe pour autoriser les requêtes SQL à être exécutées directement sur cette table
-
Choisissez Direct job pour autoriser les PySpark jobs à être exécutés directement sur ce tableau.
-
Exemple exemple
Par exemple, si vous souhaitez autoriser les membres de la collaboration à exécuter à la fois des requêtes SQL directes et des PySpark tâches sur toutes les colonnes, choisissez Toutes les colonnes, Requête directe et Tâche directe.
-
-
Pour les détails de la table configurée,
-
Entrez un nom pour la table configurée.
Vous pouvez utiliser le nom par défaut ou renommer cette table.
-
Entrez une description de la table.
La description permet de différencier les autres tables configurées portant des noms similaires.
-
-
Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.
-
Choisissez Configurer une nouvelle table.
Maintenant que vous avez créé une table configurée, vous êtes prêt à :