Création d'une table configurée — Source de données Amazon S3

Dans cette procédure, le membre effectue les tâches suivantes :

Configure une AWS Glue table existante à utiliser dans. AWS Clean Rooms(Cette étape peut être effectuée avant ou après avoir rejoint une collaboration, sauf si vous utilisez l'informatique cryptographique pourClean Rooms.)

Note
AWS Clean Rooms supporte AWS Glue les tables. Pour plus d'informations sur l'introduction de vos données AWS Glue, consultezÉtape 3 : Chargez votre tableau de données sur Amazon S3.
Nomme la table configurée et choisit les colonnes à utiliser dans la collaboration.

La procédure suivante suppose que :

Le membre de la collaboration a déjà chargé ses tables de données sur Amazon S3 et en a créé une AWS Glue.

Note
La destination des résultats dans Amazon S3 ne peut pas se trouver dans le même compartiment S3 que n'importe quelle source de données.
(Facultatif) Pour les tables de données chiffrées uniquement, le membre de la collaboration a déjà préparé des tables de données chiffrées à l'aide du client de chiffrement C3R.

Vous pouvez utiliser la génération de statistiques fournie par AWS Glue pour calculer les statistiques au niveau des colonnes pour les tables. AWS Glue Data Catalog Après avoir AWS Glue généré des statistiques pour les tables du catalogue de données, Amazon Redshift Spectrum utilise automatiquement ces statistiques pour optimiser le plan de requête. Pour plus d'informations sur le calcul des statistiques au niveau des colonnes à l'aide de statistiques AWS Glue, consultez la section Optimisation des performances des requêtes à l'aide des statistiques des colonnes dans le Guide de l'AWS Glue utilisateur. Pour plus d'informations AWS Glue, consultez le manuel AWS Glue Developer Guide.

Pour créer une table configurée — Source de données Amazon S3

Connectez-vous à la AWS Clean Rooms console AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/cleanrooms.
Dans le volet de navigation de gauche, choisissez Tables.
Dans le coin supérieur droit, choisissez Configurer une nouvelle table.
Pour Source de données, sous Sources de AWS données, choisissez Amazon S3.
Dans le tableau Amazon S3 :
1. Sélectionnez la région dans laquelle la table S3 est hébergée.
  
  Par défaut, la région actuelle (telle que North Virginia us-east-1) est sélectionnée.
  
  Avertissement
  Lorsque votre source de données Amazon S3 se trouve dans une région différente de celle de votre lieu de traitement, le traitement des données peut avoir lieu temporairement en dehors de la région source. Avant de poursuivre, vérifiez que le transfert de données entre régions est conforme à vos exigences en matière de souveraineté des données, à vos politiques de conformité réglementaire et à vos normes de gouvernance des données.
  
  Pour plus d'informations sur les régions, voir Régions et points de terminaison dans le Références générales AWS.
2. Choisissez la base de données dans la liste déroulante.
3. Choisissez la table que vous souhaitez configurer dans la liste déroulante.
Note
Pour vérifier que ce tableau est correct, effectuez l'une des opérations suivantes :
- Choisissez Afficher dans AWS Glue.
- Activez Afficher le schéma depuis AWS Glue pour afficher le schéma.
Important
Pour AWS Glue les tableaux dont les données sont au format CSV, les noms et l'ordre des colonnes dans le schéma Glue doivent correspondre exactement aux données CSV. S'ils ne sont pas alignés, la liste des colonnes autorisées pour la table configurée risque de ne pas être appliquée correctement.
Pour les colonnes et les méthodes d'analyse autorisées dans les collaborations,
1. Pour quelles colonnes souhaitez-vous autoriser les collaborations ?
  - Choisissez Toutes les colonnes pour autoriser toutes les colonnes à être interrogées dans le cadre de la collaboration.
  - Choisissez Liste personnalisée pour autoriser une ou plusieurs colonnes de la liste déroulante Spécifier les colonnes autorisées à être interrogées dans le cadre de la collaboration.
2. Pour les méthodes d'analyse autorisées,
  1. Choisissez Requête directe pour autoriser les requêtes SQL à être exécutées directement sur cette table
  2. Choisissez Tâche directe pour autoriser les PySpark tâches à être exécutées directement sur cette table.
Exemple Exemple
Par exemple, si vous souhaitez autoriser les membres de la collaboration à exécuter à la fois des requêtes SQL directes et des PySpark tâches sur toutes les colonnes, choisissez Toutes les colonnes, Requête directe et Tâche directe.
Pour les détails de la table configurée,
1. Entrez un nom pour la table configurée.
  
  Vous pouvez utiliser le nom par défaut ou renommer cette table.
2. Entrez une description de la table.
  
  La description permet de différencier les autres tables configurées portant des noms similaires.
Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.
Choisissez Configurer une nouvelle table.

Maintenant que vous avez créé une table configurée, vous êtes prêt à :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Création d'une table configurée

Source de données Amazon Athena

Création d'une table configurée — Source de données Amazon S3

Note

Note

Pour créer une table configurée — Source de données Amazon S3

Avertissement

Note

Important

Exemple Exemple