Création d'une table configuée — Source de données Amazon S3 - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'une table configuée — Source de données Amazon S3

Dans cette procédure, le membre effectue les tâches suivantes :

  • Configure une AWS Glue table existante à utiliser dans. AWS Clean Rooms(Cette étape peut être effectuée avant ou après avoir rejoint une collaboration, sauf si vous utilisez l'informatique cryptographique pourClean Rooms.)

    Note

    AWS Clean Rooms supporte AWS Glue les tables. Pour plus d'informations sur l'introduction de vos données AWS Glue, consultezÉtape 3 : Chargez votre tableau de données sur Amazon S3.

  • Nomme la table configurée et choisit les colonnes à utiliser dans la collaboration.

La procédure suivante part du principe que :

Vous pouvez utiliser la génération de statistiques fournie par AWS Glue pour calculer les statistiques au niveau des colonnes pour les tables. AWS Glue Data Catalog Après avoir AWS Glue généré des statistiques pour les tables du catalogue de données, Amazon Redshift Spectrum utilise automatiquement ces statistiques pour optimiser le plan de requête. Pour plus d'informations sur le calcul des statistiques au niveau des colonnes à l'aide de statistiques AWS Glue, consultez la section Optimisation des performances des requêtes à l'aide des statistiques des colonnes dans le Guide de l'AWS Glue utilisateur. Pour plus d'informations AWS Glue, consultez le manuel AWS Glue Developer Guide.

Pour créer une table configurée — Source de données Amazon S3
  1. Connectez-vous à la AWS Clean Rooms console AWS Management Console et ouvrez-la avec votre Compte AWS (si ce n'est pas encore fait).

  2. Dans le volet de navigation de gauche, choisissez Tables.

  3. Dans le coin supérieur droit, choisissez Configurer une nouvelle table.

  4. Pour Source de données, sous Sources de AWS données, choisissez Amazon S3.

  5. Dans le tableau Amazon S3 :

    1. Choisissez la base de données dans la liste déroulante.

    2. Choisissez la table que vous souhaitez configurer dans la liste déroulante.

    Note

    Pour vérifier que ce tableau est correct, effectuez l'une des opérations suivantes :

    • Choisissez Afficher dans AWS Glue.

    • Activez Afficher le schéma depuis AWS Glue pour afficher le schéma.

  6. Pour les colonnes et les méthodes d'analyse autorisées dans les collaborations,

    1. Pour quelles colonnes souhaitez-vous autoriser les collaborations ?

      • Choisissez Toutes les colonnes pour autoriser toutes les colonnes à être interrogées dans le cadre de la collaboration.

      • Choisissez Liste personnalisée pour autoriser une ou plusieurs colonnes de la liste déroulante Spécifier les colonnes autorisées à être interrogées dans la collaboration.

    2. Pour les méthodes d'analyse autorisées,

      1. Choisissez Requête directe pour autoriser les requêtes SQL à être exécutées directement sur cette table

      2. Choisissez Direct job pour autoriser les PySpark jobs à être exécutés directement sur ce tableau.

    Exemple exemple

    Par exemple, si vous souhaitez autoriser les membres de la collaboration à exécuter à la fois des requêtes SQL directes et des PySpark tâches sur toutes les colonnes, choisissez Toutes les colonnes, Requête directe et Tâche directe.

  7. Pour les détails de la table configurée,

    1. Entrez un nom pour la table configurée.

      Vous pouvez utiliser le nom par défaut ou renommer cette table.

    2. Entrez une description de la table.

      La description permet de différencier les autres tables configurées portant des noms similaires.

  8. Si vous souhaitez activer les balises pour la ressource de table configurée, choisissez Ajouter une nouvelle balise, puis entrez la paire clé/valeur.

  9. Choisissez Configurer une nouvelle table.

Maintenant que vous avez créé une table configurée, vous êtes prêt à :