Exécution de requêtes SQL - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exécution de requêtes SQL

Note

Vous ne pouvez exécuter des requêtes que si le membre chargé de payer les coûts de calcul des requêtes a rejoint la collaboration en tant que membre actif.

En tant que membre habilité à effectuer une requête, vous pouvez exécuter une requête SQL en :

  • Création manuelle d'une requête SQL à l'aide de l'éditeur de code SQL.

  • À l'aide d'un modèle d'analyse SQL approuvé.

  • Utilisation de l'interface utilisateur du générateur d'analyse pour créer une requête sans avoir à écrire de code SQL.

Lorsque le membre habilité à effectuer une requête exécute une requête SQL sur les tables de la collaboration, il AWS Clean Rooms assume les rôles appropriés pour accéder aux tables en son nom. AWS Clean Rooms applique les règles d'analyse nécessaires à la requête d'entrée et à sa sortie.

Les règles d'analyse et les contraintes de sortie sont appliquées automatiquement. AWS Clean Rooms renvoie uniquement les résultats conformes aux règles d'analyse définies.

AWS Clean Rooms prend en charge les requêtes SQL qui peuvent être différentes des autres moteurs de requêtes. Pour les spécifications, consultez la référence AWS Clean Rooms SQL. Si vous souhaitez exécuter des requêtes sur des tables de données protégées par une confidentialité différentielle, vous devez vous assurer que vos requêtes sont compatibles avec la structure de requête à usage général de AWS Clean Rooms Differential Privacy.

Note

Lorsque vous utilisez le calcul cryptographique pour Clean Rooms, toutes les opérations SQL ne génèrent pas de résultats valides. Par exemple, vous pouvez effectuer un COUNT sur une colonne cryptée, mais effectuer un SUM sur des numéros cryptés entraîne des erreurs. En outre, les requêtes peuvent également donner des résultats incorrects. Par exemple, les requêtes dont les colonnes sont SUM scellées produisent des erreurs. Cependant, une GROUP BY requête sur des colonnes scellées semble réussir mais produit des groupes différents de ceux produits par une GROUP BY requête sur du texte clair.

Le membre qui paie les coûts de calcul des requêtes est facturé pour les requêtes exécutées dans le cadre de la collaboration.

Le membre autorisé à effectuer une requête peut sélectionner plusieurs membres susceptibles de recevoir des résultats pour recevoir les résultats d'une seule requête. Pour de plus amples informations, veuillez consulter Interrogation de tables configurées à l'aide de l'éditeur de code SQL. Pour obtenir des informations générales sur la réception des résultats de requêtes, consultezRéception et utilisation des résultats d'analyse.

Prérequis

Avant d'exécuter une requête SQL, assurez-vous que vous disposez des éléments suivants :

  • Une adhésion active à la AWS Clean Rooms collaboration

  • Accès à au moins une table configurée dans la collaboration

  • Confirmation que le membre responsable des coûts de calcul des requêtes est un membre actif de la collaboration

Pour plus d'informations sur la façon d'interroger des données ou d'afficher des requêtes en appelant directement l'opération d' AWS Clean Rooms StartProtectedQuery API ou en utilisant le AWS SDKs, consultez la référence de l'AWS Clean Rooms API.

Pour plus d'informations sur la journalisation des requêtes, consultezConnexion à une analyse AWS Clean Rooms.

Note

Si vous exécutez une requête sur des tables de données chiffrées, les résultats des colonnes chiffrées sont chiffrés.

Configuration des propriétés Spark pour les requêtes SQL

AWS Clean Rooms vous permet de personnaliser éventuellement le comportement d'exécution de Spark en configurant les propriétés Spark prises en charge pour les requêtes SQL lors de l'utilisation du moteur d'analyse Spark. Cette fonctionnalité n'est disponible que pour les analyses utilisant le moteur d'analyse Spark dans AWS Clean Rooms, et non pour le moteur AWS Clean Rooms d'analyse. Ces propriétés vous permettent d'affiner les performances, l'utilisation de la mémoire et les paramètres d'exécution des requêtes. Grâce à cette fonctionnalité, vous avez un meilleur contrôle sur le traitement de vos requêtes basées sur Spark, ce qui permet une optimisation en fonction de vos exigences spécifiques en matière de charge de travail.

Vous pouvez désormais ajuster les paramètres tels que les partitions aléatoires, les seuils de jointure par diffusion et les paramètres d'exécution de requêtes adaptatifs directement depuis la AWS Clean Rooms console pour les analyses du moteur d'analyse Spark. Cette fonctionnalité est particulièrement utile pour les requêtes complexes ou les grands ensembles de données pour lesquels les configurations par défaut peuvent ne pas être optimales. En affinant ces propriétés de Spark, vous pouvez potentiellement améliorer les performances des requêtes, réduire la consommation de ressources et mieux gérer l'utilisation de la mémoire pour vos analyses de collaboration basées sur Spark.

Pour tirer parti de cette fonctionnalité, vous trouverez une nouvelle section sur les propriétés de Spark dans l'interface de requête pour les analyses du moteur d'analyse Spark. Vous pouvez effectuer une sélection dans la liste des propriétés prises en charge et spécifier des valeurs personnalisées. Vous pouvez également configurer les propriétés de Spark par programmation à l'aide de l'StartProtectedQuery API. Cette option de configuration avancée permet aux analystes de données et aux ingénieurs d'optimiser leurs analyses à l'aide du moteur d'analyse Spark pour une efficacité et une évolutivité accrues.

Pour plus d'informations sur les propriétés de Spark, y compris les valeurs par défaut, consultez la section Propriétés de Spark dans la documentation d'Apache Spark.

Les rubriques suivantes expliquent comment interroger des données dans le cadre d'une collaboration à l'aide de la AWS Clean Rooms console.