

 Amazon Redshift ne prendra plus en charge la création de nouveaux Python à UDFs partir du patch 198. UDFs Le Python existant continuera de fonctionner jusqu'au 30 juin 2026. Pour plus d’informations, consultez le [ billet de blog ](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/). 

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Interrogation d'un lac de données
<a name="query-editor-v2-querying-data-lake"></a>

Vous pouvez interroger des données dans un lac de données Amazon S3 en suivant l’ensemble des tâches décrites dans ce didacticiel. Tout d'abord, vous créez un schéma externe pour référencer la base de données externe dans le [AWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/components-overview.html#data-catalog-intro). Vous pouvez ensuite interroger des données dans le lac de données Amazon S3.

## Démo : interroger un lac de données
<a name="query-editor-v2-example-data-lake-demo"></a>

Pour savoir comment interroger un lac de données, regardez la vidéo suivante.

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/-pyy0qNmEKo/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/-pyy0qNmEKo)


## Conditions préalables
<a name="query-editor-v2-querying-data-lake-prerequisites"></a>

Avant d'utiliser votre lac de données dans l'éditeur de requête v2, confirmez que les éléments suivants ont été configurés dans votre environnement Amazon Redshift :
+ Explorez vos données Amazon S3 en utilisant AWS Glue et activez votre catalogue de données pour AWS Lake Formation.
+ Créez un rôle IAM pour Amazon Redshift à l'aide AWS Glue du catalogue de données activé pour. AWS Lake Formation Pour plus de détails sur cette procédure, consultez [Pour créer un rôle IAM pour Amazon Redshift à l'aide AWS Glue Data Catalog d'un](https://docs.aws.amazon.com/redshift/latest/dg/c-getting-started-using-spectrum-create-role.html#spectrum-get-stared-create-role-lake-formation) pour activé pour. AWS Lake Formation Pour plus d'informations sur l'utilisation de Redshift Spectrum et de Lake Formation, consultez la section Utilisation de [Redshift](https://docs.aws.amazon.com/redshift/latest/dg/spectrum-lake-formation.html) Spectrum avec. AWS Lake Formation
+ Vous accordez des autorisations SELECT sur la table à interroger dans la base de données Lake Formation. Pour plus de détails sur cette procédure, consultez [Pour accorder les autorisations SELECT sur la table à interroger dans la base de données Lake Formation](https://docs.aws.amazon.com/redshift/latest/dg/c-getting-started-using-spectrum-create-role.html#spectrum-get-started-grant-lake-formation-table).

  Vous pouvez vérifier dans la console Lake Formation (https://console.aws.amazon.com/lakeformation/), section **Permissions**, page des **autorisations du Data Lake**, que le rôle IAM, la AWS Glue base de données et les tables disposent des autorisations appropriées.
+ Confirmez que votre utilisateur connecté dispose des autorisations nécessaires pour créer des schémas dans la base de données Amazon Redshift et accéder aux données de votre lac de données. Lorsque vous vous connectez à une base de données dans l'éditeur de requête v2, vous choisissez une méthode d'authentification qui inclut des informations d'identification, qui peuvent être un utilisateur de la base de données ou un utilisateur IAM. L'utilisateur connecté doit disposer des autorisations et des privilèges de base de données appropriés, tels qu'un `superuser`. L'utilisateur `admin` Amazon Redshift qui a créé le cluster ou le groupe de travail dispose de privilèges de `superuser` et peut créer des schémas et gérer la base de données Redshift. Pour plus d'informations sur la connexion à une base de données avec l'éditeur de requête v2, consultez [Connexion à une base de données Amazon Redshift](query-editor-v2-connecting.md).

## Création d'un schéma externe
<a name="query-editor-v2-create-external-schema"></a>

Pour interroger les données d'un lac de données Amazon S3, commencez par créer un schéma externe. Le schéma externe référence la base de données externe dans le [AWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/components-overview.html#data-catalog-intro).

1. Dans la vue **Éditeur** de l'éditeur de requête v2, choisissez ![\[Create\]](http://docs.aws.amazon.com/fr_fr/redshift/latest/mgmt/images/qev2-add.png)**Créer**, puis **Schéma**.

1. Saisissez un **nom de schéma**.

1. Pour le **Type de schéma**, choisissez **Externe**.

1. Dans les détails du **catalogue de données**, la **région** correspond par défaut à l' Région AWS emplacement de votre base de données Redshift.

1. Choisissez la **AWS Glue base de données** à laquelle le schéma externe sera mappé et qui contient des références aux AWS Glue tables.

1. Choisissez un **rôle IAM** pour Amazon Redshift qui dispose des autorisations requises pour interroger des données sur Amazon S3.

1. Vous pouvez éventuellement choisir un **rôle IAM** autorisé à accéder au catalogue de données.

1. Choisissez **Create schema (Créer un schéma)**.

   Le schéma apparaît sous votre base de données dans l'arborescence.

Lors de la création du schéma, si vous recevez une erreur d'autorisation refusée pour votre base de données, vérifiez si l'utilisateur connecté a le privilège de base de données pour créer un schéma.

## Interrogation des données dans votre lac de données Amazon S3
<a name="query-editor-v2-query-data-lake"></a>

Vous utilisez le schéma que vous avez créé dans la procédure précédente. 

1. Dans le panneau de l'arborescence, sélectionnez le schéma.

1. Pour afficher une définition de tableau, choisissez un tableau. Les colonnes du tableau et les types de données s’affichent.

1. Pour interroger une table, sélectionnez la table et, dans le menu contextuel (clic droit), choisissez **Sélectionner une table** pour générer une requête.

1. Exécutez la requête dans l'**éditeur**.

   L'exemple de code SQL suivant a été généré par l'éditeur de requêtes v2 pour interroger toutes les lignes de la AWS Glue table nommée`flightscsv`. Les colonnes et les lignes affichées dans le résultat sont tronquées par souci de simplicité.

   ```
   SELECT * FROM "dev"."mydatalake_schema"."flightscsv";
                           
   year    quarter   month   dom  day_of_week   fl_date    unique_carrier  airline_id   carrier   tail_num   fl_num		
   2016    4         10      19   3             10/19/16   OO              20304        OO         N753SK    3086	 
   2016    4         10      19   3             10/19/16   OO              20304        OO         N753SK    3086	
   2016    4         10      19   3             10/19/16   OO              20304        OO         N778SK    3087		
   2016	4         10      19   3             10/19/16   OO              20304        OO         N778SK    3087	
   ...
   ```