

 Amazon Redshift unterstützt UDFs ab Patch 198 nicht mehr die Erstellung von neuem Python. Das bestehende Python UDFs wird bis zum 30. Juni 2026 weiterhin funktionieren. Weitere Informationen finden Sie im [Blog-Posting](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/). 

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Abfragen eines Data Lake
<a name="query-editor-v2-querying-data-lake"></a>

Sie können Daten in einem Amazon S3 Data Lake abfragen, indem Sie die Aufgaben in diesem Tutorial ausführen. Zuerst erstellen Sie ein externes Schema, um auf die externe Datenbank im [AWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/components-overview.html#data-catalog-intro) zu verweisen. Anschließend können Sie Daten im Amazon S3-Data Lake abfragen.

## Demo: Einen Data Lake abfragen
<a name="query-editor-v2-example-data-lake-demo"></a>

Weitere Informationen zum Abfragen eines Data Lake finden Sie im folgenden Video.

[![AWS Videos](http://img.youtube.com/vi/https://www.youtube.com/embed/-pyy0qNmEKo/0.jpg)](http://www.youtube.com/watch?v=https://www.youtube.com/embed/-pyy0qNmEKo)


## Voraussetzungen
<a name="query-editor-v2-querying-data-lake-prerequisites"></a>

Bevor Sie mit Ihrem Data Lake in Query Editor v2 arbeiten, vergewissern Sie sich, dass in Ihrer Amazon-Redshift-Umgebung Folgendes eingerichtet wurde:
+ Crawlen Sie Ihre Amazon S3 S3-Daten mithilfe AWS Glue und aktivieren Sie Ihren Datenkatalog für AWS Lake Formation.
+ Erstellen Sie eine IAM-Rolle für Amazon Redshift mithilfe des AWS Glue aktivierten Datenkatalogs für. AWS Lake Formation Einzelheiten zu diesem Verfahren finden Sie unter [So erstellen Sie eine IAM-Rolle für Amazon Redshift mit einem AWS Glue Data Catalog aktivierten](https://docs.aws.amazon.com/redshift/latest/dg/c-getting-started-using-spectrum-create-role.html#spectrum-get-stared-create-role-lake-formation) für. AWS Lake Formation Weitere Informationen zur Verwendung von Redshift Spectrum und Lake Formation finden Sie unter [Verwenden von Redshift Spectrum](https://docs.aws.amazon.com/redshift/latest/dg/spectrum-lake-formation.html) mit. AWS Lake Formation
+ Gewähren von SELECT-Berechtigungen für die Tabelle, um diese in der Lake-Formation-Datenbank abzufragen. Weitere Informationen zu diesem Verfahren finden Sie unter [So gewähren Sie SELECT-Berechtigungen für eine Tabelle, um diese in der Lake-Formation-Datenbank abzufragen](https://docs.aws.amazon.com/redshift/latest/dg/c-getting-started-using-spectrum-create-role.html#spectrum-get-started-grant-lake-formation-table).

  Sie können in der Lake Formation Formation-Konsole (https://console.aws.amazon.com/lakeformation/) im Bereich **Berechtigungen** auf der Seite **Data Lake-Berechtigungen** überprüfen, ob die IAM-Rolle, die AWS Glue Datenbank und die Tabellen über die richtigen Berechtigungen verfügen.
+ Bestätigung, dass Ihr verbundener Benutzer berechtigt ist, Schemata in der Amazon-Redshift-Datenbank zu erstellen und auf Daten in Ihrem Data Lake zuzugreifen. Wenn Sie in Query Editor v2 eine Verbindung zu einer Datenbank herstellen, wählen Sie eine Authentifizierungsmethode aus, die Anmeldeinformationen beinhaltet. Dabei kann es sich um einen Datenbankbenutzer oder einen IAM-Benutzer handeln. Der verbundene Benutzer muss über die richtigen Berechtigungen und Datenbankrechte verfügen, wie z. B. `superuser`. Der `admin`-Benutzer von Amazon Redshift, der den Cluster oder die Arbeitsgruppe erstellt hat, verfügt über `superuser`-Berechtigungen und kann Schemata erstellen und die Redshift-Datenbank verwalten. Weitere Informationen zum Herstellen einer Verbindung zu einer Datenbank mit Query Editor v2 finden Sie unter [Herstellen einer Verbindung mit einer Amazon-Redshift-Datenbank](query-editor-v2-connecting.md).

## Erstellen eines externen Schemas
<a name="query-editor-v2-create-external-schema"></a>

Um Daten in einem Amazon S3 Data Lake abzufragen, erstellen Sie zunächst ein externes Schema. Ein externes Schema verweist auf eine Datenbank in einem externen [AWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/components-overview.html#data-catalog-intro).

1. Wählen Sie in der **Editor**-Ansicht von Query Editor v2 die Option ![\[Create\]](http://docs.aws.amazon.com/de_de/redshift/latest/mgmt/images/qev2-add.png)**Erstellen** und dann **Schema** aus.

1. Geben Sie einen **Schema name** (Schemennamen) ein.

1. Wählen Sie unter **Schematyp** die Option **Extern** aus.

1. In den **Datenkatalogdetails** ist die **Region** standardmäßig der Ort, an AWS-Region dem sich Ihre Redshift-Datenbank befindet.

1. Wählen Sie die **AWS Glue Datenbank** aus, der das externe Schema zugeordnet werden soll und die Verweise auf die AWS Glue Tabellen enthält.

1. Wählen Sie eine **IAM-Rolle** für Amazon Redshift aus, die über die erforderlichen Berechtigungen zum Abfragen von Daten in Amazon S3 verfügt.

1. Wählen Sie optional eine **IAM-Rolle** aus, die über die Berechtigung für den Datenkatalog verfügt.

1. Wählen Sie **Create schema** (Schema erstellen) aus.

   Das Schema wird in der Strukturansicht unter Ihrer Datenbank angezeigt.

Wenn Sie beim Erstellen des Schemas die Fehlermeldung „Berechtigung verweigert“ für Ihre Datenbank erhalten, überprüfen Sie, ob der verbundene Benutzer über die Datenbankberechtigung zum Erstellen eines Schemas verfügt.

## Abfragen Ihrer Daten in Amazon S3-Data Lake
<a name="query-editor-v2-query-data-lake"></a>

Verwenden Sie das Schema, das Sie im vorherigen Verfahren erstellt haben. 

1. Wählen Sie in der Strukturansicht das Schema aus.

1. Um eine Tabellendefinition anzuzeigen, wählen Sie eine Tabelle aus. Die Tabellenspalten und Datentypen werden angezeigt.

1. Um eine Tabelle abzufragen, wählen Sie die Tabelle aus und wählen Sie im Kontextmenü (Rechtsklickmenü) **Tabelle auswählen** aus, um eine Abfrage zu generieren.

1. Führen Sie die Abfrage im **Editor** aus.

   Das folgende SQL-Beispiel wurde vom Abfrage-Editor v2 generiert, um alle Zeilen in der AWS Glue Tabelle mit dem Namen abzufragen`flightscsv`. In der Ausgabe sind die Spalten und Zeilen der Einfachheit halber verkürzt.

   ```
   SELECT * FROM "dev"."mydatalake_schema"."flightscsv";
                           
   year    quarter   month   dom  day_of_week   fl_date    unique_carrier  airline_id   carrier   tail_num   fl_num		
   2016    4         10      19   3             10/19/16   OO              20304        OO         N753SK    3086	 
   2016    4         10      19   3             10/19/16   OO              20304        OO         N753SK    3086	
   2016    4         10      19   3             10/19/16   OO              20304        OO         N778SK    3087		
   2016	4         10      19   3             10/19/16   OO              20304        OO         N778SK    3087	
   ...
   ```