Generieren von Partitionsindizes - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Generieren von Partitionsindizes

Der Datenkatalog unterstützt die Erstellung von Partitionsindizes, um eine effiziente Suche nach bestimmten Partitionen zu ermöglichen. Weitere Informationen finden Sie unter Erstellen von Partitionsindizes. Der AWS Glue-Crawler unterstützt standardmäßig die Erstellung von Partitionsindizes für Amazon-S3- und Delta-Lake-Ziele.

AWS-Managementkonsole
  1. Melden Sie sich bei der AWS-Managementkonsole an und öffnen Sie die AWS Glue-Konsole unter https://console.aws.amazon.com/glue/.

  2. Wählen Sie im Datenkatalog die Option Crawler aus.

  3. Wenn Sie einen Crawler definieren, ist die Option zum automatischen Erstellen von Partitionsindizes standardmäßig unter Erweiterte Optionen auf der Seite Festlegen der Ausgabe und Zeitplanung aktiviert.

    Um diese Option zu deaktivieren, können Sie das Kontrollkästchen Partitionsindizes automatisch erstellen in der Konsole deaktivieren.

  4. Schließen Sie die Crawler-Konfiguration ab und wählen Sie Crawler erstellen aus.

AWS CLI

Sie können diese Option auch deaktivieren, indem Sie die AWS CLI verwenden und den CreatePartitionIndex im Parameter configuration festlegen. Der Standardwert ist "True".

aws glue update-crawler \ --name myCrawler \ --configuration '{"Version": 1.0, "CreatePartitionIndex": false }'

Nutzungshinweise für Partitionsindizes

  • Vom Crawler erstellte Tabellen verfügen standardmäßig nicht über die Variable partition_filtering.enabled. Weitere Informationen finden Sie unter AWS Glue-Partitionsindizierung und -filterung.

  • Das Erstellen von Partitionsindizes für verschlüsselte Partitionen wird nicht unterstützt.