Integrieren Sie Amazon EMR mit AWS Lake Formation - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Integrieren Sie Amazon EMR mit AWS Lake Formation

AWS Lake Formation ist ein verwalteter Service, der Sie dabei unterstützt, Daten in einem Amazon Simple Storage Service (S3) Data Lake zu entdecken, zu katalogisieren, zu bereinigen und zu sichern. Lake Formation bietet einen detaillierten Zugriff auf Spaltenebene auf Datenbanken und Tabellen im Glue-Datenkatalog. AWS Weitere Informationen finden Sie unter Was ist AWS Lake Formation?

Mit Amazon-EMR-Version 6.7.0 und höher können Sie die auf Lake Formation basierende Zugriffskontrolle auf Spark-, Hive- und Presto-Jobs anwenden, die Sie an Amazon-EMR-Cluster senden. Für die Integration mit Lake Formation müssen Sie einen EMR-Cluster mit einer Laufzeit-Rolle erstellen. Eine Laufzeit-Rolle ist eine AWS Identity and Access Management (IAM)-Rolle, der Sie Amazon-EMR-Aufträge oder Abfragen zuordnen. Amazon EMR verwendet diese Rolle dann für den Zugriff auf AWS Ressourcen. Weitere Informationen finden Sie unter Schritte für Laufzeit-Rollen für Amazon EMR.

Wie Amazon EMR mit Lake Formation funktioniert

Nachdem Sie Amazon EMR mit Lake Formation integriert haben, können Sie Abfragen an Amazon EMR-Cluster mit der StepAPI oder mit SageMaker AI Studio ausführen. Anschließend bietet Lake Formation über temporäre Anmeldeinformationen für Amazon EMR Zugriff auf Daten. Dieser Prozess wird als Anmeldeinformationsvergabe bezeichnet. Weitere Informationen finden Sie unter Was ist AWS Lake Formation?

Nachfolgend finden Sie einen allgemeinen Überblick darüber, wie Amazon EMR Zugriff auf Daten erhält, die durch Sicherheitsrichtlinien von Lake Formation geschützt sind.

So greift Amazon EMR auf Daten zu, die durch Sicherheitsrichtlinien von Lake Formation geschützt sind
  1. Ein Benutzer sendet eine Amazon-EMR-Abfrage für Daten in Lake Formation.

  2. Amazon EMR fordert temporäre Anmeldeinformationen von Lake Formation an, um den Benutzerdaten Zugriff zu gewähren.

  3. Lake Formation gibt temporäre Anmeldeinformationen zurück.

  4. Amazon EMR sendet die Abfrageanfrage zum Abrufen von Daten aus Amazon S3.

  5. Amazon EMR empfängt die Daten von Amazon S3, filtert sie und gibt Ergebnisse zurück, die auf den Benutzerberechtigungen basieren, die der Benutzer in Lake Formation definiert hat.

Weitere Informationen zum Hinzufügen von Benutzern und Gruppen zu Lake Formation-Richtlinien finden Sie unter Erteilen von Datenkatalogberechtigungen.

Voraussetzungen

Sie müssen die folgenden Anforderungen erfüllen, bevor Sie Amazon EMR und Lake Formation integrieren können:

  • Aktivieren Sie die Laufzeit-Rollenautorisierung in Ihrem Amazon-EMR-Cluster.

  • Verwenden Sie den AWS Glue-Datenkatalog als Ihren Metadatenspeicher.

  • Definieren und verwalten Sie in Lake Formation Berechtigungen für den Zugriff auf Datenbanken, Tabellen und Spalten im AWS Glue Data Catalog. Weitere Informationen finden Sie unter Was ist AWS Lake Formation?