Voraussetzungen für die Generierung von Spaltenstatistiken
Um Spaltenstatistiken zu erstellen oder zu aktualisieren, übernimmt die Statistikgenerierungsaufgabe in Ihrem Namen eine AWS Identity and Access Management (IAM)-Rolle. Basierend auf den der Rolle erteilten Berechtigungen kann die Aufgabe zur Generierung von Spaltenstatistiken die Daten aus dem Amazon-S3-Datenspeicher lesen.
Wenn Sie die Aufgabe zur Generierung von Spaltenstatistiken konfigurieren, lässt AWS Glue zu, dass Sie eine Rolle erstellen, welche die von AWS verwaltete Richtlinie AWSGlueServiceRole sowie die erforderliche Inline-Richtlinie für die angegebene Datenquelle enthält.
Wenn Sie eine vorhandene Rolle für das Generieren von Spaltenstatistiken angeben, stellen Sie sicher, dass dieser die AWSGlueServiceRole-Richtlinie oder eine gleichwertige Version dieser Richtlinie (oder eine reduzierte Version) sowie die erforderlichen Inline-Richtlinien enthält. Führen Sie diese Schritte aus, um eine neue IAM-Rolle zu erstellen:
Anmerkung
Um Statistiken für von Lake Formation verwaltete Tabellen zu generieren, benötigt die IAM-Rolle, die zum Generieren von Statistiken verwendet wird, vollständigen Tabellenzugriff.
Wenn Sie die Aufgabe zur Generierung von Spaltenstatistiken konfigurieren, lässt AWS Glue zu, dass Sie eine Rolle erstellen, welche die von AWS verwaltete Richtlinie AWSGlueServiceRole sowie die erforderliche Inline-Richtlinie für die angegebene Datenquelle enthält. Sie können auch eine Rolle erstellen, die in der folgenden Richtlinie aufgeführten Berechtigungen anhängen und diese Rolle der Aufgabe zur Generierung von Spaltenstatistiken hinzufügen.
So erstellen Sie eine IAM-Rolle für die Generierung von Spaltenstatistiken
-
Eine Anleitung zum Erstellen einer IAM;-Rolle finden Sie unter Erstellen von IAM-Rollen für AWS Glue.
-
Um eine bestehende Rolle zu aktualisieren, wechseln Sie in der IAM-Konsole zu der IAM-Rolle, die beim Generieren von Spaltenstatistiken verwendet wird.
-
Wählen Sie in der Registerkarte Berechtigungen hinzufügen die Option Richtlinien anfügen aus. Wählen Sie im neu geöffneten Browserfenster die Option „Von
AWSGlueServiceRoleAWS verwaltete Richtlinie“ aus. -
Sie müssen außerdem Berechtigungen zum Lesen von Daten am Amazon-S3-Speicherort hinzufügen.
Wählen Sie im Abschnitt Berechtigungen hinzufügen die Option Richtlinie erstellen aus. Erstellen Sie im neu geöffneten Browserfenster eine neue Richtlinie, die Sie mit Ihrer Rolle verwenden möchten.
-
Wählen Sie auf der Seite Richtlinie erstellen die Registerkarte JSON aus. Kopieren Sie den folgenden
JSON-Code in das Richtlinien-Editor-Feld.Anmerkung
Ersetzen Sie „Konto-ID“ in den folgenden Richtlinien durch ein gültiges AWS-Konto, ersetzen Sie
regiondurch die Region der Tabelle undbucket-namedurch den Namen des Amazon-S3-Buckets. (Optional) Wenn Sie Lake-Formation-Berechtigungen verwenden, um Zugriff auf Ihre Daten zu gewähren, sind für die IAM-Rolle
lakeformation:GetDataAccess-Berechtigungen erforderlich.Wenn der Amazon-S3-Speicherort bei Lake Formation registriert ist und für die IAM-Rolle, die von der Aufgabe zur Generierung von Spaltenstatistiken übernommen wurde, keine
IAM_ALLOWED_PRINCIPALS-Gruppenberechtigungen für die Tabelle erteilt wurden, benötigt die RolleALTER- undDESCRIBE-Berechtigungen in Lake Formation für die Tabelle. Die Rolle, die für die Registrierung des Amazon-S3-Buckets verwendet wird, erfordertINSERT- undDELETE-Berechtigungen in Lake Formation für die Tabelle.Wenn der Amazon-S3-Speicherort bei Lake Formation registriert ist und für die IAM-Rolle keine
IAM_ALLOWED_PRINCIPALS-Gruppenberechtigungen für die Tabelle erteilt wurden, benötigt die RolleALTER-,DESCRIBE-,INSERT- undDELETE-Berechtigungen in Lake Formation für die Tabelle.-
Wenn Sie die Option
Automatic statistics generationauf Katalogebene aktiviert haben, muss die IAM-Rolle über dieglue:UpdateCatalog-Berechtigung oder die Lake-Formation-BerechtigungALTER CATALOGfür den Standarddatenkatalog verfügen. Sie können denGetCatalog-Vorgang verwenden, um die Katalogeigenschaften zu überprüfen. -
(Optional) Für die Aufgabe zur Generierung von Spaltenstatistiken, die verschlüsselte Amazon CloudWatch Logs-Schreibvorgänge durchführt, sind die folgenden Berechtigungen in der Schlüsselrichtlinie erforderlich.
-
Die Rolle, die Sie zum Ausführen der Spaltenstatistiken verwenden, muss die
iam:PassRole-Berechtigung für die Rolle haben. -
Wenn Sie eine IAM-Rolle für die Generierung von Spaltenstatistiken erstellen, muss für diese Rolle auch die folgende Vertrauensrichtlinie gelten, damit der Service die Rolle übernehmen kann.