Prerequisiti per la generazione delle statistiche delle colonne
Per generare o aggiornare le statistiche delle colonne, l'attività di generazione delle statistiche assume un ruolo (IAM) AWS Identity and Access Management. In base alle autorizzazioni concesse al ruolo, l'attività di generazione delle statistiche delle colonne può leggere i dati dal datastore di Amazon S3.
Quando si configura l'attività di generazione delle statistiche delle colonne, AWS Glue consente di creare un ruolo che include la policy gestita AWSGlueServiceRole di AWS e la policy inline richiesta per l'origine dati specificata.
Se si specifica un ruolo esistente per la generazione di statistiche delle colonne, bisogna assicurarsi che includa la policy AWSGlueServiceRole o equivalente (o una versione ridotta di questa policy), oltre alle policy inline richieste. Per creare un nuovo ruolo IAM, attenersi alla seguente procedura:
Nota
Per generare statistiche per le tabelle gestite da Lake Formation, il ruolo IAM utilizzato per generare le statistiche richiede l'accesso completo alla tabella.
Quando si configura l'attività di generazione delle statistiche delle colonne, AWS Glue consente di creare un ruolo che include la policy gestita AWSGlueServiceRole AWS e la policy inline richiesta per l'origine dati specificata. È inoltre possibile creare un ruolo, allegare le autorizzazioni elencate nella policy riportata di seguito e aggiungere il ruolo all'attività di generazione delle statistiche delle colonne.
Per creare un ruolo IAM per la generazione delle statistiche delle colonne
-
Per creare un ruolo IAM, consulta l'argomento relativo alla creazione di ruoli IAM per AWS Glue.
-
Per aggiornare un ruolo esistente, nella console IAM, vai al ruolo IAM utilizzato dal processo di generazione delle statistiche delle colonne.
-
Nella sezione Autorizzazioni, scegli Collega policy. Nella finestra del browser appena aperta, scegli policy
AWSGlueServiceRoleAWS gestita. -
È necessario includere anche le autorizzazioni di lettura dei dati dalla posizione dei dati Amazon S3.
Nella sezione Autorizzazioni, scegli Aggiungi policy bucket. Nella finestra del browser appena aperta, crea una nuova policy da utilizzare con il tuo ruolo.
-
Nella pagina Crea policy seleziona la scheda JSON. Copia il codice seguente
JSONnel campo dell'editor di policy.Nota
Nelle seguenti policy, sostituire l'ID account con un Account AWS valido, sostituire
regioncon la Regione della tabella ebucket-namecon il nome del bucket Amazon S3. (Facoltativo) Se utilizzi le autorizzazioni di Lake Formation per fornire l'accesso ai tuoi dati, il ruolo IAM richiede le autorizzazioni
lakeformation:GetDataAccess.Se la posizione dei dati di Amazon S3 è registrata con Lake Formation e il ruolo IAM assunto dall'attività di generazione delle statistiche delle colonne non dispone delle autorizzazioni di gruppo
IAM_ALLOWED_PRINCIPALSconcesse sulla tabella, il ruolo richiede le autorizzazioniALTEReDESCRIBEdi Lake Formation sulla tabella. Il ruolo utilizzato per la registrazione del bucket Amazon S3 richiede le autorizzazioniINSERTeDELETEdi Lake Formation sulla tabella.Se la posizione dei dati di Amazon S3 non è registrata con Lake Formation e il ruolo IAM non dispone delle autorizzazioni di gruppo
IAM_ALLOWED_PRINCIPALSconcesse sulla tabella, il ruolo richiede le autorizzazioniALTER,DESCRIBE,INSERTeDELETEdi Lake Formation sulla tabella.-
Se è stata abilitata l'opzione
Automatic statistics generationa livello di catalogo, il ruolo IAM deve avere l'autorizzazioneglue:UpdateCatalogo l'autorizzazioneALTER CATALOGdi Lake Formation sul Catalogo dati predefinito. Puoi utilizzare l'operazioneGetCatalogper verificare le proprietà del catalogo. -
(Facoltativo) L'attività di generazione delle statistiche delle colonne che scrive Amazon CloudWatch Logs crittografati necessita delle autorizzazioni seguenti nella policy della chiave.
-
Il ruolo utilizzato per eseguire le statistiche delle colonne deve disporre dell'autorizzazione
iam:PassRolerelativa al ruolo. -
Quando crei un ruolo IAM per la generazione delle statistiche delle colonne, tale ruolo deve disporre anche della policy di attendibilità seguente che consente al servizio di assumere il ruolo.