Registra la tua connessione come Catalogo Dati Glue - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Registra la tua connessione come Catalogo Dati Glue

Dopo aver creato l'origine dati, è possibile utilizzare la console Athena per registrare la tua connessione come Catalogo Dati Glue. Una volta registrato, è possibile gestire il catalogo di dati federato e abilitare il controllo granulare degli accessi utilizzando Lake Formation. Per ulteriori informazioni, consultare Creazione di un catalogo federato.

È possibile registrare i seguenti connettori per integrarli per un controllo granulare degli accessi. AWS Glue

  • Redshift

  • BigQuery

  • DynamoDB (anteprima)

  • Snowflake (anteprima)

  • MySQL

  • PostgreSQL

  • AWSCMDB

  • Timestream

  • Archiviazione Azure Data Lake

  • Azure Synapse

  • IBM Db2

  • IBM Db2 AS/400 (Db2 iSeries)

  • DocumentDB

  • Google Cloud Storage

  • HBase

  • OpenSearch

  • Oracle

  • SAP HANA

  • SQL Server

  • TPC-DS

  • Cloudera Hive

  • Cloudwatch

  • Parametri Cloudwatch

  • Teradata

  • Vertica

Prerequisiti

Prima di iniziare, è necessario completare i seguenti prerequisiti.

  • Assicurati di disporre dei ruoli e delle autorizzazioni richieste per registrare le sedi. Per ulteriori informazioni, consulta i Requisiti per i ruoli nella Guida per gli AWS Lake Formation sviluppatori.

  • Assicurarsi di disporre dei ruoli richiesti in Lake Formation. Per ulteriori informazioni, consulta Prerequisiti per la connessione del Data Catalog a fonti di dati esterne nella Guida per gli AWS Lake Formation sviluppatori.

  • Il ruolo registrato in Glue deve disporre delle autorizzazioni elencate nell'esempio seguente.

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix/*", "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "arn:aws:lambda:us-east-1:111122223333:function:lambda_function_name" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:us-east-1:111122223333:connection/<connection_name>", "arn:aws:glue:us-east-1:111122223333:catalog" ] } ] }
  • L'utente è responsabile di determinare e gestire un accesso appropriato ai dati. Con controlli di accesso dettagliati sulle query federate, si consiglia di utilizzare la policy gestita. AmazonAthenaFullAccess Se si desidera utilizzare una policy personalizzata, assicurarsi che gli utenti che eseguono le query federate non abbiano accesso alle seguenti risorse.

    • lambda:InvokeFunction sul connettore Lambda specificato nella connessione Glue

    • Accesso alla posizione del bucket spill in IAM

    • Accesso alla connessione Glue associata al proprio catalogo federato

    • Il ruolo di Lake Formation in IAM

Registrare la propria connessione utilizzando la console

Per registrare la propria connessione come Catalogo Dati Glue
  1. Apri la console Athena all'indirizzo https://console.aws.amazon.com/athena/.

  2. Nel pannello di navigazione scegliere Origini dati e cataloghi.

  3. Dall'elenco Origini dati, scegliere l'origine dati creata per aprire la pagina Dettagli dell'origine dati.

  4. Scegli Inizia con. AWS Lake Formation

    Nota

    Dopo aver scelto questa opzione, bisogna gestire la funzione Lambda in proprio. Athena non eliminerà la funzione Lambda.

  5. Per Nome catalogo dati, fornire un nome univoco per il proprio catalogo.

  6. Scegliere il ruolo IAM di Lake Formation che concede il permesso a Lake Formation di invocare la funzione Lambda. Assicurarsi che il ruolo disponga delle autorizzazioni mostrate nell'esempio.

  7. Nella casella di testo, digitare conferma per eliminare l'origine dati Athena, sostituirla con una registrazione del catalogo dati Glue.

    Nota

    Questa azione eliminerà l’origine dati Athena e creerà un nuovo catalogo dati Glue al suo posto. Una volta completata questa procedura, potrebbe essere necessario aggiornare le query che accedono all'origine dati per fare invece riferimento al catalogo dati Glue appena creato.

  8. Scegliere Crea catalogo e vai a Lake Formation. Si apre la console Lake Formation in cui è possibile gestire il catalogo e concedere le autorizzazioni agli utenti su cataloghi, database e tabelle.