Utilizzare AWS Serverless Application Repository per distribuire un connettore origine dati - Amazon Athena

Utilizzare AWS Serverless Application Repository per distribuire un connettore origine dati

Per implementare un connettore origine dati è possibile utilizzare AWS Serverless Application Repository invece di utilizzare una connessione AWS Glue.

Nota

Si consiglia di utilizzare il SAR solo se si dispone di un connettore personalizzato o se si richiede l'uso di un connettore precedente. In caso contrario, si consiglia l'utilizzo della console Athena.

È possibile utilizzare il AWS Serverless Application Repository per trovare il connettore che si desidera usare, fornire i parametri richiesti dal connettore e quindi implementare il connettore nell'account. Quindi, dopo aver distribuito il connettore, utilizza la console Athena per rendere disponibile l'origine dati ad Athena.

Implementazione del connettore sull'account

Per utilizzare AWS Serverless Application Repository al fine di implementare un connettore origine dati nell'account
  1. Accedere a Console di gestione AWS e aprire Serverless App Repository (Repository app senza server).

  2. Nel pannello di navigazione, scegli Available applications (Applicazioni disponibili).

  3. Seleziona l'opzione Visualizzare le app che creano ruoli IAM personalizzati o policy delle risorse.

  4. Nella casella di ricerca digita il nome del connettore. Per un elenco dei connettori dati Athena predefiniti, consulta Connettori di origine dati disponibili.

  5. Scegliere il nome del connettore. In seguito a questa operazione, si apre la pagina della funzione Lambda Dettagli dell'applicazione nella console AWS Lambda.

  6. Sul lato destro della pagina dei dettagli, inserisci le informazioni richieste in Application settings (Impostazioni dell'applicazione). Le impostazioni minime richieste includono quanto segue. Per informazioni sulle opzioni configurabili rimanenti per i connettori dati creati da Athena, consulta l'argomento Available Connectors (Connettori disponibili) corrispondente su GitHub.

    • AthenaCatalogName: un nome in minuscolo per la funzione Lambda che indica l'origine dati a cui si rivolge, ad esempio cloudwatchlogs.

    • SpillBucket: specifica un bucket Amazon S3 nel tuo account per ricevere dati da payload della risposta di grandi dimensioni che superano i limiti delle dimensioni della risposta della funzione Lambda.

  7. Seleziona I acknowledge that this app creates custom IAM roles and resource policies (Sono consapevole che questa app crea ruoli IAM personalizzati e policy della risorsa). Per ulteriori informazioni, scegliere il link Info (Informazioni) .

  8. Nella parte inferiore destra della pagina Application settings (Impostazioni dell'applicazione), scegli Deploy (Implementa). Al termine dell'implementazione, la funzione Lambda viene visualizzata nella sezione Resources (Risorse) nella console Lambda.

Rendere disponibile il connettore in Athena

A questo punto, puoi usare la console Athena per rendere disponibile il connettore origine dati per Athena.

Per rendere disponibile il connettore origine dati per Athena
  1. Aprire la console Athena all'indirizzo https://console.aws.amazon.com/athena/.

  2. Se il pannello di navigazione della console non è visibile, scegli il menu di espansione a sinistra.

    Scegli il menu di espansione.
  3. Nel pannello di navigazione scegliere Origini dati e cataloghi.

  4. Nella pagina Origini dati e cataloghi, scegliere Crea origine dati.

  5. In Choose a data source (Scegli un'origine dati), scegli l'origine dati per la quale è stato creato un connettore in AWS Serverless Application Repository. Questo tutorial utilizza Amazon CloudWatch Logs come origine dati federata.

  6. Scegli Next (Successivo).

  7. Nella pagina Enter data source details (Inserisci i dettagli dell'origine dati), per Data source name (Nome origine dati), inserisci il nome che desideri utilizzare nelle istruzioni SQL quando esegui una query sull'origine dati da Athena (ad esempio, CloudWatchLogs). Il nome può contenere fino a 127 caratteri e deve essere univoco all'interno dell'account. Non può essere modificato dopo la creazione. I caratteri validi sono a-z, A-z, 0-9, _ (trattino basso), @ (chiocciola) e - (trattino). I nomi awsdatacatalog, hive, jmx e system sono riservati ad Athena e non possono essere utilizzati per i nomi delle origini dati.

  8. Nella sezione Connection details (Dettagli di connessione), usa la casella Select or enter a Lambda function (Seleziona o inserisci una funzione Lambda) per scegliere il nome della funzione appena creata. Viene visualizzato l'ARN della funzione Lambda.

  9. (Facoltativo) Per Tags (Tag), aggiungi coppie chiave-valore da associare a questa origine dati. Per ulteriori informazioni sui tag, consulta Assegnare tag alle risorse di Athena.

  10. Scegli Next (Successivo).

  11. Nella pagina Review and create (Rivedi e crea), esamina i dettagli dell'origine dati, quindi scegli Create data source (Crea origine dati).

  12. La sezione Data source details (Dettagli sull'origine dati) della pagina dell'origine dati mostra le informazioni relative al nuovo connettore. È ora possibile utilizzare il connettore nelle query Athena.

    Per informazioni sull'utilizzo di connettori dati nelle query, consulta Eseguire query federate.