View a markdown version of this page

Connettore Amazon Athena CMDB AWS - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connettore Amazon Athena CMDB AWS

Il connettore Amazon Athena AWS CMDB consente ad Athena di comunicare con vari AWS servizi in modo da poterli interrogare con SQL.

Questo connettore può essere registrato con Catalogo Dati Glue come catalogo federato. Supporta i controlli di accesso ai dati definiti in Lake Formation a livello di catalogo, database, tabella, colonna, riga e tag. Questo connettore utilizza connessioni Glue per centralizzare le proprietà di configurazione in Glue.

Prerequisiti

Parameters

Utilizza i parametri in questa sezione per configurare il AWS connettore CMDB.

Si consiglia di configurare un connettore AWS CMDB utilizzando un oggetto Glue connections. Per fare ciò, imposta la variabile di glue_connection ambiente del connettore AWS CMDB Lambda sul nome della connessione Glue da utilizzare.

Proprietà delle connessioni Glue

Utilizzare il seguente comando per ottenere lo schema di un oggetto di connessione Glue. Questo schema contiene tutti i parametri che è possibile usare per controllare la connessione.

aws glue describe-connection-type --connection-type CMDB

Proprietà dell’ambiente Lambda

Le seguenti proprietà dell'ambiente Lambda si applicano solo quando si utilizza il connettore con una funzione Lambda nel proprio account.

glue_connection: specifica il nome della connessione Glue associata al connettore federato.

Nota
  • Tutti i connettori che utilizzano una connessione AWS Glue Data Catalog federata devono Gestione dei segreti AWS memorizzare le credenziali.

  • Il connettore AWS CMDB creato utilizzando una connessione AWS Glue Data Catalog federata non supporta l'uso di un gestore di multiplazione.

  • Il connettore AWS CMDB creato utilizzando una connessione federata supporta solo 2. AWS Glue Data Catalog ConnectionSchemaVersion

Nota

I connettori di origine dati Athena creati il 3 dicembre 2024 e versioni successive utilizzano connessioni. AWS Glue

I nomi e le definizioni dei parametri elencati di seguito si riferiscono ai connettori di origine dati Athena creati senza una connessione Glue associata. Utilizza i seguenti parametri solo quando implementi manualmente una versione precedente di un connettore di origine dati Athena o quando la proprietà dell’ambiente glue_connection non è specificata.

Proprietà dell’ambiente

  • spill_bucket: specifica il bucket Amazon S3 per i dati che superano i limiti della funzione Lambda.

  • spill_prefix: (facoltativo) per impostazione predefinita, viene utilizzata una sottocartella nello spill_bucket specificato chiamata athena-federation-spill. Ti consigliamo di configurare un ciclo di vita dell'archiviazione di Amazon S3 in questa posizione per eliminare gli spill più vecchi di un numero predeterminato di giorni o ore.

  • spill_put_request_headers: (facoltativo) una mappa codificata in JSON delle intestazioni e dei valori della richiesta per la richiesta putObject di Amazon S3 utilizzata per lo spill (ad esempio, {"x-amz-server-side-encryption" : "AES256"}). Per altre possibili intestazioni, consulta il riferimento PutObjectall'API di Amazon Simple Storage Service.

  • kms_key_id: (facoltativo) per impostazione predefinita, tutti i dati riversati in Amazon S3 vengono crittografati utilizzando la modalità di crittografia autenticata AES-GCM e una chiave generata casualmente. Per fare in modo che la tua funzione Lambda utilizzi chiavi di crittografia più potenti generate da KMS come a7e63k4b-8loc-40db-a2a1-4d0en2cd8331, puoi specificare l'ID della chiave KMS.

  • disable_spill_encryption: (facoltativo) se impostato su True, disabilita la crittografia dello spill. L'impostazione predefinita è False: in questo modo, i dati riversati su S3 vengono crittografati utilizzando AES-GCM tramite una chiave generata casualmente o una chiave generata mediante KMS. La disabilitazione della crittografia dello spill può migliorare le prestazioni, soprattutto se la posizione dello spill utilizza la crittografia lato server.

  • default_ec2_image_owner: (facoltativo) una volta impostato, controlla il proprietario predefinito dell'immagine Amazon EC2 che filtra le Amazon Machine Image (AMI). Se non imposti questo valore e la tua query sulla tabella delle immagini EC2 non include un filtro per il proprietario, i risultati includeranno tutte le immagini pubbliche.

Database e tabelle

Il connettore Athena AWS CMDB rende disponibili i seguenti database e tabelle per interrogare l'inventario delle risorse. AWS Per ulteriori informazioni sulle colonne disponibili in ogni tabella, esegui un'istruzione DESCRIBE database.table utilizzando la console o l'API Athena.

  • ec2: questo database contiene risorse correlate ad Amazon EC2, tra cui le seguenti.

  • ebs_volumes: contiene i dettagli dei tuoi volumi Amazon EBS.

  • ec2_instances: contiene i dettagli delle tue istanze EC2.

  • ec2_images: contiene i dettagli delle immagini delle tue istanze EC2.

  • routing_tables: contiene i dettagli delle tue tabelle di instradamento del VPC.

  • security_groups: contiene i dettagli dei tuoi gruppi di sicurezza.

  • subnets: contiene i dettagli delle tue sottoreti VPC.

  • vpcs: contiene i dettagli del tuo. VPCs

  • emr: questo database contiene risorse correlate ad Amazon EMR, tra cui le seguenti.

  • emr_clusters: contiene i dettagli dei tuoi cluster EMR.

  • rds: questo database contiene risorse correlate ad Amazon RDS, tra cui le seguenti.

  • rds_instances: contiene i dettagli delle tue istanze RDS.

  • s3: questo database contiene risorse correlate a RDS, tra cui le seguenti.

  • bucket: contiene i dettagli dei tuoi bucket Amazon S3.

  • objects: contiene i dettagli dei tuoi oggetti Amazon S3, escluso il loro contenuto.

Autorizzazioni richieste

Per tutti i dettagli sulle politiche IAM richieste da questo connettore, consulta la Policies sezione del athena-aws-cmdbfile.yaml. L'elenco che segue riporta un riepilogo delle autorizzazioni richieste.

  • Accesso in scrittura ad Amazon S3: per trasferire i risultati di query di grandi dimensioni, il connettore richiede l'accesso in scrittura a una posizione in Amazon S3.

  • Athena GetQueryExecution: il connettore utilizza questa autorizzazione per fallire rapidamente quando la query Athena upstream è terminata.

  • S3 List: il connettore utilizza questa autorizzazione per elencare bucket e oggetti di Amazon S3.

  • EC2 Descrivi: il connettore utilizza questa autorizzazione per descrivere risorse come le istanze Amazon EC2, i gruppi di sicurezza e i volumi Amazon VPCs EBS.

  • EMR Describe / List: il connettore utilizza questa autorizzazione per descrivere i cluster EMR.

  • RDS Describe: il connettore utilizza questa autorizzazione per descrivere le istanze RDS.

Performance

Attualmente, il connettore Athena AWS CMDB non supporta le scansioni parallele. Il pushdown dei predicati viene eseguito all'interno della funzione Lambda. Ove possibile, i predicati parziali vengono inviati ai servizi interrogati. Ad esempio, una query per i dettagli di una specifica istanza Amazon EC2 chiama l'API EC2 con l'ID di istanza specifico per eseguire un'operazione descrittiva mirata.

Informazioni sulla licenza

Il progetto del connettore Amazon Athena AWS CMDB è concesso in licenza con licenza Apache-2.0.

Risorse aggiuntive

Per ulteriori informazioni su questo connettore, visita il sito corrispondente su .com. GitHub