Amazon Athena AWS CMDB Konnektor
Der AWS-CMDB-Konnektor von Amazon Athena ermöglicht es Amazon Athena, mit verschiedenen AWS-Services zu kommunizieren, sodass Sie diese mit SQL abfragen können.
Dieser Connector kann bei Glue-Datenkatalog als Verbundkatalog registriert werden. Er unterstützt in Lake Formation definierte Datenzugriffskontrollen auf Katalog-, Datenbank-, Tabellen-, Spalten-, Zeilen- und Tagebene. Dieser Konnektor verwendet Glue Connections, um die Konfigurationseigenschaften in Glue zu zentralisieren.
Voraussetzungen
Stellen Sie den Konnektor für Ihr AWS-Konto mithilfe der Athena-Konsole oder AWS Serverless Application Repository bereit. Weitere Informationen finden Sie unter Eine Datenquellenverbindung erstellen oder Verwenden Sie AWS Serverless Application Repository, um einen Datenquellen-Konnektor bereitzustellen.
Parameter
Verwenden Sie die Parameter in diesem Abschnitt, um den AWS-CMDB-Konnektor zu konfigurieren.
Wir empfehlen, dass Sie einen AWS CMDB-Connector mithilfe eines Glue-Connections-Objekts konfigurieren. Setzen Sie dazu die glue_connection Umgebungsvariable des AWS CMDB-Konnektors Lambda auf den Namen der zu verwendenden Glue-Connection.
Eigenschaften von Glue Connections
Verwenden Sie den folgenden Befehl, um das Schema für ein Glue-Connection-Objekt zu erhalten. Dieses Schema enthält alle Parameter, mit denen Sie Ihre Verbindung steuern können.
aws glue describe-connection-type --connection-type CMDB
Lambda-Umgebungseigenschaften
glue_connection – Gibt den Namen der Glue-Connection an, die dem Verbund-Connector zugeordnet ist.
Anmerkung
-
Alle Konnektoren, die Glue Connections verwenden, müssen AWS Secrets Manager zum Speichern von Anmeldeinformationen verwenden.
-
Der mit Glue-Connection erstellte AWS CMDB-Connector unterstützt die Verwendung eines Multiplexing-Handlers nicht.
-
Der mit Glue-Connection erstellte AWS CMDB-Connector unterstützt nur
ConnectionSchemaVersion2.
Anmerkung
Athena-Datenquellenkonnektoren, die am 3. Dezember 2024 und später erstellt wurden, verwenden AWS Glue-Verbindungen.
Die unten aufgeführten Parameternamen und Definitionen beziehen sich auf Athena-Datenquellenkonnektoren, die ohne eine zugehörige Glue-Connection erstellt wurden. Verwenden Sie die folgenden Parameter nur, wenn Sie eine frühere Version eines Athena-Datenquellenkonnektors manuell bereitstellen oder wenn die glue_connection-Umgebungseigenschaft nicht angegeben ist.
Lambda-Umgebungseigenschaften
-
spill_bucket – Gibt den Amazon S3-Bucket für Daten an, die die Lambda-Funktionsgrenzen überschreiten.
-
spill_prefix – (Optional) Ist standardmäßig ein Unterordner im angegebenen
spill_bucketgenanntathena-federation-spill. Wir empfehlen Ihnen, einen Amazon-S3-Speicher-Lebenszyklus an dieser Stelle zu konfigurieren, um die Überlaufe zu löschen, die älter als eine festgelegte Anzahl von Tagen oder Stunden sind. -
spill_put_request_headers – (Optional) Eine JSON-codierte Zuordnung von Anforderungsheadern und Werten für die Amazon-S3-
putObject-Anforderung, die für den Überlauf verwendet wird (z. B.{"x-amz-server-side-encryption" : "AES256"}). Andere mögliche Header finden Sie unter PutObject in der API-Referenz zu Amazon Simple Storage Service. -
kms_key_id – (Optional) Standardmäßig werden alle Daten, die an Amazon S3 gesendet werden, mit dem AES-GCM-authentifizierten Verschlüsselungsmodus und einem zufällig generierten Schlüssel verschlüsselt. Damit Ihre Lambda-Funktion stärkere Verschlüsselungsschlüssel verwendet, die von KMS generiert werden, wie
a7e63k4b-8loc-40db-a2a1-4d0en2cd8331, können Sie eine ID einer Verschlüsselung angeben. -
disable_spill_encryption – (Optional) Bei Einstellung auf
True, wird die Spill-Verschlüsselung deaktiviert. Die Standardeinstellung istFalse, sodass Daten, die an S3 übertrragen werden, mit AES-GCM verschlüsselt werden - entweder mit einem zufällig generierten Schlüssel oder mit KMS zum Generieren von Schlüsseln. Das Deaktivieren der Überlauf-Verschlüsselung kann die Leistung verbessern, insbesondere wenn Ihr Überlauf-Standort eine serverseitige Verschlüsselung verwendet. -
default_ec2_image_owner – (Optional) Wenn festgelegt, steuert es den standardmäßigen Amazon EC2-Image-Eigentümer, der Amazon Machine Images (AMI) filtert. Wenn Sie diesen Wert nicht festlegen und Ihre Abfrage für die EC2-Image-Tabelle keinen Filter für Besitzer enthält, enthalten Ihre Ergebnisse alle öffentlichen Images.
Datenbanken und Tabellen
Die Athena-AWS-CMDB-Konnektor stellt die folgenden Datenbanken und Tabellen für die Abfrage Ihres AWS-Bestands der Ressourcen bereit. Um weitere Informationen zu den in den einzelnen Tabellen verfügbaren Spalten zu erhalten, führen Sie eine DESCRIBE
-Anweisung mithilfe der Athena-Konsole oder -API aus.database.table
-
ec2 – Diese Datenbank enthält Amazon EC2-bezogene Ressourcen, einschließlich der Folgenden.
-
ebs_volumes – Enthält Details Ihrer Amazon EBS-Volumes.
-
ec2_instances – Enthält Details zu Ihren EC2-Instances.
-
ec2_images – Enthält Details zu Ihren EC2-Instance-Images.
-
routing_tables – Enthält Details zu Ihren VPC-Routing-Tabellen.
-
security_groups – Enthält Details zu Ihren Sicherheitsgruppen.
-
subnets – Enthält Details zu Ihren VPC-Subnetzen.
-
vpcs – Enthält Details zu Ihren VPCs.
-
emr – Diese Datenbank enthält Amazon EMR-bezogene Ressourcen, einschließlich der Folgenden.
-
emr_cluster – Enthält Details zu Ihren EMR-Clustern.
-
rds – Diese Datenbank enthält Amazon RDS-bezogene Ressourcen, einschließlich der Folgenden.
-
rds_instances – Enthält Details zu Ihren RDS-Instances.
-
S3 – Diese Datenbank enthält RDS-bezogene Ressourcen, einschließlich der Folgenden.
-
buckets – Enthält Details Ihrer Amazon-S3-Buckets.
-
objects – Enthält Details zu Ihren Amazon-S3-Objekten, ausgenommen deren Inhalt.
Erforderliche Berechtigungen
Ausführliche Informationen zu den für diesen Konnektor erforderlichen IAM-Richtlinien finden Sie im Policies-Abschnitt der athena-aws-cmdb.yaml
-
Amazon-S3-Schreibzugriff – Der Konnektor benötigt Schreibzugriff auf einen Speicherort in Amazon S3, um Ergebnisse aus großen Abfragen zu übertragen.
-
Athena GetQueryExecution – Der Konnektor verwendet diese Berechtigung, um ein Fast-Fail durchzuführen, wenn die vorgeschaltete Athena-Abfrage beendet wurde.
-
S3 List – Der Konnektor verwendet diese Berechtigung, um Ihre Amazon-S3-Buckets und -Objekte aufzulisten.
-
EC2 Describe – Der Konnektor verwendet diese Berechtigung, um Ressourcen wie Ihre Amazon EC2-Instances, Sicherheitsgruppen, VPCs und Amazon EBS-Volumes zu beschreiben.
-
EMR Describe / List – Der Konnektor verwendet diese Berechtigung, um Ihre EMR-Cluster zu beschreiben.
-
RDS Describe – Der Konnektor verwendet diese Berechtigung, um Ihre RDS-Instanzen zu beschreiben.
Leistung
Aktuell unterstützt der AWS-CMDB-Konnektor von Athena keine parallel Scans. Der Prädikat-Pushdown wird innerhalb der Lambda-Funktion ausgeführt. Wenn möglich, werden Teilprädikate an die abgefragten Dienste übertragen. Beispielsweise ruft eine Abfrage nach den Details einer bestimmten Amazon EC2-Instance die EC2-API mit der spezifischen Instance-ID auf, um einen gezielten Beschreibungsvorgang auszuführen.
Lizenzinformationen
Die AWS-CMDB-Konnektor-Projekt von Amazon Athena ist lizenziert unter der Apache-2.0-Lizenz
Weitere Ressourcen
Weitere Informationen zu diesem Konnektor finden Sie unter der entsprechenden Seite