AWS Glue Verbindungseigenschaften

Dieses Thema enthält Informationen zu Eigenschaften für AWS Glue Verbindungen.

Erforderliche Verbindungseigenschaften

Wenn Sie eine Verbindung auf der AWS Glue Konsole definieren, müssen Sie Werte für die folgenden Eigenschaften angeben:

Verbindungsname

Geben Sie einen eindeutigen Namen für Ihre Verbindung ein.

Verbindungstyp

Wählen Sie JDBC oder einen der spezifischen Verbindungstypen.

Weitere Informationen zum JDBC-Verbindungstyp finden Sie unter AWS Glue Eigenschaften der JDBC-Verbindung

Wählen Sie Network (Netzwerk) aus, um eine Datenquelle in einer Amazon Virtual Private Cloud-Umgebung (Amazon VPC) zu verbinden.

Je nach ausgewähltem Typ zeigt die AWS Glue -Konsole weitere erforderliche Felder an. Wenn Sie beispielsweise Amazon RDS auswählen, müssen Sie anschließend die Datenbank-Engine auswählen.

SSL-Verbindung erforderlich

Wenn Sie diese Option auswählen, AWS Glue müssen Sie sicherstellen, dass die Verbindung zum Datenspeicher über ein vertrauenswürdiges Secure Sockets Layer (SSL) hergestellt wird.

Weitere Informationen, einschließlich zusätzlicher Optionen, die bei Auswahl dieser Option verfügbar sind, finden Sie unter AWS Glue Eigenschaften der SSL-Verbindung.

Wählen Sie MSK-Cluster (Amazon Managed Streaming for Apache Kafka)

Gibt einen MSK-Cluster von einem anderen AWS Konto an.

Kafka-Bootstrap-Server URLs (nur Kafka)

Gibt eine durch Kommas getrennte Liste von Bootstrap-Servern an. URLs Schließen Sie die Portnummer ein. Beispiel: b-1.vpc-test-2.o4q88o.c6.kafka.us-east-1.amazonaws.com:9094, b-2.vpc-test-2.o4q88o.c6.kafka.us-east-1.amazonaws.com:9094, b-3.vpc-test-2.o4q88o.c6.kafka.us-east-1.amazonaws.com:9094

Amazon-DocumentDB-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine Amazon DocumentDB DocumentDB-Verbindung einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des Amazon DocumentDB-Cluster-Endpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
ENFORCE_SSL: (Optional, BOOLEAN) Ob SSL für die Verbindung erzwungen werden soll. Der Standardwert ist false. Zulässige Werte: true, false.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche Verbindungsparameter.

Authentifizierung

Die Amazon DocumentDB DocumentDB-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in gespeichert sind. AWS Secrets Manager

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu Amazon DocumentDB über eine Amazon VPC konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

OpenSearch Dienstverbindung

Verwenden Sie die folgenden Eigenschaften, um eine OpenSearch Dienstverbindung für AWS Glue ETL-Jobs einzurichten.

Domain-Endpunkt: Ein Amazon OpenSearch Service-Domain-Endpunkt hat das folgende Standardformat: https://search - domainName -unstructuredIdContent. region.es.amazonaws.com. Weitere Informationen zur Identifizierung Ihres Domain-Endpunkts finden Sie unter Amazon OpenSearch Service-Domains erstellen und verwalten in der Amazon OpenSearch Service-Dokumentation.
Port: Der offene Port im Endpunkt.
AWS Geheim: Der geheime Name eines Geheimnisses in AWS Secrets Manager. AWS Glue stellt mit den Schlüsseln Ihres Geheimnisses eine Verbindung zum OpenSearch Service her.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem in Amazon VPC gehosteten OpenSearch Service-Endpunkt konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Amazon Redshift Redshift-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine Amazon Redshift Redshift-Verbindung einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des Amazon Redshift Redshift-Cluster-Endpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Erforderlich, STRING) Der Name der Amazon Redshift Redshift-Datenbank, zu der eine Verbindung hergestellt werden soll.
ENFORCE_SSL: (Optional, BOOLEAN) Ob SSL für die Verbindung erzwungen werden soll. Der Standardwert ist false. Zulässige Werte: true, false.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.

Authentifizierung

Die Amazon Redshift Redshift-Verbindung unterstützt die folgenden Authentifizierungstypen:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in gespeichert sind. AWS Secrets Manager
IAM — Authentifiziert sich mit dem rollenbasierten IAM-Zugriff.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem in Amazon VPC gehosteten Amazon Redshift-Endpunkt konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Google-Verbindung BigQuery

Die folgenden Eigenschaften werden verwendet, um eine BigQuery Google-Verbindung einzurichten, die in AWS Glue ETL-Jobs verwendet wird. Weitere Informationen finden Sie unter BigQuery Verbindungen.

PROJECT_ID: (Erforderlich, STRING) Die Projekt-ID innerhalb der Google Cloud Platform.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Kein Standardwert. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.

Authentifizierung

Die BigQuery Google-Verbindung unterstützt den folgenden Authentifizierungstyp:

BENUTZERDEFINIERT — Authentifiziert sich mit den Anmeldeinformationen für das Google Cloud-Dienstkonto, die in AWS Secrets Manager gespeichert sind.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine BigQuery Google-Verbindung über eine Amazon VPC konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

MySQL-Verbindungseigenschaften

Die folgenden Eigenschaften werden verwendet, um eine einheitliche MySQL-Verbindung einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des MySQL-Datenbankendpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Erforderlich, STRING) Der Name der Datenbank, zu der eine Verbindung hergestellt werden soll.
ENFORCE_SSL: (Optional, BOOLEAN) Ob SSL für die Verbindung erzwungen werden soll. Der Standardwert ist false. Zulässige Werte: true, false.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Kein Standardwert. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.

Authentifizierung

Die MySQL-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in AWS Secrets Manager gespeichert sind.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem in Amazon VPC gehosteten MySQL-Endpunkt konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Eigenschaften der Oracle-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine einheitliche Oracle-Verbindung einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des Oracle-Datenbank-Endpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Erforderlich, STRING) Der Name der Datenbank, zu der eine Verbindung hergestellt werden soll.
ENFORCE_SSL: (Optional, BOOLEAN) Ob SSL für die Verbindung erzwungen werden soll. Der Standardwert ist false. Zulässige Werte: true, false.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Der Standardwert ist UPPERCASE_ONLY. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.

Authentifizierung

Die Oracle-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in AWS Secrets Manager gespeichert sind.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem in Amazon VPC gehosteten Oracle-Endpunkt konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

PostgreSQL-Verbindungseigenschaften

Die folgenden Eigenschaften werden verwendet, um eine einheitliche PostgreSQL-Verbindung einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des PostgreSQL-Datenbankendpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Erforderlich, STRING) Der Name der Datenbank, zu der eine Verbindung hergestellt werden soll.
ENFORCE_SSL: (Optional, BOOLEAN) Ob SSL für die Verbindung erzwungen werden soll. Der Standardwert ist false. Zulässige Werte: true, false.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Der Standardwert ist LOWERCASE_ONLY. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.

Authentifizierung

Die PostgreSQL-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in gespeichert sind. AWS Secrets Manager

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem in Amazon VPC gehosteten PostgreSQL-Endpunkt konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

SAP-HANA-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine SAP HANA-Verbindung für AWS Glue ETL-Jobs einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des SAP HANA-Datenbankendpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Optional, STRING) Der Name der SAP HANA-Datenbank, zu der eine Verbindung hergestellt werden soll.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Der Standardwert ist UPPERCASE_ONLY. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.

Authentifizierung

Die SAP HANA-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in AWS Secrets Manager gespeichert sind.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem SAP-HANA-Endpunkt konfigurieren, der in Amazon VPC gehostet wird:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Snowflake-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine Snowflake-Verbindung einzurichten, die in ETL-Jobs verwendet wird. AWS Glue Verwenden Sie beim Crawling von Snowflake eine JDBC-Verbindung.

HOST: (Erforderlich, STRING) Die Snowflake-Host-URL. Der Wert muss mit .snowflakecomputing.com oder enden. .snowflakecomputing.cn Weitere Informationen zum Snowflake-Endpunkt URLs finden Sie unter Connecting to Your Accounts in der Snowflake-Dokumentation.
PORT: (Optional, STRING) Die Portnummer für die Snowflake-Verbindung.
DATABASE: (Optional, STRING) Der Name der Snowflake-Datenbank.
SCHEMA: (Optional, STRING) Der Name des Snowflake-Schemas.
LAGERHALLE: (Optional, STRING) Der Name des Snowflake-Warehouses.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Snowflake-Verbindung.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Der Standardwert ist UPPERCASE_ONLY. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.

Authentifizierung

Die Snowflake-Verbindung unterstützt die folgenden Authentifizierungstypen:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in gespeichert sind. AWS Secrets Manager
OAUTH2— Authentifiziert sich mit dem OAuth2 Gewährungstyp Autorisierungscode.
BENUTZERDEFINIERT — Authentifiziert sich mit einem Benutzernamen und einem privaten PEM-Schlüssel, der in gespeichert ist. AWS Secrets Manager

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem Snowflake-Endpunkt konfigurieren, der in Amazon VPC mithilfe von AWS PrivateLink gehostet wird.

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Eigenschaften der SQL Server-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine einheitliche SQL Server-Verbindung einzurichten.

HOST: (Erforderlich, STRING) Der Hostname des SQL Server-Datenbankendpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Erforderlich, STRING) Der Name der Datenbank, zu der eine Verbindung hergestellt werden soll.
ENFORCE_SSL: (Optional, BOOLEAN) Ob SSL für die Verbindung erzwungen werden soll. Der Standardwert ist false. Zulässige Werte: true, false.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.
CATALOG_CASING_FILTER: (Optional, STRING) Steuert, wie Entitätsnamen verarbeitet werden und welche Namen von der externen Quelle akzeptiert werden. Diese Eigenschaft gilt nur, wenn die Verbindung mit dem Datenkatalog APIs und dem Katalogverbund verwendet wird. Sie gilt nicht für AWS Glue ETL-Jobs oder andere verbindungsbezogene APIs Jobs. Kein Standardwert. Zulässige Werte: LOWERCASE_ONLY, UPPERCASE_ONLY.

Authentifizierung

Die SQL Server-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in AWS Secrets Manager gespeichert sind.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem in Amazon VPC gehosteten SQL Server-Endpunkt konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Teradata-Vantage-Verbindung

Die folgenden Eigenschaften werden verwendet, um eine Teradata Vantage-Verbindung für ETL-Jobs einzurichten. AWS Glue

HOST: (Erforderlich, STRING) Der Hostname des Teradata-Datenbankendpunkts.
PORT: (Erforderlich, STRING) Die Portnummer. Der Wert muss eine gültige Portnummer sein.
DATABASE: (Erforderlich, STRING) Der Name der Teradata-Datenbank, zu der eine Verbindung hergestellt werden soll.
ROLE_ARN: (Optional, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.
JDBC_PARAMS: (Optional, STRING) Zusätzliche JDBC-Parameter für die Verbindung.

Authentifizierung

Die Teradata Vantage-Verbindung unterstützt den folgenden Authentifizierungstyp:

BASIC — Authentifiziert sich mit einem Benutzernamen und einem Passwort, die in gespeichert sind. AWS Secrets Manager

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem Teradata-Vantage-Endpunkt konfigurieren, der in Amazon VPC gehostet wird:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Vertica-Verbindung

Verwenden Sie die folgenden Eigenschaften, um eine Vertica-Verbindung für AWS Glue ETL-Jobs einzurichten.

Vertica-Host: Der Hostname Ihrer Vertica-Installation.
Vertica-Port: Der Port, über den Ihre Vertica-Installation verfügbar ist.
AWS Geheim: Der geheime Name eines Geheimnisses in AWS Secrets Manager. AWS Glue stellt mit den Schlüsseln Ihres Geheimnisses eine Verbindung zu Vertica her.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Verbindung zu einem Vertica-Endpunkt konfigurieren, der in Amazon VPC gehostet wird.

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Azure-Cosmos-Verbindung

Verwenden Sie die folgenden Eigenschaften, um eine Azure Cosmos-Verbindung für AWS Glue ETL-Jobs einzurichten.

Endpunkt-URI für das Azure-Cosmos-DB-Konto: Der für die Verbindung mit Azure Cosmos verwendete Endpunkt. Weitere Informationen finden Sie in der Azure-Dokumentation.
AWS Geheim: Der geheime Name eines Geheimnisses in AWS Secrets Manager. AWS Glue stellt mithilfe der Schlüssel Ihres Geheimnisses eine Verbindung zu Azure Cosmos her.

Azure-SQL-Verbindung

Verwenden Sie die folgenden Eigenschaften, um eine Azure SQL-Verbindung für AWS Glue ETL-Jobs einzurichten.

Azure-SQL-URL

Die JDBC-URL eines Azure-SQL-Endpunkts.

Die URL muss das folgende Format aufweisen: jdbc:sqlserver://databaseServerName:databasePort;databaseName=azuresqlDBname;.

AWS Glue erfordert die folgenden URL-Eigenschaften:

databaseName – Eine Standarddatenbank in Azure SQL, mit der eine Verbindung hergestellt werden kann.

Weitere Informationen zu JDBC URLs für Azure SQL Managed Instances finden Sie in der Microsoft-Dokumentation.

AWS Geheim

Der geheime Name eines Geheimnisses in AWS Secrets Manager. AWS Glue stellt mithilfe der Schlüssel Ihres Geheimnisses eine Verbindung zu Azure SQL her.

Salesforce-Verbindungseigenschaften

Die folgenden Eigenschaften werden verwendet, um eine Salesforce-Verbindung einzurichten.

INSTANCE_URL: (Erforderlich, STRING) Die URL der Salesforce-Instanz. Der Wert muss eine gültige Salesforce-URL sein (z. B.https://mycompany.my.salesforce.com).
SALESFORCE_ENVIRONMENT: (Erforderlich, STRING) Die Salesforce-Umgebung, zu der eine Verbindung hergestellt werden soll. Der Standardwert ist Production. Zulässige Werte: Production, Sandbox.
ROLE_ARN: (Erforderlich, STRING) Der ARN der IAM-Rolle, der für den Zugriff AWS Secrets Manager und die Zuweisung einer IP-Adresse verwendet wird, falls eine Amazon-VPC angegeben ist.

Authentifizierung

Die Salesforce-Verbindung unterstützt den folgenden Authentifizierungstyp:

OAUTH2— Authentifiziert sich mit den Grant-Typen OAuth2 Authorization Code und JWT Bearer.

Verwenden Sie die folgenden Eigenschaften, wenn Sie eine Salesforce-Verbindung über eine Amazon VPC konfigurieren:

VPC: Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.
Subnetz: Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.
Sicherheitsgruppen: Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Im Folgenden finden Sie zusätzliche Verbindungsoptionen für Salesforce:

ENTITY_NAME(String) — (Erforderlich) Wird für Lesen/Schreiben verwendet. Der Name Ihres Objekts in Salesforce.
API_VERSION(String) — (Erforderlich) Wird für Lesen/Schreiben verwendet. Version der Salesforce-REST-API, die Sie verwenden möchten.
SELECTED_FIELDS(Liste<String>) — Standard: leer (SELECT *). Zum Lesen verwendet. Spalten, die Sie für das Objekt auswählen möchten.
FILTER_PREDICATE(Zeichenfolge) — Standard: leer. Zum Lesen verwendet. Muss das Spark-SQL-Format aufweisen.
QUERY(Zeichenfolge) — Standard: leer. Zum Lesen verwendet. Vollständige Spark-SQL-Abfrage.
PARTITION_FIELD(String) — Wird zum Lesen verwendet. Feld, das zur Partitionierung der Abfrage verwendet werden soll.
LOWER_BOUND(String) — Wird zum Lesen verwendet. Ein inklusiver Untergrenzwert des ausgewählten Partitionsfelds.
UPPER_BOUND(String) — Wird zum Lesen verwendet. Ein exklusiver Obergrenzwert des ausgewählten Partitionsfelds.
NUM_PARTITIONS(Integer) — Standard: 1. Zum Lesen verwendet. Anzahl der zu lesenden Partitionen.
IMPORT_DELETED_RECORDS(Zeichenfolge) — Standard: FALSE. Zum Lesen verwendet. Um die gelöschten Datensätze während der Abfrage abzurufen.
WRITE_OPERATION(Zeichenfolge) — Standard: INSERT. Wird zum Schreiben verwendet. Wert muss INSERT, UPDATE, UPSERT, DELETE sein.
ID_FIELD_NAMES(Zeichenfolge) — Standard: null. Nur für UPSERT verwendet.

AWS Glue Eigenschaften der JDBC-Verbindung

AWS Glue Studio erstellt jetzt einheitliche Verbindungen für MySQL-, Oracle-, PostgresSQL-, Redshift- und SQL Server-Datenquellen, was zusätzliche Schritte für den Zugriff auf Secrets Manager- und VPC-Ressourcen erfordert, was zusätzliche Kosten verursachen kann. Sie können auf diese Verbindungen zugreifen, AWS Glue Studio indem Sie den Verbindungsnamen für die jeweilige Verbindung auswählen.

Weitere Informationen finden Sie unter Überlegungen.

AWS Glue kann über eine JDBC-Verbindung eine Verbindung zu den folgenden Datenspeichern herstellen:

Amazon Redshift
Amazon Aurora
Microsoft SQL Server
MySQL
Oracle
PostgreSQL
Snowflake, wenn Crawler verwendet werden. AWS Glue
Aurora (unterstützt, wenn der native JDBC-Treiber verwendet wird. Nicht alle Features des Treibers können genutzt werden)
Amazon RDS for MariaDB

Wichtig

Ein ETL-Auftrag kann derzeit nur eine JDBC-Verbindung mit einem Subnetz verwenden. Wenn Sie über mehrere Datenspeicher in einem Auftrag verfügen, müssen sich diese im gleichen Subnetz befinden oder vom Subnetz erreichbar sein.

Wenn Sie sich dafür entscheiden, Ihre eigenen JDBC-Treiberversionen für AWS Glue Crawler zu verwenden, verbrauchen Ihre Crawler Ressourcen in AWS Glue Jobs und Amazon S3, um sicherzustellen, dass Ihre bereitgestellten Treiber in Ihrer Umgebung ausgeführt werden. Der zusätzliche Ressourcenverbrauch wird in Ihrem Konto angezeigt. Darüber hinaus bedeutet die Bereitstellung eines eigenen JDBC-Treibers nicht, dass der Crawler alle Features des Treibers nutzen kann. Treiber sind auf die Eigenschaften beschränkt, die unter Definieren von Verbindungen im Data Catalog beschrieben sind.

Im Folgenden finden Sie zusätzliche Eigenschaften für den JDBC-Verbindungstyp.

JDBC-URL

Geben Sie die URL für Ihren JDBC-Datenspeicher ein. Für die meisten Datenbank-Engines wird dieses Feld in folgendem Format angegeben. Ersetzen Sie in diesem Format, protocol hostport, und db_name durch Ihre eigenen Informationen.

jdbc:protocol://host:port/db_name

Abhängig von der Datenbank-Engine kann jedoch ein anderes JDBC-URL-Format erforderlich sein. Dieses Format kann im Hinblick auf die Nutzung des Doppelpunkts (:) und Schrägstrichs (/) oder die Schlüsselwörter, mit denen Datenbanken angegeben werden, geringfügig abweichen.

Damit JDBC eine Verbindung mit dem Datenspeicher herstellen kann, ist ein db_name im Datenspeicher erforderlich. Der db_name wird verwendet, um eine Netzwerkverbindung mit dem bereitgestellten username und password herzustellen. Wenn eine Verbindung besteht, AWS Glue kann auf andere Datenbanken im Datenspeicher zugegriffen werden, um einen Crawler oder einen ETL-Job auszuführen.

Die folgenden JDBC-URL-Beispiele veranschaulichen die Syntax für mehrere Datenbank-Engines.

Herstellen einer Verbindung mit einem Amazon-Redshift-Cluster-Datenspeicher mithilfe einer dev-Datenbank:

jdbc:redshift://xxx.us-east-1.redshift.amazonaws.com:8192/dev
Herstellen einer Verbindung mit einem Amazon RDS for MySQL-Datenspeicher mithilfe einer employee-Datenbank:

jdbc:mysql://xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:3306/employee
Herstellen einer Verbindung mit einem Amazon RDS for PostgreSQL-Datenspeicher mithilfe einer employee-Datenbank:

jdbc:postgresql://xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:5432/employee
Herstellen einer Verbindung mit einem Amazon RDS for Oracle-Datenspeicher mithilfe eines employee-Servicenamens:

jdbc:oracle:thin://@xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:1521/employee

Die Syntax für Amazon RDS for Oracle kann das folgende Muster aufweisen: Ersetzen Sie in diesen Musternhost, portservice_name, und SID durch Ihre eigenen Informationen.
- jdbc:oracle:thin://@host:port/service_name
- jdbc:oracle:thin://@host:port:SID
Eine Verbindung mit einem Amazon RDS for Microsoft SQL Server-Datenspeicher mit einer employee-Datenbank herstellen:

jdbc:sqlserver://xxx-cluster.cluster-xxx.us-east-1.rds.amazonaws.com:1433;databaseName=employee

Die Syntax für Amazon RDS for SQL Server kann das folgende Muster aufweisen: Ersetzen Sie in diesen Mustern server_nameport, und db_name durch Ihre eigenen Informationen.
- jdbc:sqlserver://server_name:port;database=db_name
- jdbc:sqlserver://server_name:port;databaseName=db_name
Um eine Verbindung mit einer Amazon Aurora PostgreSQL employee Datenbankinstanz herzustellen, geben Sie den Endpunkt für die Datenbankinstanz, den Port und den Datenbanknamen an:

jdbc:postgresql://employee_instance_1.xxxxxxxxxxxx.us-east-2.rds.amazonaws.com:5432/employee
Um eine Verbindung zu einem Amazon RDS for MariaDB Datenspeicher mit einer employee Datenbank herzustellen, geben Sie den Endpunkt für die Datenbankinstanz, den Port und den Datenbanknamen an:

jdbc:mysql://xxx-cluster.cluster-xxx.aws-region.rds.amazonaws.com:3306/employee
Warnung
Snowflake-JDBC-Verbindungen werden nur von Crawlern unterstützt. AWS Glue Wenn Sie den Snowflake-Connector in AWS Glue Jobs verwenden, verwenden Sie den Snowflake-Verbindungstyp.

Geben Sie zum Herstellen einer Verbindung mit einer Snowflake-Instance der sample-Datenbank den Endpunkt für die Snowflake-Instance, den Benutzer, den Datenbanknamen und den Rollennamen an. Sie können optional den warehouse-Parameter hinzufügen.

jdbc:snowflake://account_name.snowflakecomputing.com/?user=user_name&db=sample&role=role_name&warehouse=warehouse_name

Wichtig
Bei Snowflake-Verbindungen über JDBC wird die Reihenfolge der Parameter in der URL erzwungen und muss wie folgt geordnet werden: user, db, role_name und warehouse.
Um eine Verbindung zu einer Snowflake-Instanz der sample Datenbank mit einem AWS privaten Link herzustellen, geben Sie die Snowflake-JDBC-URL wie folgt an:

jdbc:snowflake://account_name.region.privatelink.snowflakecomputing.com/?user=user_name&db=sample&role=role_name&warehouse=warehouse_name

Username

Anmerkung

Wir empfehlen, dass Sie zum Speichern der Verbindungsanmeldeinformationen ein AWS Geheimnis verwenden, anstatt Ihren Benutzernamen und Ihr Passwort direkt anzugeben. Weitere Informationen finden Sie unter Speichern von Verbindungsanmeldedaten in AWS Secrets Manager.

Geben Sie einen Benutzernamen ein, der über die Berechtigung für den Zugriff auf den JDBC-Datenspeicher verfügt.

Passwort

Geben Sie das Passwort für den Benutzernamen ein, der über Zugriffsberechtigungen für den JDBC-Datenspeicher verfügt.

Port

Geben Sie den Port ein, der in der JDBC-URL verwendet wird, um eine Verbindung mit einer Amazon-RDS-Oracle-Instance herzustellen. Dieses Feld wird nur angezeigt, wenn Require SSL connection (SSL-Verbindung anfordern) für eine Amazon-RDS-Oracle-Instance ausgewählt ist.

VPC

Wählen Sie den Namen der Virtual Private Cloud (VPC) aus, die den Datenspeicher enthält. Die AWS Glue Konsole listet alle VPCs für die aktuelle Region auf.

Wichtig

Wenn Sie über eine JDBC-Verbindung arbeiten AWS, von der aus gehostet wird, z. B. mit Daten von Snowflake, sollte Ihre VPC über ein NAT-Gateway verfügen, das den Datenverkehr in öffentliche und private Subnetze aufteilt. Das öffentliche Subnetz wird für die Verbindung mit der externen Quelle verwendet, und das interne Subnetz wird für die Verarbeitung von verwendet. AWS Glue Informationen zum Konfigurieren Ihrer Amazon VPC für externe Verbindungen finden Sie unter Herstellen einer Verbindung mit dem Internet oder anderen Netzwerken mithilfe von NAT-Geräten und Einrichten von Amazon VPC für JDBC-Verbindungen zu Amazon-RDS-Datenspeichern von AWS Glue.

Subnetz

Wählen Sie das Subnetz in der VPC aus, die den Datenspeicher enthält. Die AWS Glue -Konsole listet alle Subnetze für den Datenspeicher in Ihrer VPC auf.

Sicherheitsgruppen

Wählen Sie die Sicherheitsgruppen aus, die Ihrem Datenspeicher zugeordnet sind. AWS Glue erfordert eine oder mehrere Sicherheitsgruppen mit einer Regel für eingehende Quellen, die das Herstellen einer Verbindung AWS Glue ermöglicht. Die AWS Glue Konsole listet alle Sicherheitsgruppen auf, denen eingehender Zugriff auf Ihre VPC gewährt wird. AWS Glue ordnet diese Sicherheitsgruppen der elastic network interface zu, die mit Ihrem VPC-Subnetz verbunden ist.

Name der JDBC-Treiberklasse – optional

Geben Sie den Namen der benutzerdefinierten JDBC-Treiberklasse an:

Postgres – org.postgresql.Driver 
  MySQL – com.mysql.jdbc.Driver, com.mysql.cj.jdbc.Driver 
  Redshift – com.amazon.redshift.jdbc.Driver, com.amazon.redshift.jdbc42.Driver  
  Oracle — oracle.jdbc.driver. OracleDriver 
  SQL Server — com.microsoft.sqlserver.jdbc. SQLServerTreiber

JDBC-Treiber-S3-Pfad – optional

Geben Sie den Amazon-S3-Speicherort für den benutzerdefinierten JDBC-Treiber an. Dies ist ein absoluter Pfad zu einer .jar-Datei. Wenn Sie Ihre eigenen JDBC-Treiber bereitstellen möchten, um eine Verbindung zu Ihren Datenquellen für Ihre vom Crawler unterstützten Datenbanken herzustellen, können Sie Werte für Parameter customJdbcDriverS3Path und customJdbcDriverClassName angeben.  Die Verwendung eines vom Kunden bereitgestellten JDBC-Treibers ist auf das erforderliche Erforderliche Verbindungseigenschaften beschränkt.

AWS Glue Verbindungseigenschaften von MongoDB und MongoDB Atlas

Im Folgenden finden Sie zusätzliche Eigenschaften für den MongoDB- oder MongoDB-Atlas-Verbindungstyp.

MongoDB-URL

Geben Sie die URL für Ihren MongoDB- oder MongoDB-Atlas-Datenspeicher ein:

Für MongoDB: mongodb://host:port/database. Der Host kann ein Hostname, eine IP-Adresse oder ein UNIX-Domain-Socket sein. Wenn die Verbindungszeichenfolge keinen Port angibt, wird der standardmäßige MongoDB-Port 27017 verwendet.
Für MongoDB Atlas: mongodb+srv://server.example.com/database. Der Host kann ein Hostname sein, der im Folgenden einem DNS-SRV-Eintrag entspricht. Das SRV-Format benötigt keinen Port und verwendet den standardmäßigen MongoDB-Port 27017.

Username

Anmerkung

Wir empfehlen, dass Sie zum Speichern der Verbindungsanmeldeinformationen einen AWS geheimen Schlüssel verwenden, anstatt Ihren Benutzernamen und Ihr Passwort direkt einzugeben. Weitere Informationen finden Sie unter Speichern von Verbindungsanmeldedaten in AWS Secrets Manager.

Geben Sie einen Benutzernamen ein, der über die Berechtigung für den Zugriff auf den JDBC-Datenspeicher verfügt.

Passwort

Geben Sie das Passwort für den Benutzernamen ein, der über Zugriffsberechtigungen für den MongoDB- oder MongoDB-Atlas-Datenspeicher verfügt.

AWS Glue Eigenschaften der SSL-Verbindung

Im Folgenden finden Sie Details zur Eigenschaft SSL-Verbindung erforderlich.

Wenn Sie keine SSL-Verbindung benötigen, werden Fehler AWS Glue ignoriert, wenn SSL zum Verschlüsseln einer Verbindung zum Datenspeicher verwendet wird. In der Dokumentation Ihrer Datenbank finden Sie Konfigurationsanweisungen. Wenn Sie diese Option auswählen, schlagen die Auftragsausführungs-, Crawler- oder ETL-Anweisungen in einem Entwicklungsendpunkt fehl, wenn sich AWS Glue nicht verbinden kann.

Anmerkung

Snowflake unterstützt standardmäßig eine SSL-Verbindung, daher gilt diese Eigenschaft nicht für Snowflake.

Diese Option wird auf der AWS Glue Clientseite validiert. Bei JDBC-Verbindungen werden AWS Glue nur Verbindungen über SSL mit Zertifikat- und Hostnamenvalidierung hergestellt. SSL-Verbindungsunterstützung ist verfügbar für:

Oracle-Datenbank
Microsoft SQL Server
PostgreSQL
Amazon Redshift
MySQL (nur für Amazon-RDS-Instances)
Amazon Aurora MySQL (nur für Amazon-RDS-Instances)
Amazon Aurora PostgreSQL (Nur Amazon RDS-Instances)
Kafka, das beinhaltet Amazon Managed Streaming für Apache Kafka
MongoDB

Anmerkung

Um einem Amazon-RDS-Oracle--Datenspeicher die Verwendung von Require SSL connection (SSL-Verbindung anfordern) zu ermöglichen, müssen Sie eine Optionsgruppe erstellen und an die Oracle-Instance anfügen.

Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon RDS-Konsole unter https://console.aws.amazon.com/rds/.
Fügen Sie eine Optionsgruppe zur Amazon-RDS-Oracle-Instance hinzu. Weitere Informationen zum Hinzufügen einer Optionsgruppe auf der Amazon-RDS-Konsole finden Sie unter Creating an Option Group (Erstellen einer Optionsgruppe).
Hinzufügen einer Option zur Optionsgruppe für SSL. Der Port, den Sie für SSL angeben, wird später verwendet, wenn Sie eine AWS Glue JDBC-Verbindungs-URL für die Amazon RDS-Oracle-Instance erstellen. Weitere Informationen zum Hinzufügen einer Option auf der Amazon-RDS-Konsole finden Sie unter Adding an Option to an Option Group (Hinzufügen einer Option zu einer Optionsgruppe) im Benutzerhandbuch für Amazon RDS. Weitere Informationen zu den Oracle-SSL-Optionen finden Sie unter Oracel SSL im Amazon RDS-Benutzerhandbuch.
Stellen Sie auf der AWS Glue Konsole eine Verbindung zur Amazon RDS Oracle-Instance her. Wählen Sie in der Verbindungsdefinition die Option SSL-Verbindung erforderlichaus. Geben Sie bei Bedarf den Port ein, den Sie in der Option Amazon RDS Oracle SSL verwendet haben.

Die folgenden zusätzlichen optionalen Eigenschaften sind verfügbar, wenn Require SSL connection (SSL-Verbindung erforderlich) für eine Verbindung ausgewählt ist.

Benutzerdefiniertes JDBC-Zertifikat in S3

Wenn Sie über ein Zertifikat verfügen, das Sie derzeit für die SSL-Kommunikation mit Ihren lokalen oder Cloud-Datenbanken verwenden, können Sie dieses Zertifikat für SSL-Verbindungen zu AWS Glue Datenquellen oder Zielen verwenden. Geben Sie einen Amazon Simple Storage Service (Amazon S3) -Standort ein, der ein benutzerdefiniertes Stammzertifikat enthält. AWS Glue verwendet dieses Zertifikat, um eine SSL-Verbindung zur Datenbank herzustellen. AWS Glue verarbeitet nur X.509-Zertifikate. Das Zertifikat muss DER-codiert sein und im base64-PEM-Codierungsformat bereitgestellt werden.

Wenn dieses Feld leer bleibt, wird das Standardzertifikat verwendet.

Benutzerdefinierte JDBC-Zertifikatzeichenfolge

Geben Sie JDBC-Datenbank-Zertifikatinformationen ein. Diese Zeichenfolge wird für den Domainabgleich oder den Distinguished Name (DN)-Abgleich verwendet wird. Im Fall von Oracle Database entspricht die Zeichenfolge dem Parameter SSL_SERVER_CERT_DN im Sicherheitsabschnitt der Datei tnsnames.ora. Im Fall von Microsoft SQL Server wird diese Zeichenfolge als hostNameInCertificate verwendet.

Im Folgenden finden Sie ein Beispiel für den Oracle Database-Parameter SSL_SERVER_CERT_DN.


cn=sales,cn=OracleContext,dc=us,dc=example,dc=com

Speicherort des privaten CA-Zertifikats von Kafka

Wenn Sie über ein Zertifikat verfügen, das Sie derzeit für die SSL-Kommunikation mit Ihrem Kafka-Datenspeicher verwenden, können Sie dieses Zertifikat mit Ihrer AWS Glue Verbindung verwenden. Diese Option ist für Kafka-Datenspeicher erforderlich und für Amazon Managed Streaming für Apache Kafka Datenspeicher optional. Geben Sie einen Amazon Simple Storage Service (Amazon S3) -Standort ein, der ein benutzerdefiniertes Stammzertifikat enthält. AWS Glue verwendet dieses Zertifikat, um eine SSL-Verbindung zum Kafka-Datenspeicher herzustellen. AWS Glue verarbeitet nur X.509-Zertifikate. Das Zertifikat muss DER-codiert sein und im base64-PEM-Codierungsformat bereitgestellt werden.

Zertifikatvalidierung überspringen

Aktivieren Sie das Kontrollkästchen Zertifikatsvalidierung überspringen, um die Validierung des benutzerdefinierten Zertifikats zu AWS Glueüberspringen. Wenn Sie sich für die Validierung entscheiden, werden der Signaturalgorithmus und der Betreff-Public-Key-Algorithmus für das Zertifikat AWS Glue validiert. Wenn das Zertifikat nicht validiert werden kann, schlägt die Ausführung aller ETL-Aufgaben oder Crawler fehl, die diese Verbindung verwenden.

Die einzig zulässigen Signaturalgorithmen sind SHA256with RSA, RSA SHA384with oder RSA. SHA512with Die Schlüssellänge für den Algorithmus für den öffentlichen Schlüssel muss mindestens 2048 betragen.

Kafka-Client-Keystore-Speicherort

Der Amazon-S3-Speicherort der Client-Keystore-Datei für die clientseitige Kafka-Authentifizierung. Der Pfad muss das Format s3://.jks haben. bucket/prefix/filename Er muss mit dem Dateinamen und der Erweiterung .jks enden.

Passwort für den Kafka-Client-Keystore (optional)

Das Passwort für den Zugriff auf den bereitgestellten Keystore.

Passwort für den Kafka-Client-Schlüssel (optional)

Ein Keystore kann aus mehreren Schlüsseln bestehen, also ist dies das Passwort für den Zugriff auf den Clientschlüssel, der mit dem serverseitigen Kafka-Schlüssel verwendet werden soll.

Apache-Kafka-Verbindungseigenschaften für die Client-Authentifizierung

AWS Glue unterstützt das SASL-Framework (Simple Authentication and Security Layer) für die Authentifizierung, wenn Sie eine Apache Kafka-Verbindung herstellen. Das SASL-Framework unterstützt verschiedene Authentifizierungsmechanismen und AWS Glue bietet die Protokolle SCRAM (Benutzername und Passwort), GSSAPI (Kerberos-Protokoll) und PLAIN.

Wird verwendet AWS Glue Studio , um eine der folgenden Client-Authentifizierungsmethoden zu konfigurieren. Weitere Informationen finden Sie im AWS Glue Studio Benutzerhandbuch unter Verbindungen für Konnektoren erstellen.

Keine – Keine Authentifizierung. Dies ist nützlich, wenn Sie eine Verbindung zu Testzwecken herstellen.
SASL/SCRAM-SHA-512 – Wenn Sie diese Authentifizierungsmethode wählen, können Sie Anmeldeinformationen zur Authentifizierung angeben. Es gibt zwei Optionen:
- AWS Secrets Manager verwenden (empfohlen) — wenn Sie diese Option wählen, können Sie Ihren Benutzernamen und Ihr Passwort in AWS Secrets Manager speichern und bei Bedarf AWS Glue darauf zugreifen lassen. Geben Sie das Secret an, das die SSL- oder SASL-Authentifizierungsdaten speichert. Weitere Informationen finden Sie unter Speichern von Verbindungsanmeldedaten in AWS Secrets Manager.
- Geben Sie einen Benutzernamen und ein Passwort ein.
SASL/GSSAPI (Kerberos) - if you select this option, you can select the location of the keytab file, krb5.conf file and enter the Kerberos principal name and Kerberos service name. The locations for the keytab file and krb5.conf file must be in an Amazon S3 location. Since MSK does not yet support SASL/GSSAPI, diese Option ist nur für vom Kunden verwaltete Apache Kafka-Cluster verfügbar. Weitere Informationen finden Sie unter MIT Kerberos-Dokumentation: Keytab.
SASL/PLAIN – Wählen Sie diese Authentifizierungsmethode, um Anmeldeinformationen zur Authentifizierung anzugeben. Es gibt zwei Optionen:
- AWS Secrets Manager verwenden (empfohlen) — Wenn Sie diese Option wählen, können Sie Ihre Anmeldeinformationen in AWS Secrets Manager speichern und bei Bedarf AWS Glue auf die Informationen zugreifen. Geben Sie das Secret an, das die SSL- oder SASL-Authentifizierungsdaten speichert.
- Geben Sie Benutzername und Passwort direkt an.
SSL Client Authentication – wenn Sie diese Option auswählen, können Sie den Standort des Kafka-Client-Keystores auswählen, indem Sie Amazon S3 durchsuchen. Optional können Sie das Kennwort für den Kafka-Client-Keystore und das Kafka-Client-Schlüsselkennwort eingeben.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

REST-API-Verbindungen

Speichern von Verbindungsanmeldedaten in AWS Secrets Manager

AWS Glue Verbindungseigenschaften

Themen

Erforderliche Verbindungseigenschaften

Amazon-DocumentDB-Verbindung

OpenSearch Dienstverbindung

Amazon Redshift Redshift-Verbindung

Google-Verbindung BigQuery

MySQL-Verbindungseigenschaften

Eigenschaften der Oracle-Verbindung

PostgreSQL-Verbindungseigenschaften

SAP-HANA-Verbindung

Snowflake-Verbindung

Eigenschaften der SQL Server-Verbindung

Teradata-Vantage-Verbindung

Vertica-Verbindung

Azure-Cosmos-Verbindung

Azure-SQL-Verbindung

Salesforce-Verbindungseigenschaften

AWS Glue Eigenschaften der JDBC-Verbindung

Wichtig

Warnung

Wichtig

Anmerkung

Wichtig

AWS Glue Verbindungseigenschaften von MongoDB und MongoDB Atlas

Anmerkung

AWS Glue Eigenschaften der SSL-Verbindung

Anmerkung

Anmerkung

Apache-Kafka-Verbindungseigenschaften für die Client-Authentifizierung