Erweiterte Optionen - Amazon Athena

Erweiterte Optionen

Abrufgröße

Die maximale Anzahl der Ergebnisse (Reihen), die bei dieser Anfrage zurückzugeben sind. Informationen zu den Parametern finden Sie unter GetQuery MaxResults. Für die Streaming-API ist der Höchstwert 10 000 000.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
RowsToFetchPerBlock Optional

1000 für Nicht-Streaming

20000 für Streaming

RowsToFetchPerBlock=20000;

Ergebnis-Fetcher

Der standardmäßige Ergebnis-Fetcher lädt Abfrageergebnisse direkt von Amazon S3 herunter, ohne die Athena-API-Operationen zu durchlaufen. Wenn es Situationen erkennt, in denen ein direkter S3-Download nicht möglich ist, greift es automatisch auf die Verwendung der GetQueryResultsStream-API-Operation zurück. Dies passiert beispielsweise, wenn Abfrageergebnisse mit der CSE_KMS-Option verschlüsselt werden.

Die Verwendung des auto-Fetchers wird in den meisten Situationen empfohlen. Allerdings, wennIhre IAM-Richtlinien oder S3-Bucket-Richtlinien die s3:CalledVia-Bedingung verwenden, um den Zugriff auf S3-Objektanforderungen von Athena zu beschränken, versucht der Auto-Fetcher zunächst, die Ergebnisse von S3 herunterzuladen, und greift dann auf GetQueryResultsStream zurück. In dieser Situation möchten Sie möglicherweise ResultFetcher auf GetQueryResultsStream setzen, um einen zusätzlichen API-Aufruf zu vermeiden.

Anmerkung

Der Treiber erkennt weiterhin die Parameter API-Streaming aktivieren (UseResultsetStreaming=1;) und S3-Fetcher aktivieren (EnableS3Fetcher=1;). Wir empfehlen Ihnen jedoch, den ResultFetcher-Parameter zu verwenden, um eine bessere Erfahrung zu erzielen.

Name der Verbindungszeichenfolge Parametertyp Standardwert Mögliche Werte Beispiel für Verbindungszeichenfolgen

ResultFetcher

Optional auto auto, S3, GetQueryResults, GetQueryResultsStream ResultFetcher=auto

Wiederverwendung von Ergebnissen aktivieren

Gibt an, ob frühere Abfrageergebnisse wiederverwendet werden können, wenn die Abfrage ausgeführt wird. Informationen zu Parametern finden Sie unter ResultReuseByAgeConfiguration.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
EnableResultReuse Optional 0 EnableResultReuse=1;

Höchstalter für die Wiederverwendung von Ergebnissen

Gibt in Minuten das maximale Alter eines vorherigen Abfrageergebnisses an, das Athena bei der Wiederverwendung berücksichtigen sollte. Informationen zu Parametern finden Sie unter ResultReuseByAgeConfiguration.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
ReusedResultMaxAgeInMinutes Optional 60 ReusedResultMaxAgeInMinutes=90;

Mehrere S3-Threads verwenden

Ruft Daten mithilfe mehrerer Threads von Amazon S3 ab. Wenn diese Option aktiviert ist, wird die im Amazon-S3-Bucket gespeicherte Ergebnisdatei parallel über mehrere Threads abgerufen.

Aktivieren Sie diese Option nur, wenn Sie über eine gute Netzwerkbandbreite verfügen. In unseren Messungen auf einer c5.2xlarge-Instance in EC2 erreichte beispielsweise ein Single-Thread-S3-Client 1 Gbit/s, während S3-Clients mit mehreren Threads einen Netzwerkdurchsatz von 4 Gbit/s erreichten.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen

UseMultipleS3Threads

Optional 0 UseMultipleS3Threads=1;

Einen einzigen Katalog und ein Schema verwenden

Standardmäßig fragt der ODBC-Treiber Athena ab, um die Liste der verfügbaren Kataloge und Schemas abzurufen. Diese Option zwingt den Treiber, den Katalog und das Schema zu verwenden, welche im Konfigurationsdialogfeld des ODBC-Datenquellenadministrators oder in den Verbindungsparametern angegeben sind.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
UseSingleCatalogAndSchema Optional 0 UseSingleCatalogAndSchema=1;

Abfrage verwenden um Tabellen aufzulisten

Für LAMBDA-Katalogtypen, ermöglicht es dem ODBC-Treiber, eine SHOW TABLES-Abfrage zu senden, um eine Liste der verfügbaren Tabellen zu erhalten. Dies ist die Standardeinstellung. Wenn dieser Parameter auf 0 gesetzt ist, verwendet der ODBC-Treiber die Athena ListTableMetadata-API, um eine Liste der verfügbaren Tabellen abzurufen. Beachten Sie, dass bei LAMBDA-Katalogtypen die Verwendung von ListTableMetadata zu Leistungseinbußen führt.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
UseQueryToListTables Optional 1 UseQueryToListTables=1;

WCHAR für Zeichenfolgentypen verwenden

Standardmäßig verwendet der ODBC-Treiber SQL_CHAR und SQL_VARCHAR für Athena die Zeichenfolgendatentypen char, varchar, string, array, map<>, struct<> und row. Wenn Sie diesen Parameter auf 1 setzen, wird der Treiber gezwungen SQL_WCHAR und SQL_WVARCHAR Zeichenfolgendatentypen zu verwenden. Breite Zeichen und breite variable Zeichen werden verwendet, um sicherzustellen, dass Zeichen aus verschiedenen Sprachen korrekt gespeichert und abgerufen werden können.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
UseWCharForStringTypes Optional 0 UseWCharForStringTypes=1;

Externe Kataloge abfragen

Gibt an, ob der Treiber externe Kataloge von Athena abfragen muss. Weitere Informationen finden Sie unter Migration zum ODBC-Treiber 2.x.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
QueryExternalCatalogs Optional 0 QueryExternalCatalogs=1;

SSL verifizieren

Steuert, ob SSL-Zertifikate verifiziert werden sollen, wenn Sie das AWS-SDK verwenden. Dieser Wert wird an den ClientConfiguration.verifySSL-Parameter übergeben. Weitere Informationen finden Sie unter AWS-Client-Konfiguration im Entwicklerhandbuch für AWS SDK für C++.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
VerifySSL Optional 1 VerifySSL=0;

Größe des S3-Ergebnisblocks

Gibt die Größe des Blocks in Byte an, der für eine einzelne S3-GetObject-API-Anfrage von Amazon S3 heruntergeladen werden soll. Der Standardwert ist 67 108 864 (64 MB). Die zulässigen Mindest- und Höchstwerte sind 10 485 760 (10 MB) und 2 146 435 072 (etwa 2 GB).

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
S3ResultBlockSize Optional 67108864 S3ResultBlockSize=268435456;

Länge der Zeichenfolgen-Spalte

Gibt die Spaltenlänge für Spalten mit dem string-Datentyp an. Da Athena den Apache Hive-Zeichenfolgendatentyp verwendet, für den es keine definierte Genauigkeit gibt, ist die von Athena gemeldete Standardlänge 2147483647 (INT_MAX). Da BI-Tools normalerweise Speicher für Spalten vorab zuweisen, kann dies zu einem hohen Speicherverbrauch führen. Um dies zu vermeiden, begrenzt der Athena ODBC-Treiber die angegebene Genauigkeit für Spalten des string-Datentyps und macht den StringColumnLength-Verbindungsparameter sichtbar, sodass der Standardwert geändert werden kann.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
StringColumnLength Optional 255 StringColumnLength=65535;

Spaltenlänge eines komplexen Typs

Gibt die Spaltenlänge für Spalten mit komplexen Datentypen wie map, struct und array an. Wie StringColumnLength meldet Athena eine Genauigkeit von 0 für Spalten mit komplexen Datentypen. Der Athena ODBC-Treiber legt die Standardgenauigkeit für Spalten mit komplexen Datentypen fest und macht den ComplexTypeColumnLength-Verbindungsparameter sichtbar, sodass der Standardwert geändert werden kann.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
ComplexTypeColumnLength Optional 65535 ComplexTypeColumnLength=123456;

Vertrauenswürdiges CA-Zertifikat

Weist den HTTP-Client an, wo er den Vertrauensspeicher für Ihr SSL-Zertifikat findet. Dieser Wert wird an den ClientConfiguration.caFile-Parameter übergeben. Weitere Informationen finden Sie unter AWS-Client-Konfiguration im Entwicklerhandbuch für AWS SDK für C++.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
TrustedCerts Optional %INSTALL_PATH%/bin TrustedCerts=C:\\Program Files\\Amazon Athena ODBC Driver\\bin\\cacert.pem;

Minimaler Abfragezeitraum

Gibt den Mindestwert in Millisekunden an, der gewartet werden muss, bevor Athena den Status der Abfrageausführung abfragt.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
MinQueryExecutionPollingInterval Optional 100 MinQueryExecutionPollingInterval=200;

Maximaler Abfragezeitraum

Gibt den Höchstwert in Millisekunden an, der gewartet werden muss, bevor Athena den Status der Abfrageausführung abfragt.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
MaxQueryExecutionPollingInterval Optional 60000 MaxQueryExecutionPollingInterval=1000;

Multiplikator für Abfragen

Gibt den Faktor für die Verlängerung des Abfragezeitraums an. Standardmäßig beginnt die Abfrage mit dem Wert für den minimalen Abfragezeitraum und verdoppelt sich bei jeder Abfrage, bis der Wert für den maximalen Abfragezeitraum erreicht ist.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
QueryExecutionPollingIntervalMultiplier Optional 2 QueryExecutionPollingIntervalMultiplier=2;

Max. Abfragedauer

Gibt den Höchstwert in Millisekunden an, den ein Treiber bei Athena für den Abfrageausführungsstatus abfragen kann.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
MaxPollDuration Optional 1800000 MaxPollDuration=1800000;

Verbindungstimeout

Die Zeit (in Millisekunden), die die HTTP-Verbindung wartet, um eine Verbindung herzustellen. Dieser Wert ist für den ClientConfiguration.connectTimeoutMs-Athena-Client festgelegt. Wenn nichts angegeben ist, wird der Standardwert verwendet. Weitere Informationen zu Verbindungsparametern finden Sie unter Client-Konfiguration im AWS SDK für Java-Entwicklerhandbuch.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
ConnectionTimeout Optional 0 ConnectionTimeout=2000;

Anforderungs-Timeout

Gibt das Socket-Lese-Timeout für HTTP-Clients an. Dieser Wert ist für den ClientConfiguration.requestTimeoutMs-Parameter des Athena-Clients festgelegt. Weitere Informationen finden Sie unter Client-Konfiguration im Entwicklerhandbuch für AWS SDK für Java.

Name der Verbindungszeichenfolge Parametertyp Standardwert Beispiel für Verbindungszeichenfolgen
RequestTimeout Optional 10000 RequestTimeout=30000;