Aus Google-Sheets-Entitäten lesen

Voraussetzungen

Ein Google SpreadSheet , von dem Sie gerne lesen würden. Sie benötigen die SpreadSheet ID und den TabNamen der Tabelle.

Google-Sheets-Entitäts- und Felddetails

Entität	Datentyp	Unterstützte Operatoren
Tabellenkalkulation	Zeichenfolge	n. v. (Filter wird nicht unterstützt)

Beispiel


googleSheets_read = glueContext.create_dynamic_frame.from_options(
    connection_type="googlesheets",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
        "API_VERSION": "v4"
    }

Partitionierung von Abfragen

Nur für die Partitionierung auf Datensatzbasis kann NUM_PARTITIONS als zusätzliche Spark-Optionen bereitgestellt werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesem Parameter würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

Beispiel mit NUM_PARTITIONS


googlesheets_read = glueContext.create_dynamic_frame.from_options(
    connection_type="googlesheets",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
        "API_VERSION": "v4",
        "NUM_PARTITIONS": "10"
    }

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Konfigurieren von Google-Sheets-Verbindungen

Verbindungsoptionen für Google Sheets