Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Aus Google-Sheets-Entitäten lesen
Voraussetzungen
-
Eine Google-Tabelle, aus der gelesen werden soll. Sie benötigen die SpreadSheet-ID und den tabName der Tabelle.
Google-Sheets-Entitäts- und Felddetails
| Entität | Datentyp | Unterstützte Operatoren |
|---|---|---|
| Tabellenkalkulation | String | n. v. (Filter wird nicht unterstützt) |
Beispiel
googleSheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4" }
Partitionierung von Abfragen
Nur für die Partitionierung auf Datensatzbasis kann NUM_PARTITIONS als zusätzliche Spark-Optionen bereitgestellt werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesem Parameter würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.
Beispiel mit NUM_PARTITIONS
googlesheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4", "NUM_PARTITIONS": "10" }