Aus Google-Sheets-Entitäten lesen - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aus Google-Sheets-Entitäten lesen

Voraussetzungen

  • Eine Google-Tabelle, aus der gelesen werden soll. Sie benötigen die SpreadSheet-ID und den tabName der Tabelle.

Google-Sheets-Entitäts- und Felddetails

Entität Datentyp Unterstützte Operatoren
Tabellenkalkulation String n. v. (Filter wird nicht unterstützt)

Beispiel

googleSheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4" }

Partitionierung von Abfragen

Nur für die Partitionierung auf Datensatzbasis kann NUM_PARTITIONS als zusätzliche Spark-Optionen bereitgestellt werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesem Parameter würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

Beispiel mit NUM_PARTITIONS

googlesheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4", "NUM_PARTITIONS": "10" }