Lettura da entità di Google Sheets - AWS Glue

Lettura da entità di Google Sheets

Prerequisiti

  • Un foglio di calcolo Google da cui si desidera leggere. Avrai bisogno dell'ID del foglio di calcolo e del tabName.

Dettagli sull'entità e sul campo di Google Sheets:

Entità Tipo di dati Operatori supportati
Foglio di calcolo Stringa N/A (il filtro non è supportato)

Esempio

googleSheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4" }

Query di partizionamento

Solo per Record Base Partitioning, se desideri utilizzare la concorrenza in Spark, NUM_PARTITIONS può essere fornito come opzioni aggiuntive. Con questo parametro, la query originale viene suddivisa in NUM_PARTITIONS query secondarie che possono essere eseguite contemporaneamente dalle attività Spark.

Esempio con NUM_PARTITIONS

googlesheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4", "NUM_PARTITIONS": "10" }