Lecture à partir d’entités Google Sheets

Conditions préalables

Un Google SpreadSheet que vous aimeriez lire. Vous aurez besoin de l' SpreadSheet ID et du TabName de la feuille de calcul.

Détails des entités et des champs Google Sheets :

Entité	Type de données	Opérateurs pris en charge
Feuille de calcul	String	N/A (le filtre n’est pas pris en charge)

Exemple


googleSheets_read = glueContext.create_dynamic_frame.from_options(
    connection_type="googlesheets",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
        "API_VERSION": "v4"
    }

Requêtes de partitionnement

Pour Record Base Partitioning uniquement, vous pouvez fournir NUM_PARTITIONS en tant qu’options Spark supplémentaires si vous souhaitez utiliser la simultanéité dans Spark. Avec ce paramètre, la requête d’origine serait divisée en NUM_PARTITIONS nombres de sous-requêtes pouvant être exécutées simultanément par les tâches Spark.

Exemple avec NUM_PARTITIONS


googlesheets_read = glueContext.create_dynamic_frame.from_options(
    connection_type="googlesheets",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}",
        "API_VERSION": "v4",
        "NUM_PARTITIONS": "10"
    }

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration des connexions Google Sheets

Options de connexion Google Sheets