Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Aus Salesforce lesen
Voraussetzung
Ein Salesforce-sObject, aus dem Sie lesen möchten. Sie benötigen den Objektnamen wie Account
oder oderCase
. Opportunity
Beispiel:
salesforce_read = glueContext.create_dynamic_frame.from_options( connection_type="salesforce", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "Account", "API_VERSION": "v60.0" }
Abfragen partitionieren
Sie können die zusätzlichen Spark-OptionenPARTITION_FIELD
,LOWER_BOUND
, und angebenUPPER_BOUND
, NUM_PARTITIONS
ob Sie Parallelität in Spark nutzen möchten. Mit diesen Parametern würde die ursprüngliche Abfrage in eine NUM_PARTITIONS
Reihe von Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.
PARTITION_FIELD
: der Name des Feldes, das zur Partitionierung der Abfrage verwendet werden soll.LOWER_BOUND
: ein inklusiver Untergrenzwert des ausgewählten Partitionsfeldes.Für Datums- oder Timestamp-Felder akzeptiert der Konnektor das Spark-Zeitstempelformat, das in Spark-SQL-Abfragen verwendet wird.
Beispiele für gültige Werte:
"TIMESTAMP \"1707256978123\"" "TIMESTAMP '2018-01-01 00:00:00.000 UTC'" "TIMESTAMP \"2018-01-01 00:00:00 Pacific/Tahiti\"" "TIMESTAMP \"2018-01-01 00:00:00\"" "TIMESTAMP \"-123456789\" Pacific/Tahiti" "TIMESTAMP \"1702600882\""
UPPER_BOUND
: ein exklusiver Obergrenzwert des ausgewählten Partitionsfeldes.NUM_PARTITIONS
: die Anzahl der Partitionen.-
TRANSFER_MODE
: unterstützt zwei Modi:SYNC
undASYNC
. Der Standardwert istSYNC
. Wenn diese Option auf gesetzt istASYNC
, wird die Bulk-API 2.0-Abfrage für die Verarbeitung verwendet.
Beispiel:
salesforce_read = glueContext.create_dynamic_frame.from_options( connection_type="salesforce", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "Account", "API_VERSION": "v60.0", "PARTITION_FIELD": "SystemModstamp", "LOWER_BOUND": "TIMESTAMP '2021-01-01 00:00:00 Pacific/Tahiti'", "UPPER_BOUND": "TIMESTAMP '2023-01-10 00:00:00 Pacific/Tahiti'", "NUM_PARTITIONS": "10", "TRANSFER_MODE": "ASYNC" }