Lesen aus Pendo-Entitäten - AWS Glue

Lesen aus Pendo-Entitäten

Voraussetzungen

Ein Pendo-Objekt, aus dem gelesen werden soll. In der folgenden Tabelle mit unterstützten Entitäten können Sie die verfügbaren Entitäten überprüfen.

Unterstützte Entitäten

Entität Kann gefiltert werden Unterstützt Limit Unterstützt „Sortieren nach“ Unterstützt „* auswählen“ Unterstützt Partitionierung
Funktion Nein Nein Nein Ja Nein
Richtlinie Nein Nein Nein Ja Nein
Seite Nein Nein Nein Ja Nein
Bericht Nein Nein Nein Ja Nein
Berichtdaten Nein Nein Nein Ja Nein
Besucher (Aggregation-API) Ja Nein Ja Ja Nein
Konto (Aggregation-API) Ja Nein Ja Ja Nein
Ereignis (Aggregation-API) Ja Nein Ja Ja Nein
Feature-Ereignis (Aggregation-API) Ja Nein Ja Ja Ja
Handbuchereignis (Aggregation-API) Ja Nein Ja Ja Ja
Konto (Aggregation-API) Ja Nein Ja Ja Ja
Seitenereignis (Aggregation-API) Ja Nein Ja Ja Ja
Umfrageereignis (Aggregation-API) Ja Nein Ja Ja Ja
Verfolgungsereignis (Aggregation-API) Ja Nein Ja Ja Ja

Beispiel

Pendo_read = glueContext.create_dynamic_frame.from_options( connection_type="glue.spark.Pendo", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "feature", "API_VERSION": "v1", "INSTANCE_URL": "instanceUrl" }

Partitionierung von Abfragen

Sie können die zusätzlichen Spark-Optionen PARTITION_FIELD,LOWER_BOUND, UPPER_BOUND und NUM_PARTITIONS angeben, wenn Sie Parallelität in Spark nutzen möchten. Mit diesen Parametern würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

  • PARTITION_FIELD: der Name des Feldes, das zur Partitionierung der Abfrage verwendet werden soll.

  • LOWER_BOUND: ein inklusiver Untergrenzwert des ausgewählten Partitionsfelds.

    Für das DateTime-Feld akzeptieren wir den Wert im ISO-Format.

    Beispiel für gültigen Wert:

    "2024-07-01T00:00:00.000Z"
  • UPPER_BOUND: ein exklusiver Obergrenzwert des ausgewählten Partitionsfelds.

  • NUM_PARTITIONS: die Anzahl der Partitionen.

In der folgenden Tabelle sind Details zur Unterstützung der Partitionierung von Entitäten beschrieben:

Entity-Name
Ereignis

Feature-Ereignis

Handbuchereignis
Seitenereignis
Umfrageereignis
Verfolgungsereignis

Beispiel:

pendo_read = glueContext.create_dynamic_frame.from_options( connection_type="glue.spark.pendo", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "event", "API_VERSION": "v1", "INSTANCE_URL": "instanceUrl" "NUM_PARTITIONS": "10", "PARTITION_FIELD": "appId" "LOWER_BOUND": "4656" "UPPER_BOUND": "7788" }