Lesen aus Entitäten von Google Analytics 4 - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Lesen aus Entitäten von Google Analytics 4

Voraussetzungen

  • Ein Objekt in Google Analytics 4, aus dem gelesen werden soll. In der folgenden Tabelle mit unterstützten Entitäten können Sie die verfügbaren Entitäten überprüfen.

Unterstützte Entitäten

Entität Kann gefiltert werden Unterstützt Limit Unterstützt „Sortieren nach“ Unterstützt „* auswählen“ Unterstützt Partitionierung
Echtzeitbericht Ja Ja Ja Ja Nein
Grundlegender Bericht Ja Ja Ja Ja Ja

Beispiel

googleAnalytics4_read = glueContext.create_dynamic_frame.from_options( connection_type="GoogleAnalytics4", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "entityName", "API_VERSION": "v1beta" }

Entitäts- und Felddetails von Google Analytics 4

Entität Feld Datentyp Unterstützte Operatoren
Grundlegender Bericht Dynamische Felder
Grundlegender Bericht Dimensionsfelder Zeichenfolge LIKE, =
Grundlegender Bericht Dimensionsfelder Date LIKE, =
Grundlegender Bericht Metrikfelder Zeichenfolge >, <, >=, <=, = BETWEEN
Grundlegender Bericht Felder für benutzerdefinierte Dimensionen und benutzerdefinierte Metriken Zeichenfolge N/A
Echtzeitbericht appVersion Zeichenfolge LIKE, =
Echtzeitbericht audienceId Zeichenfolge LIKE, =
Echtzeitbericht audienceName Zeichenfolge LIKE, =
Echtzeitbericht city Zeichenfolge LIKE, =
Echtzeitbericht cityId Zeichenfolge LIKE, =
Echtzeitbericht country Zeichenfolge LIKE, =
Echtzeitbericht countryId Zeichenfolge LIKE, =
Echtzeitbericht deviceCategory Zeichenfolge LIKE, =
Echtzeitbericht eventName Zeichenfolge LIKE, =
Echtzeitbericht minutesAgo Zeichenfolge LIKE, =
Echtzeitbericht platform Zeichenfolge LIKE, =
Echtzeitbericht streamId Zeichenfolge LIKE, =
Echtzeitbericht streamName Zeichenfolge LIKE, =
Echtzeitbericht unifiedScreenName Zeichenfolge LIKE, =
Echtzeitbericht activeUsers Zeichenfolge >, <, >=, <=, = BETWEEN
Echtzeitbericht Konversionen Zeichenfolge >, <, >=, <=, = BETWEEN
Echtzeitbericht eventCount Zeichenfolge >, <, >=, <=, = BETWEEN
Echtzeitbericht screenPageViews Zeichenfolge >, <, >=, <=, = BETWEEN

Partitionierung von Abfragen

  1. Filterbasierte Partition

    Die zusätzlichen Spark-Optionen PARTITION_FIELD,LOWER_BOUND, UPPER_BOUND und NUM_PARTITIONS können angegeben werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesen Parametern würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

    • PARTITION_FIELD: der Name des Feldes, das zur Partitionierung der Abfrage verwendet werden soll.

    • LOWER_BOUND: ein inklusiver Untergrenzwert des ausgewählten Partitionsfelds.

      Als Datum akzeptieren wir das Spark-Datumsformat, das in Spark-SQL-Abfragen verwendet wird. Beispiel für gültige Werte: "2024-02-06".

    • UPPER_BOUND: ein exklusiver Obergrenzwert des ausgewählten Partitionsfelds.

    • NUM_PARTITIONS: Anzahl der Partitionen.

    Beispiel

    googleAnalytics4_read = glueContext.create_dynamic_frame.from_options( connection_type="GoogleAnalytics4", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "entityName", "API_VERSION": "v1beta", "PARTITION_FIELD": "date" "LOWER_BOUND": "2022-01-01" "UPPER_BOUND": "2024-01-02" "NUM_PARTITIONS": "10" }
  2. Datensatzbasierte Partition:

    Die zusätzlichen Spark-Optionen NUM_PARTITIONS können angegeben werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesen Parametern würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

    • NUM_PARTITIONS: Anzahl der Partitionen.

    Beispiel

    googleAnalytics4_read = glueContext.create_dynamic_frame.from_options( connection_type="GoogleAnalytics4", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "entityName", "API_VERSION": "v1beta", "NUM_PARTITIONS": "10" }