Lesen aus Okta-Entitäten - AWS Glue

Lesen aus Okta-Entitäten

Voraussetzungen

  • Ein Okta-Objekt, aus dem gelesen werden soll. In der folgenden Tabelle mit unterstützten Entitäten können Sie die verfügbaren Entitäten überprüfen.

Unterstützte Entitäten

Entität Kann gefiltert werden Unterstützt Limit Unterstützt „Sortieren nach“ Unterstützt „* auswählen“ Unterstützt Partitionierung
Anwendungen Ja Ja Nein Ja Nein
Geräte Ja Ja Nein Ja Ja
Gruppen Ja Ja Ja Ja Ja
Benutzer Ja Ja Ja Ja Ja
Benutzertypen Nein Nein Nein Ja Nein

Beispiel

okta_read = glueContext.create_dynamic_frame.from_options( connection_type="Okta", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "applications", "API_VERSION": "v1" }

Okta-Entitäts- und Felddetails

Liste der Entitäten:

Partitionierung von Abfragen

Die zusätzlichen Spark-Optionen PARTITION_FIELD,LOWER_BOUND, UPPER_BOUND und NUM_PARTITIONS können angegeben werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesen Parametern würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

  • PARTITION_FIELD: der Name des Feldes, das zur Partitionierung der Abfrage verwendet werden soll.

  • LOWER_BOUND: ein inklusiver Untergrenzwert des ausgewählten Partitionsfelds.

    Als Datum akzeptieren wir das Spark-Datumsformat, das in Spark-SQL-Abfragen verwendet wird. Beispiel für gültige Werte: "2024-02-06".

  • UPPER_BOUND: ein exklusiver Obergrenzwert des ausgewählten Partitionsfelds.

  • NUM_PARTITIONS: Anzahl der Partitionen.

Beispiel

okta_read = glueContext.create_dynamic_frame.from_options( connection_type="okta", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "lastUpdated", "API_VERSION": "v1", "PARTITION_FIELD": "lastMembershipUpdated" "LOWER_BOUND": "2022-08-10T10:28:46.000Z" "UPPER_BOUND": "2024-08-10T10:28:46.000Z" "NUM_PARTITIONS": "10" }