從 Pendo 實體中讀取 - AWS Glue

從 Pendo 實體中讀取

先決條件

您要從中讀取的 Pendo 物件。請參閱以下支援的實體表格,以檢查可用實體。

支援的實體

實體 可以篩選 支援限制 支援排序依據 支援選取 * 支援分區
功能
指南
頁面
報告
報告資料
訪客 (彙總 API)
帳戶 (彙總 API)
事件 (彙總 API)
特徵事件 (彙總 API)
指南事件 (彙總 API)
帳戶 (彙總 API)
頁面事件 (彙總 API)
輪詢事件 (彙總 API)
追蹤事件 (彙總 API)

範例

Pendo_read = glueContext.create_dynamic_frame.from_options( connection_type="glue.spark.Pendo", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "feature", "API_VERSION": "v1", "INSTANCE_URL": "instanceUrl" }

分區查詢

如果想要在 Spark 中使用並行,可以提供其他 Spark 選項 PARTITION_FIELDLOWER_BOUNDUPPER_BOUNDNUM_PARTITIONS。使用這些參數,原始查詢會分區為可由 Spark 任務並行執行的子查詢的 NUM_PARTITIONS 數目。

  • PARTITION_FIELD:用來分區查詢的欄位名稱。

  • LOWER_BOUND:所選分區欄位的包含下限值。

    對於 DateTime 欄位,接受 ISO 格式的值。

    有效值範例:

    "2024-07-01T00:00:00.000Z"
  • UPPER_BOUND:所選分區欄位的唯一上限值。

  • NUM_PARTITIONS:分區數目。

下表說明實體分區欄位支援詳細資訊:

實體名稱
事件

特徵事件

指南事件
頁面事件
輪詢事件
追蹤事件

範例:

pendo_read = glueContext.create_dynamic_frame.from_options( connection_type="glue.spark.pendo", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "event", "API_VERSION": "v1", "INSTANCE_URL": "instanceUrl" "NUM_PARTITIONS": "10", "PARTITION_FIELD": "appId" "LOWER_BOUND": "4656" "UPPER_BOUND": "7788" }