從 Pendo 實體中讀取
先決條件
您要從中讀取的 Pendo 物件。請參閱以下支援的實體表格,以檢查可用實體。
支援的實體
| 實體 | 可以篩選 | 支援限制 | 支援排序依據 | 支援選取 * | 支援分區 |
|---|---|---|---|---|---|
| 功能 | 否 | 否 | 否 | 是 | 否 |
| 指南 | 否 | 否 | 否 | 是 | 否 |
| 頁面 | 否 | 否 | 否 | 是 | 否 |
| 報告 | 否 | 否 | 否 | 是 | 否 |
| 報告資料 | 否 | 否 | 否 | 是 | 否 |
| 訪客 (彙總 API) | 是 | 否 | 是 | 是 | 否 |
| 帳戶 (彙總 API) | 是 | 否 | 是 | 是 | 否 |
| 事件 (彙總 API) | 是 | 否 | 是 | 是 | 否 |
| 特徵事件 (彙總 API) | 是 | 否 | 是 | 是 | 是 |
| 指南事件 (彙總 API) | 是 | 否 | 是 | 是 | 是 |
| 帳戶 (彙總 API) | 是 | 否 | 是 | 是 | 是 |
| 頁面事件 (彙總 API) | 是 | 否 | 是 | 是 | 是 |
| 輪詢事件 (彙總 API) | 是 | 否 | 是 | 是 | 是 |
| 追蹤事件 (彙總 API) | 是 | 否 | 是 | 是 | 是 |
範例
Pendo_read = glueContext.create_dynamic_frame.from_options( connection_type="glue.spark.Pendo", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "feature", "API_VERSION": "v1", "INSTANCE_URL": "instanceUrl" }
分區查詢
如果想要在 Spark 中使用並行,可以提供其他 Spark 選項 PARTITION_FIELD、LOWER_BOUND、UPPER_BOUND 和 NUM_PARTITIONS。使用這些參數,原始查詢會分區為可由 Spark 任務並行執行的子查詢的 NUM_PARTITIONS 數目。
PARTITION_FIELD:用來分區查詢的欄位名稱。LOWER_BOUND:所選分區欄位的包含下限值。對於 DateTime 欄位,接受 ISO 格式的值。
有效值範例:
"2024-07-01T00:00:00.000Z"UPPER_BOUND:所選分區欄位的唯一上限值。NUM_PARTITIONS:分區數目。
下表說明實體分區欄位支援詳細資訊:
| 實體名稱 |
|---|
| 事件 |
|
特徵事件 |
| 指南事件 |
| 頁面事件 |
| 輪詢事件 |
| 追蹤事件 |
範例:
pendo_read = glueContext.create_dynamic_frame.from_options( connection_type="glue.spark.pendo", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "event", "API_VERSION": "v1", "INSTANCE_URL": "instanceUrl" "NUM_PARTITIONS": "10", "PARTITION_FIELD": "appId" "LOWER_BOUND": "4656" "UPPER_BOUND": "7788" }