从 Slack 实体中读取 - AWS Glue

从 Slack 实体中读取

先决条件

  • 您要从中读取内容的 Slack 对象。

支持的实体

实体 可以筛选 支持限制 支持排序依据 支持 Select * 支持分区
对话 支持

示例

slack_read = glueContext.create_dynamic_frame.from_options( connection_type="slack", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "conversations/C058W38R5J8" } )

Slack 实体和字段详细信息

实体 字段 数据类型 支持的运算符
对话attachments列表NA
对话bot_id字符串NA
对话blocks列表NA
对话client_msg_id字符串NA
对话is_starred布尔值NA
对话last read字符串NA
对话latest_reply字符串NA
对话reactions列表NA
对话replies列表NA
对话reply_count整数NA
对话reply_users列表NA
对话reply_users_count整数NA
对话subscribed布尔值NA
对话subtype字符串NA
对话文本字符串NA
对话team字符串NA
对话thread_ts字符串NA
对话ts字符串EQUAL_TO, BETWEEN, LESS_THAN, LESS_THAN_OR_EQUAL_TO, GREATER_THAN, GREATER_THAN_OR_EQUAL_TO
对话type字符串NA
对话用户字符串NA
对话inviter字符串NA
对话root结构体NA
对话is_locked布尔值NA
对话文件列表NA
对话房间结构体NA
对话上传布尔值NA
对话display_as_bot布尔值NA
对话渠道字符串NA
对话no_notifications布尔值NA
对话permalink字符串NA
对话pinned_to列表NA
对话pinned_info结构体NA
对话edited结构体NA
对话app_id字符串NA
对话bot_profile结构体NA
对话metadata结构体NA

对查询进行分区

如果您想在 Spark 中利用并发,可以提供附加 Spark 选项 PARTITION_FIELDLOWER_BOUNDUPPER_BOUNDNUM_PARTITIONS。使用这些参数,原始查询将被拆分为 NUM_PARTITIONS 个子查询,这些子查询可以由 Spark 任务同时执行。

  • PARTITION_FIELD:用于对查询进行分区的字段的名称。

  • LOWER_BOUND:所选分区字段的包含下限值。

    对于日期,我们接受 Spark SQL 查询中使用的 Spark 日期格式。有效值示例:"2024-07-01T00:00:00.000Z"

  • UPPER_BOUND:所选分区字段的排除上限值。

  • NUM_PARTITIONS:分区的数量。

基于实体的分区字段支持详细信息如下表中所示。

实体名称 分区字段 数据类型
对话 ts 字符串

示例

slack_read = glueContext.create_dynamic_frame.from_options( connection_type="slack", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "conversations/C058W38R5J8", "PARTITION_FIELD": "ts" "LOWER_BOUND": "2022-12-01T00:00:00.000Z" "UPPER_BOUND": "2024-09-23T15:00:00.000Z" "NUM_PARTITIONS": "2" } )