本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
为查询和作业创建协作
在此过程中,您作为协作创建者将执行以下任务:
-
创建协作。
-
为成员分配权限,例如可以运行查询和作业的成员以及可以接收结果的成员。
如果协作创建者也是可以接收结果的成员,则他们会指定结果的目的地和格式。他们还提供服务角色 Amazon 资源名称 (ARN),用于将结果写入结果目的地。
-
配置哪位成员负责支付协作中的查询和作业计算费用。
在开始之前,请确保您已完成以下先决条件:
-
您拥有要邀请参与合作的每位成员的姓名和 AWS 账户 ID。
-
您有权与协作的所有成员共享每个成员的姓名和 AWS 账户 ID。
注意
创建协作后,您无法添加更多成员。
有关如何使用创建协作的信息 AWSSDKs,请参阅 AWS Clean RoomsAPI 参考。
为查询和作业创建协作
-
登录AWS 管理控制台并使用将充当协作创建者的AWS Clean Rooms控制台
打开控制台。AWS 账户 -
在左侧导航窗格中,选择协作。
-
在右上角,选择创建协作。
-
对于步骤 1: 定义协作,请执行以下操作:
-
在详细信息中,输入协作的名称和描述。
受邀参与协作的协作成员将可以看到这些信息。名称和描述可帮助他们了解协作的意义。
-
对于成员:
-
对于成员 1: 您,输入您希望在协作中显示的成员显示名称。
注意
会员 AWS 账户 ID 会自动包含您的 AWS 账户 ID。
-
在 “成员 2” 中,输入要邀请参与协作的成员的成员显示名称和成员 AWS 账户ID。
所有受邀参与协作的人都可以看到成员显示名称和成员 AWS 账户 ID。输入并保存这些字段的值后将不可编辑这些值。
注意
您必须告知协作成员,协作中所有受邀和活跃的协作者都将看到他们的成员 AWS 账户 ID 和成员显示名称。
-
如果要添加其他成员,请选择添加其他成员。然后,为每位成员输入成员的显示名称和成员 AWS 账户 ID,他们可以提供您想邀请参与协作的数据。
-
-
如果要启用分析日志记录,请选中启用分析日志记录复选框,然后选择支持的日志类型。
-
如果要接收从 SQL 查询生成的日志,请选中 “来自查询的日志” 复选框。
-
如果要使用接收作业生成的日志 PySpark,请选中 “来自作业的日志” 复选框。
-
-
如果要启用详细监控,请选中 “启用详细监控” 复选框。
分析运行者和配置的付款人可以在创建成员资格时选择启用详细指标。启用后,将发布详细的监控指标, CloudWatch 用于对协作进行运营监控,包括查询性能和资源利用率。这些指标将在各自的版本中提供给分析运行者和配置的付款AWS 账户人。
有关 CloudWatch 定价的更多信息,请参阅CloudWatch 定价
。 -
在 “允许的查询结果区域” 下,选择一个或多个要将查询结果发送到AWS 区域的位置。
默认情况下,仅选择当前区域(例如弗吉尼亚北部 us-east-1)。
重要
启用跨区域查询结果交付后,您的结果可能会在来源区域之外进行处理和存储。
有关区域的更多信息,请参阅中的区域和终端节点AWS 一般参考。
-
(可选)通过配置无需手动批准变更请求即可自动更改哪些设置,通过自动更改请求批准来管理对数据的访问权限。默认情况下,某些设置只能通过提交变更请求来更改,变更请求必须得到所有成员的批准才能生效。
-
授予成员能力-选择无需手动批准即可授予协作成员的能力。成员可以随时贡献数据。
-
选择技能:
-
贡献数据(始终启用)
-
接收结果
-
-
自动批准具有这些能力的新成员-如果允许,任何添加了上述所选能力的成员都将立即加入协作。添加了其他技能的成员仍需要手动批准才能加入。
-
-
可以自动撤消的技能-选择无需手动批准即可撤消的技能。成员可以随时贡献数据。
-
选择技能:
-
贡献数据(始终启用)
-
接收结果
-
-
如果选择此选项,则可以通过协作详细信息页面的详细信息选项卡上的更改请求历史记录来跟踪所有协作配置的修改。
-
-
(可选)如果要启用加密计算功能,请选中 “启用加密计算” 复选框。
-
选择以下加密覆盖率参数:
-
允许 plaintext 列
如果您需要完全加密的表,请选择 “否”。
如果您希望在加密表中允许 cleartext 列,请选择是。
要在特定列上运行 SUM 或 AVG,这些列必须是 cleartext。
-
保留 NULL 值
如果您不希望保留 NULL 值,请选择否。NULL 值不会在加密表中显示为 NULL。
如果您希望保留 NULL 值,请选择是。NULL 值将在加密表中显示为 NULL。
-
-
选择以下指纹识别参数:
-
允许重复
如果您不希望 fingerprint 列中允许重复条目,请选择否。
如果您希望 fingerprint 列中允许重复条目,请选择是。
-
允许对具有不同名称的列进行 JOIN
如果您不希望对具有不同名称的 fingerprint 列进行联接,请选择否。
如果您希望对具有不同名称的 fingerprint 列进行联接,请选择是。
-
有关加密计算参数的更多信息,请参阅加密计算参数。
有关如何加密数据以便在中使用的更多信息AWS Clean Rooms,请参阅使用加密计算准备加密数据表 Clean Rooms。
注意
在完成下一步之前,请仔细验证这些配置。创建协作后,您只能编辑协作名称、描述以及日志是否存储在 Amazon Lo CloudWatch gs 中。
-
-
如果要为协作资源启用标签,请选择添加新标签,然后输入键和值对。
-
选择下一步。
-
-
对于 “步骤 2:指定成员能力”,请执行以下操作:
-
对于使用查询和作业进行分析,在支持的分析类型下,选择作业复选框。
默认情况下,“查询” 复选框处于选中状态。
-
从下拉列表中选择可以运行查询和作业的成员。
-
从下拉列表中选择可以从分析中接收结果的成员。
注意
创建 PySpark 分析模板的成员也必须是接收结果的成员。
-
-
如果您使用的是Clean Rooms ML,则使用专门构建的工作流程进行机器学习建模,
-
(可选)从下拉列表中选择可以从经过训练的模型接收输出的成员。
-
(可选)从下拉列表中选择可以从模型推理中接收输出的成员。
-
-
使用查看 ID 解析下的成员能力AWS Entity Resolution 数据匹配服务。
-
选择下一步。
-
-
对于第 3 步:配置付款,
-
对于使用查询和作业进行分析,请选择将为查询和工作付费的成员。
您可以将可以运行查询和作业的成员指定为支付查询和作业计算成本的成员。
您可以分配其他成员来支付查询费用和任务计算费用。
-
对于使用专门构建的工作流程进行机器学习建模,配置的相似模型的创建者是将为相似建模付费的成员。
-
对于 ID 解析AWS Entity Resolution 数据匹配服务,ID 映射表的创建者是将为 ID 映射表付费的成员。
-
选择下一步。
-
-
对于 “步骤 4:配置成员资格”,请选择以下选项之一:
-
对于 “步骤 5:查看并创建”,请执行以下操作:
-
查看您在之前的步骤中所做的选择,并在必要时进行编辑。
-
从以下选项中选择一个。
如果您选择了... 则选择... 同步创建成员身份和协作(是,立即通过创建成员身份来加入) 创建协作和成员身份 创建协作,此时不创建成员身份(不,我将稍后创建成员身份) 创建协作
-
成功创建协作后,您可以在协作下看到协作详细信息页面。
您现在已准备好执行以下操作:
-
准备好要分析的数据表AWS Clean Rooms。(如果您想分析自己的事件数据或要查询身份数据,则可选。)
-
将配置表与协作关联。(如果您想分析自己的事件数据,则可选。)
-
为配置表添加分析规则。(如果您想分析自己的事件数据,则可选。)
-
创建成员身份并加入协作。(如果您已经创建了成员身份,则是可选的。)