

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 为 ML 建模创建协作模式
<a name="create-collab-ml-modeling"></a>

在此过程中，您作为[协作创建者](glossary.md#glossary-collaboration-creator)将执行以下任务：
+ [创建协作](create-collaboration.md)。
+ 邀请一个或多个[成员](glossary.md#glossary-member)加入协[作](glossary.md#glossary-collaboration)。
+ 为成员分配能力，例如 
  + [可以查询的会员](glossary.md#glossary-member-who-can-query)
  + [可以收到结果的会员](glossary.md#glossary-member-who-can-receive-results)
  + 可以从经过训练的模型中接收输出结果的成员
  + 可以从模型推理中输出结果的成员

  如果协作创建者也是可以接收结果的成员，则他们会指定结果的目的地和格式。他们还提供服务角色 Amazon 资源名称 (ARN)，用于将结果写入结果目的地。
+ 配置哪个[成员负责支付协作中的计算成本、模型训练和模型推理成本](glossary.md#glossary-member-paying-for-query-compute)。

在开始之前，请确保您已完成以下先决条件：
+ 您拥有要邀请参与合作的每位成员的姓名和 AWS 账户 ID。
+ 您有权与协作的所有成员共享每个成员的姓名和 AWS 账户 ID。
**注意**  
创建协作后，您无法添加更多成员。

有关如何使用创建协作的信息 AWS SDKs，请参阅 *[AWS Clean Rooms API 参考](https://docs.aws.amazon.com/clean-rooms/latest/apireference/Welcome.html)*。

**为机器学习建模创建协作模式**

1. 登录 AWS 管理控制台 并使用将充当协作创建者的[AWS Clean Rooms 控制台](https://console.aws.amazon.com/cleanrooms/home)打开控制台。 AWS 账户 

1. 在左侧导航窗格中，选择**协作**。

1. 在右上角，选择**创建协作**。

1. 对于**步骤 1: 定义协作**，请执行以下操作：

   1. 在**详细信息**中，输入协作的**名称**和**描述**。

      受邀参与协作的协作成员将可以看到这些信息。**名称**和**描述**可帮助他们了解协作的意义。

   1. 对于**成员**：

      1. 对于**成员 1: 您**，输入您希望在协作中显示的**成员显示名称**。
**注意**  
会**员 AWS 账户 ID 会自动包含您的 AWS 账户 ID**。

      1. 在 “**成员 2**” 中，输入要邀请参与协作的成员的成员**显示名称**和成员 ** AWS 账户 ID**。

         所有受邀参与协作的人都可以看到**成员显示名称**和**成员 AWS 账户 ID**。输入并保存这些字段的值后将不可编辑这些值。
**注意**  
您必须告知协作成员，协作中所有受邀和活跃的协作者都将看到他们的**成员 AWS 账户 ID** 和**成员显示名称**。

      1. 如果要添加其他成员，请选择**添加其他成员**。然后，为每位**成员输入成员的显示名称****和成员 AWS 账户 ID**，他们可以提供您想邀请参与协作的数据。

   1. 如果要启用 Analysis **日志记录**，请选中 “**启用分析日志记录**” 复选框，然后在 “**支持的日志类型**” 下选择 “**来自查询的日志**”。

   1. 如果要启用**详细监控**，请选中 “**启用详细监控**” 复选框。

      分析运行者和配置的付款人可以在创建成员资格时选择启用详细指标。启用后，将发布详细的监控指标， CloudWatch 用于对协作进行运营监控，包括查询性能和资源利用率。这些指标将在各自的版本中提供给分析运行者和配置的付款 AWS 账户人。

      有关 CloudWatch 定价的更多信息，请参阅[CloudWatch 定价](https://aws.amazon.com/cloudwatch/pricing/)。

   1. 在 “**允许的查询结果区域**” 下，选择一个或多个要将查询结果发送到 AWS 区域 的位置。

      默认情况下，仅选择当前区域（例如弗吉尼亚北部 us-east-1）。
**重要**  
启用跨区域查询结果交付后，您的结果可能会在来源区域之外进行处理和存储。

      有关区域的更多信息，请参阅中的[区域和终端节点*AWS 一般参考*](https://docs.aws.amazon.com/general/latest/gr/rande.html)。

   1. （可选）通过配置无需手动**批准变更请求即可自动更改**哪些设置，通过自动更改请求批准来管理对数据的访问权限。默认情况下，某些设置只能通过提交变更请求来更改，变更请求必须得到所有成员的批准才能生效。
      + **授予成员能力**-选择无需手动批准即可授予协作成员的能力。成员可以随时贡献数据。
        + 选择技能：
          + 贡献数据*（始终启用）*
          + 接收结果
        + **自动批准具有这些能力的新成员**-如果允许，任何添加了上述所选能力的成员都将立即加入协作。添加了其他技能的成员仍需要手动批准才能加入。
      + **可以自动撤消的技**能-选择无需手动批准即可撤消的技能。成员可以随时贡献数据。
        + 选择技能：
          + 贡献数据*（始终启用）*
          + 接收结果

      如果选择此选项，则可以通过协作详细信息页面的**详细信息**选项卡上的**更改请求历史记录**来跟踪所有协作配置的修改。

   1. （可选）如果要启用**加密计算功能，请选中 “**启用加密计算****” 复选框。

      1. 选择以下**加密覆盖率参数：**
         + **允许 plaintext 列**

           如果您需要完全加密的表，请选择 “**否**”。

           如果您希望在加密表中允许 cleartext 列，请选择**是**。

           要在特定列上运行 SUM 或 AVG，这些列必须是 cleartext。
         + **保留 NULL 值**

           如果您不希望保留 NULL 值，请选择**否**。NULL 值不会在加密表中显示为 NULL。

           如果您希望保留 NULL 值，请选择**是**。NULL 值将在加密表中显示为 NULL。

      1. 选择以下**指纹识别参数：**
         + **允许重复**

           如果您不希望 fingerprint 列中允许重复条目，请选择**否**。

           如果您希望 fingerprint 列中允许重复条目，请选择**是**。
         + **允许对具有不同名称的列进行 JOIN**

           如果您不希望对具有不同名称的 fingerprint 列进行联接，请选择**否**。

           如果您希望对具有不同名称的 fingerprint 列进行联接，请选择**是**。

      有关**加密计算参数**的更多信息，请参阅[加密计算参数](crypto-computing-parameters.md)。

      有关如何加密数据以便在中使用的更多信息 AWS Clean Rooms，请参阅[使用 Clean Rooms 加密计算准备加密的数据表](prepare-encrypted-data.md)。
**注意**  
在完成下一步之前，请仔细验证这些配置。创建协作后，您只能编辑协作名称、描述以及日志是否存储在 Amazon Lo CloudWatch gs 中。

   1. 如果要为协作资源启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：指定成员能力**，

   1. 对于**使用查询和作业进行分析**，在**支持的分析类型**下，将**查询**复选框保持选中状态。

   1. 对于**运行查询**，选择将启动模型训练的成员

   1. 在 “**从分析中接收结果**” 中，选择一个或多个将接收查询结果的成员。

   1. 对于**使用专门构建的工作流程进行机器学习建模**，

      1. 对于**接收来自训练模型的输出**，请选择将接收经过训练的模型结果（包括模型工件和指标）的成员。

      1. 在 “**接收模型推理的输出**” 中，选择将接收模型推理结果的成员。

   1. **使用查看 ID 解析**下的成员能力 AWS Entity Resolution 数据匹配服务。

1. 对于**第 3 步：配置付款**，

   1. 在 “**使用查询进行分析**” 下，**对于 “按查询付费**”，执行以下操作之一：
      + 要让同一个成员付费并运行查询，请选择您为 “**运行查询**” 选择的同一个成员。
      + 要让其他成员支付查询费用，请选择您的成员账户。

   1. 对于**使用专门构建的工作流程进行机器学习建模**，

      1. 选择将**为模型训练付费**的成员。

   1. 选择将**为推理工作付费**的成员。

   1. 对**于 Pay for look 相似建模**，无需采取任何操作。**配置的相似模型的创建者**是将为相似建模付费的成员。

   1. （可选）选择将**为合成数据生成付费**的成员。

   1. 对于**使用的 ID 解析 AWS Entity Resolution 数据匹配服务**，无需执行任何操作。**ID 映射表的创建者**是将为 **ID 映射表付费**的成员。

1. 选择**下一步**。

1. 对于 “**步骤 4：配置成员资格**”，在 “**协作成员资格**” 下，选择以下选项之一：

------
#### [ Yes, join by creating membership now ]

   1. 对于**结果设置的默认设置**，对于**查询结果设置**，如果您是可以**接收结果的成**员，

      1. 选中 “**设置查询的默认设置”** 复选框。

      1. 对于 **Amazon S3 中的结果目标**，输入亚马逊 S3 目标或选择 “**浏览 S3**” 选择 S3 存储桶。

      1. 对于查询**结果格式**，请选择 **CSV** 或 **PARQUET**。

      1. （仅限 Spark）对于**结果文件**，请选择 “**多个**” 或 “**单**个”。

      1. （可选）如果要将最长 24 小时的查询发送到 S3 目标，请选中 “**添加服务角色以支持最长需要 24 小时才能完成的查询**” 复选框。

         最长需要 24 小时才能完成的大型查询将传送到您的 S3 目标。

         如果您不选中该复选框，则只有在 12 小时内完成的查询才会发送到您的 S3 位置。

      1. 通过选择**创建并使用新的服务角色**或**使用现有服务角色**来指定**服务访问权限**。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-collab-ml-modeling.html)
**注意**  
AWS Clean Rooms 需要权限才能根据分析规则进行查询。有关权限的更多信息 AWS Clean Rooms，请参阅[AWS 的托管策略 AWS Clean Rooms](security-iam-awsmanpol.md)。
如果该角色没有足够的权限 AWS Clean Rooms，则会收到一条错误消息，指出该角色没有足够的权限 AWS Clean Rooms。必须先添加角色策略，然后才能继续。
如果您无法修改角色策略，则会收到一条错误消息，指出找 AWS Clean Rooms 不到该服务角色的策略。

   1. 对于 **ML 配置**，

      1. 选中 “**创建 ML 配置**” 复选框，然后通过输入 S3 **目标来指定 Amazon S3 上的模型输出**目标，或者选择 “**浏览 S3**” 从可用 S3 存储桶列表中进行选择。

      1. 通过选择**创建并使用新的服务角色或使用现有服务角色******来指定服务**访问**权限。

      1. 如果 S3 存储桶已加密，请选**中使用 KMS 密钥加密目标存储桶**复选框，然后输入**AWS KMS key**或选择**创建 AWS KMS key以创建**新的 KMS 密钥。

   1. 如果要为成员资源启用**成员资格标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 如果您是为 **Query 计算**付费的成员，请选中 “**我同意支付此协作中的计算费用**” 复选框，表示您接受。
**注意**  
必须选中此复选框才能继续。  
有关如何计算费用的更多信息，请参阅[的定价 AWS Clean Rooms](what-is.md#pricing)。

      如果您是[支付查询计算费用的会](glossary.md#glossary-member-paying-for-query-compute)[员，但不是可以查询的成员](glossary.md#glossary-member-who-can-run-queries-jobs)，则建议您使用 AWS Budgets 来配置预算， AWS Clean Rooms 并在达到最高预算后接收通知。有关设置预算的更多信息，请参阅《AWS Cost Management 用户指南》**中的[使用 AWS Budgets管理成本](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-managing-costs.html)。有关设置通知的更多信息，请参阅《AWS Cost Management 用户指南》**中的[针对预算通知创建 Amazon SNS 主题](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-sns-policy.html)。如果已达到预算上限，您可以联系可以查询的成员或[退出协作](leave-collab.md)。如果您退出协作，将不再允许运行查询，因此将不再向您收取查询计算费用。

   1. 选择**下一步**。

   同时创建协作和您的成员身份。

   您在协作中的状态为活跃。

------
#### [ No, I will create a membership later ]

   1. 选择**下一步**。

      仅创建协作。

      您在协作中的状态为非活跃。

------

1. 对于 “**步骤 5：查看并创建**”，请执行以下操作：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 从以下选项中选择一个。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-collab-ml-modeling.html)