

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建相似区段
<a name="create-ml-segment-create"></a>

**注意**  
您只能提供训练数据集，以便在数据存储在 Amazon S3 中的 Clean Rooms ML 相似模型中使用。但是，您可以使用 SQL 为相似模型提供种子数据，该模型跨存储在任何支持的数据源中的数据运行。

相似细分是与种子数据最相似的训练数据子集。

**要在中创建外观相似的区段 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择**协作**。

1. 在**具有活跃成员身份**选项卡上，选择一个协作。

1. 在 “**机器学习模型**” 选项卡上，选择 “**创建相似区段**”。

1. 在 “**创建相似区段**” 页面上，对于**关联的配置相似模型**，选择要用于此相似区段的关联配置相似模型。

   

1. 对于**相似细分详细信息**，输入**名称**以及（可选）**描述**。

   

1. 对于**种子配置文件**，请选择一个选项，然后采取建议的操作来选择**种子方法**。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-ml-segment-create.html)

1. 选择创建此数据源时要使用**的工作器类型**。默认的工作器类型为 **CR.1X。**指定要使用的**员工人数**。默认为工作人员编号为 **16**。要指定**火花属性，请执行**以下操作：

   1. 展开 **Spark 属性**。

   1. 选择 “**添加 Spark 属性**”。

   1. 在 **Spark 属性**对话框中，从下拉列表中选择**属性名称**并输入**值**。

   下表提供了每个属性的定义。

   有关 Spark 属性的更多信息，请参阅 Apache [Spark 文档中的 Spark 属性](https://spark.apache.org/docs/latest/configuration.html#spark-properties)。
**注意**  
您最多可以配置 50 个 Spark 属性。每个属性值最多可包含 500 个字符。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-ml-segment-create.html)    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-ml-segment-create.html)

1. 对于**服务访问**，选择将用于访问该表的**现有服务角色名称**。

1. 如果要为训练数据集启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

1. 选择**创建相似细分**。

有关相应的 API 操作，请参阅[StartAudienceGenerationJob](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_StartAudienceGenerationJob.html)。