

我们不再更新 Amazon Machine Learning 服务，也不再接受新用户使用该服务。本文档可供现有用户使用，但我们不会再对其进行更新。有关更多信息，请参阅[什么是 Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html)。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 利用 Amazon Redshift 数据创建数据源（控制台）
<a name="create-datasource-from-redshift-procedure"></a>

Amazon ML 控制台提供两种方式来使用 Amazon Redshift 数据创建数据源。您可以通过完成“创建数据源”向导创建数据源，或者，如果您已经利用 Amazon Redshift 数据创建数据源，您可以复制原始数据源并修改其设置。复制数据源可以轻松创建多个相似的数据源。

有关使用 API 创建数据源的信息，请参阅。[CreateDataSourceFromRedshift](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromRedshift.html)

有关以下步骤中的参数的更多信息，请参阅 [“Create Datasource”向导的必需参数](redshift-parameters.md)。

**Topics**
+ [创建数据源（控制台）](#create-redshift-datasource)
+ [复制数据源（控制台）](#copy-redshift-datasource)

## 创建数据源（控制台）
<a name="create-redshift-datasource"></a>

要将数据从 Amazon Redshift 卸载到 Amazon ML 数据源，请使用“创建数据源”向导。

**利用 Amazon Redshift 中的数据创建数据源**

1. 打开 Amazon Machine Learning 控制台，网址为[https://console.aws.amazon.com/machinelearning/](https://console.aws.amazon.com/machinelearning/)。

1. 在 Amazon ML 控制面板上的**实体**下，选择**新建...**，然后选择**数据源**。

1. 在**输入数据**页面上，选择 **Amazon Redshift**。

1. 在“创建数据源”向导中，对于**集群标识符**，请键入您的集群的名称。

1. 对于**数据库名称**，请键入 Amazon Redshift 数据库的名称。

1. 对于**数据库用户名**，请键入数据库用户名。

1. 对于**数据库密码**，请键入数据库密码。

1. 对于**IAM 角色**，请选择您的 IAM 角色。如果您还没有角色，请选择**创建新的角色**。Amazon ML 会为您创建一个 IAM Amazon Redshift 角色。

1. 要测试您的 Amazon Redshift 设置，请选择**测试访问**（在 **IAM 角色**旁边）。如果 Amazon ML 无法使用提供的设置连接到 Amazon Redshift，则您无法继续创建数据源。有关问题排查帮助，请参阅[纠正错误](troubleshooting.md#trouble-errors)。

1. 对于 **SQL 查询**，键入您的 SQL 查询。

1. 对于**架构位置**，请选择您是否希望 Amazon ML 为您创建架构。如果您已经自己创建了架构，请键入您的架构文件的 Amazon S3 路径。

1. 对于 **Amazon S3 暂存位置**，请键入存储桶的 Amazon S3 路径，您希望 Amazon ML 将所卸载数据从 Amazon Redshift 放入该存储桶。

1. （可选）对于**数据源名称**，请键入您数据源的名称。

1. 选择**验证**。Amazon ML 将验证它是否能连接到您的 Amazon Redshift 数据库。

1. 在**架构**页面上，检查所有属性的数据类型并根据需要进行纠正。

1. 选择**继续**。

1. 如果您希望使用此数据源创建或评估 ML 模型，则对于**是否计划使用此数据集创建或评估 ML 模型?**，请选择**是**。如果您选择**是**，请选择目标行。有关目标的信息，请参阅[使用字 targetAttributeName 段](creating-a-data-schema-for-amazon-ml.md#using-the-targetattributename-field)。

   如果您希望使用此数据源以及您已创建的模型来创建预测，请选择**否**。

1. 选择**继续**。

1. 对于**您的数据是否包含标识符?**，如果您的数据不包含行标识符，请选择**否**。

   如果您的数据包含行标识符，请选择**是**。有关行标识符的信息，请参阅[使用 rowID 字段](creating-a-data-schema-for-amazon-ml.md#using-the-rowid-field)。

1. 选择**审核**。

1. 在**审核**页上，检查您的设置，然后选择**完成**。

创建数据源后，您可以使用它[create an ML model](creating-ml-model-on-the-amazon-ml-console.md)。创建模型后，您可以使用数据源[evaluate an ML model](evaluating_models.md)或[generate predictions](interpreting_predictions.md)。

## 复制数据源（控制台）
<a name="copy-redshift-datasource"></a>

当您想要创建一个与现有数据源类似的数据源时，您可以使用 Amazon ML 控制台复制原始数据源并修改其设置。例如，您可以选择从现有数据源开始，然后修改数据架构以更紧密地匹配您的数据；更改用于从 Amazon Redshift 卸载数据的 SQL 查询；或者指定其他 AWS Identity and Access Management (IAM) 用户来访问 Amazon Redshift 集群。

**复制和修改 Amazon Redshift 数据源**

1. 打开 Amazon Machine Learning 控制台，网址为[https://console.aws.amazon.com/machinelearning/](https://console.aws.amazon.com/machinelearning/)。

1. 在 Amazon ML 控制面板上的**实体**下，选择**新建...**，然后选择**数据源**。

1. 在**输入数据**页面上，对于**您的数据位于何处?**，选择 **Amazon Redshift**。如果您已经利用 Amazon Redshift 数据创建了一个数据源，您可以选择从其他数据源复制设置。  
![\[Amazon S3 and Amazon Redshift icons with option to copy settings from existing datasource.\]](http://docs.aws.amazon.com/zh_cn/machine-learning/latest/dg/images/infobar.png)

   如果您还没有利用 Amazon Redshift 数据创建数据源，则不会显示此选项。

1. 选择**查找数据源**。

1. 选择要复制的数据源，然后选择**复制设置**。Amazon ML 使用原始数据源的设置自动填充大部分数据源设置。它不会从原始数据源复制数据库密码、架构位置或数据源名称。

1. 修改您希望更改的任何自动填充设置。例如，如果您希望更改 Amazon ML 从 Amazon Redshift 卸载的数据，请更改 SQL 查询。

1. 对于**数据库密码**，请键入数据库密码。Amazon ML 不会存储或重新使用您的密码，因此，您必须始终提供密码。

1. （可选）对于**架构位置**，Amazon ML 预先为您选择**我希望 Amazon ML 生成一个推荐的架构**。如果您已经创建架构，请选择**我希望使用已在 Amazon S3 中创建和存储的架构**，然后键入 Amazon S3 中架构文件的路径。

1. （可选）对于**数据源名称**，请键入您数据源的名称。否则，Amazon ML 会为您生成新的数据源名称。

1. 选择**验证**。Amazon ML 将验证它是否能连接到您的 Amazon Redshift 数据库。

1. （可选）如果 Amazon ML 为您推断了架构，请在**架构**页面上检查所有属性的数据类型，并根据需要进行更正。

1. 选择**继续**。

1. 如果您希望使用此数据源创建或评估 ML 模型，则对于**是否计划使用此数据集创建或评估 ML 模型?**，请选择**是**。如果您选择**是**，请选择目标行。有关目标的信息，请参阅[使用字 targetAttributeName 段](creating-a-data-schema-for-amazon-ml.md#using-the-targetattributename-field)。

   如果您希望使用此数据源以及您已创建的模型来创建预测，请选择**否**。

1. 选择**继续**。

1. 对于**您的数据是否包含标识符?**，如果您的数据不包含行标识符，请选择**否**。

   如果您的数据包含行标识符，请选择**是**，然后选择您要用作标识符的行。有关行标识符的信息，请参阅[使用 rowID 字段](creating-a-data-schema-for-amazon-ml.md#using-the-rowid-field)。

1. 选择**审核**。

1. 检查设置，然后选择**完成**。

创建数据源后，您可以使用它[create an ML model](creating-ml-model-on-the-amazon-ml-console.md)。创建模型后，您可以使用数据源[evaluate an ML model](evaluating_models.md)或[generate predictions](interpreting_predictions.md)。