

我们不再更新 Amazon Machine Learning 服务，也不再接受新用户使用该服务。本文档可供现有用户使用，但我们不会再对其进行更新。有关更多信息，请参阅[什么是 Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html)。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 什么是 Amazon Machine Learning？
<a name="what-is-amazon-machine-learning"></a>

我们不再更新 Amazon Machine Learning (Amazon ML) 服务，也不再接受新用户使用该服务。本文档可供现有用户使用，但我们不会再对其进行更新。

AWS 现在提供基于云的强大服务 Amazon SageMaker AI，因此所有技能水平的开发人员都可以使用机器学习技术。 SageMaker AI 是一项完全托管的机器学习服务，可帮助您创建强大的机器学习模型。借助 SageMaker 人工智能，数据科学家和开发人员可以构建和训练机器学习模型，然后将其直接部署到可用于生产的托管环境中。

有关更多信息，请参阅 A [SageMaker I 文档](https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html)。

**Topics**
+ [Amazon Machine Learning 关键概念](amazon-machine-learning-key-concepts.md)
+ [访问 Amazon Machine Learning](accessing-amazon-machine-learning.md)
+ [区域和端点](regions-and-endpoints.md)
+ [Amazon ML 的定价](pricing.md)

# Amazon Machine Learning 关键概念
<a name="amazon-machine-learning-key-concepts"></a>

 本部分总结了以下关键概念并详细介绍了如何在 Amazon ML 中使用这些概念：
+  [数据源](#datasources)包含与 Amazon ML 输入数据相关的元数据 
+  [ML 模型](#ml-models)使用从输入数据中提取的模式生成预测 
+  [评估](#evaluations)衡量 ML 模型的质量 
+  [批量预测](#batch-predictions)可*异步* 为多个输入数据观察生成预测 
+  [实时预测](#real-time-predictions)可*同步* 为单个数据观察生成预测 

## 数据源
<a name="datasources"></a>

 数据源是包含有关输入数据的元数据的对象。Amazon ML 读取您的输入数据、计算其属性的描述性统计数据，并将统计数据与架构和其他信息一起存储为数据源对象的一部分。接下来，Amazon ML 使用数据源训练和评估 ML 模型并生成批量预测。

**重要**  
 数据源不存储输入数据的副本。而是存储输入数据所在的 Amazon S3 位置的引用。如果您移动或更改 Amazon S3 文件，Amazon ML 无法访问或使用该文件来创建 ML 模型、生成评估或生成预测。

 下表定义了与数据源相关的术语。


|  **期限**  |  **定义**  | 
| --- | --- | 
|  属性  |   观察中唯一的指定属性。在采用表格格式的数据（例如，电子表格或逗号分隔的值 (CSV) 文件）中，列标题代表属性，而行包含每个属性的值。  同义词：变量、变量名称、字段、列   | 
|  数据源名称  |  （可选）允许您为数据源定义一个便于阅读的名称。这些名称便于您在 Amazon ML 控制台中查找和管理您的数据源。 | 
|  输入数据  |  数据源引用的所有观察的总称。 | 
|  位置  |  输入数据的位置。目前，Amazon ML 可以使用存储在 Amazon S3 存储桶、Amazon Redshift 数据库或 Amazon Relational Database Service (RDS) 中的 MySQL 数据库中的数据。 | 
|  观察  |   单个输入数据单位。例如，如果您创建的是检测欺诈交易的 ML 模型，您的输入数据将包含许多观察，每个观察表示单个交易。  同义词：记录、示例、实例、行   | 
|  行 ID  |   （可选）此标记（如果指定）用于标识输入数据的将包含在预测输出中的属性。借助此属性，您可以更轻松地将预测与对应的观察进行关联。  同义词：行标识符   | 
|  架构  |  解释输入数据时所需的信息，包括属性名及其分配的数据类型和特殊属性名。 | 
|  统计信息  |   输入数据中每个属性的摘要统计信息。这些统计数据有两种用途：  Amazon ML 控制台以图表形式显示它们，以帮助您了解数据 at-a-glance并识别异常或错误。  Amazon ML 在训练过程中使用它们来改进生成的 ML 模型的质量。  | 
|  状态  |  指示数据源的当前状态，例如正在进行、已完成或失败。 | 
|  目标属性  |   在训练 ML 模型的上下文中，目标属性会标识包含“正确”答案的输入数据中属性的名称。Amazon ML 使用此属性在输入数据中发现模式并生成 ML 模型。在评估和生成预测的上下文中，目标属性是值将由经过训练的 ML 模型进行预测的属性。  同义词：目标   | 

## ML 模型
<a name="ml-models"></a>

 ML 模型是通过在数据中查找模式来生成预测的数学模型。Amazon ML 支持三种类型的 ML 模型：二进制分类、多类别分类和回归。

 下表定义了与 ML 模型相关的术语。


|  **期限**  |  **定义**  | 
| --- | --- | 
|  回归  |  训练回归 ML 模型的目标是预测数字值。 | 
|  多类别  |  训练多类别 ML 模型的目标是预测属于有限的、预定义的允许值集的值。 | 
|  二元  |  训练二进制 ML 模型的目标是预测只能有两种状态之一的值，例如 true 或 false。 | 
|  模型大小  |  ML 模型可以捕获和存储模式。ML 模型存储的模式越多，就会变得越大。ML 模型的大小以 MB 为单位。 | 
|  扫描次数  |  训练 ML 模型时，您可以使用数据源中的数据。在学习过程中多次使用每个数据记录有时比一次使用更加有用。您让 Amazon ML 使用相同数据记录的次数称为扫描次数。 | 
|  正则化  |  正则化是一种机器学习方法，可用来获得更高质量的模型。Amazon ML 提供适用于大多数情况的默认设置。 | 

## 评估
<a name="evaluations"></a>

 评估可衡量您的 ML 模型的质量，并确定它是否表现良好。

 下表定义了与评估相关的术语。


|  **期限**  |  **定义**  | 
| --- | --- | 
|  模型洞察  |  Amazon ML 会为您提供一个指标和许多洞察，您可以用这些来评估模型的预测性能。 | 
|  AUC  |  ROC 曲线下面积 (AUC) 测量二进制 ML 模型为正面示例预测比负面示例更高分数的能力。 | 
|  宏平均 F1 分数  |  宏平均 F1 分数用于评估多类别 ML 模型的预测性能。 | 
|  RMSE  |  均方根误差 (RMSE) 是用于评估回归 ML 模型的预测性能的指标。 | 
|  截断  |  ML 模型通过生成数字预测分数来工作。通过应用截断值，系统可将这些分数转换为 0 和 1 标签。 | 
|  准确度  |  准确度可测量正确预测的百分比。 | 
|  精度  |  精度显示在已检索的实例（预测为阳性）中，实际阳性实例（相对于假阳性）的百分比。换言之，所选项目有多少是阳性？  | 
|  召回率  |  召回率显示了在相关实例总数中实际阳性的百分比（实际阳性）。换言之，阳性项目有多少已选定？  | 

## 批量预测
<a name="batch-predictions"></a>

 批量预测功能可以一次性运行一组观察。这非常适合于没有实时要求的预测分析。

 下表定义了与批量预测相关的术语。


|  **期限**  |  **定义**  | 
| --- | --- | 
|  输出位置  |  批量预测结果存储在 S3 存储桶输出位置。 | 
|  清单文件  |  此文件将每个输入数据文件与其关联的批量预测结果相关联。它存储在 S3 存储桶输出位置。 | 

## 实时预测
<a name="real-time-predictions"></a>

 实时预测适用于具有低延迟要求的应用程序，例如交互式 Web、移动或桌面应用程序。任何 ML 模型都可通过低延迟实时预测 API 查询预测。

 下表定义了与实时预测相关的术语。


|  **期限**  |  **定义**  | 
| --- | --- | 
|  实时预测 API  |  实时预测 API 接受请求负载中的单个输入观察并在响应中返回预测。 | 
|  实时预测终端节点  |  要将使用 ML 模型与实时预测 API 配合使用，您需要创建实时预测终端节点。创建后，此终端节点包含可用来请求实时预测的 URL。 | 

# 访问 Amazon Machine Learning
<a name="accessing-amazon-machine-learning"></a>

您可以使用以下任何方式访问 Amazon ML：

**Amazon ML 控制台**  
 您可以通过登录 AWS 管理控制台并在上打开 Amazon ML 控制台来访问 Amazon ML 控制台[https://console.aws.amazon.com/machinelearning/](https://console.aws.amazon.com/machinelearning/)。

**AWS CLI**  
 有关如何安装和配置 AWS CLI 的信息，请参阅 [AWS Command Line Interface 用户指南](https://docs.aws.amazon.com/cli/latest/userguide/)中的使用 AWS 命令行界面进行设置。

**Amazon ML API**  
 有关 Amazon ML API 的更多信息，请参阅 [Amazon ML API 参考](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_Operations.html)。

**AWS SDKs**  
 有关 AWS 的更多信息 SDKs，请参阅[亚马逊 Web Services 工具。](https://aws.amazon.com/tools/)

# 区域和端点
<a name="regions-and-endpoints"></a>

Amazon Machine Learning (Amazon ML) 支持以下两个区域的实时预测终端节点：


| 区域名称 | 区域 | 端点 | 协议 | 
| --- | --- | --- | --- | 
| 美国东部 (弗吉尼亚北部) | us-east-1 |  machinelearning.us-east-1.amazonaws.com  | HTTPS | 
| 欧洲地区（爱尔兰） | eu-west-1 | machinelearning.eu-west-1.amazonaws.com | HTTPS | 

您可在任何区域托管数据集、训练和评估模型以及触发预测。

我们建议您将您的所有资源保留在同一区域中。如果您的输入数据与您的 Amazon ML 资源位于不同区域，您将会产生跨区域数据传输费用。您可以从任何区域调用实时预测终端节点，但从不含某个终端节点的区域调用该终端节点可能会影响实时预测延迟。

# Amazon ML 的定价
<a name="pricing"></a>

对于 AWS 服务，您只需为实际使用量付费。无最低费用，无预先承诺。

Amazon Machine Learning (Amazon ML) 将按小时对计算数据统计以及训练和评估模型所花的时间计费，随后您按照该程序为您的应用程序所生成的预测数量付费。对于实时预测，您也将基于模型大小按小时支付预留容量费用。

Amazon ML 仅估算 [Amazon ML 控制台](https://console.aws.amazon.com/machinelearning/)中的预测的成本。

有关 Amazon ML 定价的更多信息，请参阅 [https://aws.amazon.com/machine-learning/pricing/](https://aws.amazon.com/machine-learning/pricing/)。

**Topics**
+ [估算批量预测成本](#w2aab7c20c14)
+ [估算实时预测成本](#w2aab7c20c16)

## 估算批量预测成本
<a name="w2aab7c20c14"></a>

当您使用“创建批量预测”向导请求使用 Amazon ML 模型进行批量预测时，Amazon ML 会估算这些预测的成本。计算估算成本的方法因可用的数据类型而异。

### 在数据统计可用时估算批量预测成本
<a name="w2aab7c20c14b4"></a>

在 Amazon ML 计算了用于请求预测的数据源的汇总统计数据时，获得的估算成本最准确。系统始终会为使用 Amazon ML 控制台创建的数据源计算这些统计数据。[当使用 [CreateDataSourceFromS3](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromS3.html) 或 RDS 以编程方式创建数据源`True`时，[CreateDataSourceFromRedshift](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromRedshift.html)API 用户必须将该`ComputeStatistics`标志设置为。CreateDataSourceFrom](https://docs.aws.amazon.com/machine-learning/latest/APIReference/API_CreateDataSourceFromRDS.html) APIs数据源必须处于 `READY` 状态才能使用统计数据。

Amazon ML 计算的其中一个统计数据是数据记录的数量。当数据记录数量可用时，Amazon ML 的“创建批量预测”向导会估算预测结果的数量，具体方法是用数据记录的数量乘以[批量预测的费用](https://aws.amazon.com/machine-learning/pricing/)。

您的实际成本可能由于以下原因而与此估算成本有所不同：
+ 部分数据记录可能处理失败。对于使用失败的数据记录提供的预测，您不会支付任何费用。
+ 估算时未考虑 AWS 预设的服务抵扣金额或应用的其他调整。

 ![\[Batch prediction results page showing estimated cost, ML fee, and S3 destination input.\]](http://docs.aws.amazon.com/zh_cn/machine-learning/latest/dg/images/image59b.png) 

### 在只有数据大小可用时估算批量预测成本
<a name="w2aab7c20c14b6"></a>

当您请求的批量预测和请求数据源的数据统计均不可用时，Amazon ML 会根据以下项估算成本：
+ 在数据源验证期间计算并保存的总数据大小
+ 数据记录的平均大小，Amazon ML 通过读取和分析数据文件的前 100MB 来估算该大小

为了估算批量预测的成本，Amazon ML 会用总数据大小除以数据记录的平均大小。这种成本预测方法的准确性不如数据记录数量可用时使用的方法，因为数据文件的第一个记录可能无法准确体现平均记录大小。

### 在数据统计或数据大小都不可用时估算批量预测成本
<a name="w2aab7c20c14b8"></a>

当数据统计或数据大小都不可用时，Amazon ML 无法估算批量预测成本。当您用于请求批量预测的数据源尚未通过 Amazon ML 的验证时，通常会出现这种情况。当您创建了基于 Amazon Redshift (Amazon Redshift) 或 Amazon Relational Database Service (Amazon RDS) 查询的数据源，并且数据传输尚未完成时，或者数据源创建请求排在您账户中的其他操作之后，可能形成上述条件。在这种情况下，Amazon ML 控制台会通知您有关批量预测费用的信息。您可以选择继续处理批量预测请求而不估算成本，或在用于预测的数据源处于 INPROGRESS 或 READY 状态后取消向导并返回。

## 估算实时预测成本
<a name="w2aab7c20c16"></a>

当您使用 Amazon ML 控制台创建实时预测终端节点时，系统将向您显示估算的预留容量费用，用于预测处理的预留终端节点将持续收取此项费用。根据[服务定价页面](https://aws.amazon.com/machine-learning/pricing/)的说明，此项费用因模型大小而异。您还将了解标准 Amazon ML 实时预测费用。

 ![\[Dialog box for creating a real-time endpoint with model details and pricing information.\]](http://docs.aws.amazon.com/zh_cn/machine-learning/latest/dg/images/image60b.png) 