

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 生成可视化和数据见解
<a name="dw-analyze-data"></a>

将数据导入 Data Wrangler 后，您可以使用它来生成可视化和数据见解。
+  **[可视化](#dw-visualizing-data)**： Data Wrangler 可以生成不同类型的图表，例如直方图和散点图。例如，您可以生成直方图来识别数据中的异常值。
+ **[数据见解](#dw-generating-insights)**： 您可以使用*适用于 Amazon Personalize 的数据质量和见解报告*，通过数据见解以及列和行统计信息来了解您的数据。此报告可以告知您数据中是否存在任何类型问题。您还可以了解可采取哪些操作来改善数据。这些操作可以帮助您满足 Amazon Personalize 资源要求，例如模型训练要求，也可以改进建议。

 通过可视化和见解了解数据后，您可以使用这些信息帮助您应用其他转换来改善数据。或者，如果您完成了数据准备，则可以对其进行处理并将其导入到 Amazon Personalize 中。有关数据转换的信息，请参阅[转换数据](dw-transform-data.md)。有关处理和导入数据的信息，请参阅[处理数据并将其导入 Amazon Personalize](dw-export-data.md)。

## 生成可视化
<a name="dw-visualizing-data"></a>

您可以使用 Data Wrangler 创建不同类型的图表，例如直方图和散点图。例如，您可以生成直方图来识别数据中的异常值。要生成数据可视化，请在流中添加**分析**步骤，然后从**分析类型**中选择要创建的可视化。

 有关在 Data Wrangler 中创建可视化的更多信息，请参阅 A *mazon A SageMaker I* 开发者指南中的[分析和可视化](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-analyses.html)。

## 生成数据见解
<a name="dw-generating-insights"></a>

 您可以使用 Data Wrangler，生成特定于数据集类型的 **Amazon Personalize 的数据质量和见解报告**。在生成报告之前，我们建议您转换数据以满足 Amazon Personalize 的要求。这将生成更多相关的见解。有关更多信息，请参阅 [转换数据](dw-transform-data.md)。

**Topics**
+ [报告内容](#dw-report-content)
+ [生成报告](#dw-generating-insight-report)

### 报告内容
<a name="dw-report-content"></a>

**Amazon Personalize 的数据质量和见解报告** 包括以下部分：
+ **摘要：** 报告摘要包括数据集统计信息和高优先级警告：
  + **数据集统计信息：** 包括 Amazon Personalize 的特定统计信息（例如交互数据中的唯一用户数量）以及一般统计信息（例如缺失值或异常值的数量）。
  +  **高优先级警告：** 这些是 Amazon Personalize 的特定见解，对训练或建议的影响最大。每个警告都包含可用于解决问题的建议操作。
+  **重复行和不完整行：** 这些部分包含有关数据中哪些行存在缺失值以及哪些行重复的信息。
+  **特征摘要：** 本部分包括每列的数据类型、无效或缺失的数据信息以及警告计数。
+  **特征详情：** 本部分包括含每列数据详细信息的子部分。每个子部分都包含列的统计信息，例如类别值计数和缺失值信息。而且，每个子部分都包含 Amazon Personalize 针对数据列的具体见解和建议的操作。例如，见解可能表明某一列包含超过 30 个可能的类别。

#### 数据类型问题
<a name="dw-report-type-issues"></a>

 报告会识别数据类型不正确的列，并指定所需的类型。要获得与这些特征相关的见解，您必须转换列的数据类型并重新生成报告。要转换类型，您可以使用 Data Wrangler 转换[将值解析为类型](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type)。

#### Amazon Personalize 见解
<a name="dw-report-insights"></a>

Amazon Personalize 见解包括调查结果和建议的操作。操作是可选的。例如，报告可能包含与一列分类数据的类别数量相关的见解和操作。如果您认为该列不是类别列，则可以忽略此见解，不采取任何操作。

 除了细微的措辞差异外，Amazon Personalize 的特定见解与您在使用 Amazon Personalize 分析数据时可能生成的*单个数据集* 见解相同。例如，Data Wrangler 中的见解报告包含诸如“物品交互数据集只有 X 个具有两次或更多次交互的唯一用户”之类的见解。但它不包括诸如“*物品数据集* 中有 X% 的物品在*物品交互数据集*中没有交互”之类的见解。

 有关可能的 Amazon Personalize 特定见解列表，请参阅[数据见解](analyzing-data.md#data-insights)中未引用多个数据集的见解。

#### 报告示例
<a name="dw-insight-report-examples"></a>

Amazon Personalize 报告的外观和风格与 Data Wrangler 中的一般见解报告相同。有关一般见解报告的示例，请参阅《*Amazon A SageMaker I 开发者指南》*中的 “[获取有关数据和数据质量的见解](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-data-insights.html)”。以下示例显示了物品交互数据集报告的摘要部分。它包括数据集统计信息和一些可能的高优先级物品交互数据集警告。

![描绘了物品交互数据集报告的摘要部分。](http://docs.aws.amazon.com/zh_cn/personalize/latest/dg/images/dw-reports-summary.png)


 以下示例显示了物品交互数据集的 EVENT\_TYPE 列的特征详细信息部分可能在报告中的显示方式。

![描绘了物品交互数据集的 EVENT_TYPE 列的特征详细信息部分。](http://docs.aws.amazon.com/zh_cn/personalize/latest/dg/images/dw-event-type-report.png)


### 生成报告
<a name="dw-generating-insight-report"></a>

要生成 **Amazon Personalize 的数据质量和见解报告**，请为您的转换选择**获取数据见解**，然后创建分析。

**生成 Amazon Personalize 的数据质量和见解报告**

1. 为您要分析的转换选择 **\+** 选项。如果您尚未添加转换，请为**数据类型**转换选择 **\+**。Data Wrangler 会自动将此转换添加到您的流中。

1. 选择**获取数据见解**。这时，将显示**创建分析**面板。

1. 对于**分析类型**，选择 **Amazon Personalize 的数据质量和见解报告**。

1.  对于**数据集类型**，选择您要分析的 Amazon Personalize 数据集的类型。

1. （可选）选择**针对完整数据运行**。默认情况下，Data Wrangler 仅生成有关数据样本的见解。

1. 选择**创建**。分析完成后，将显示报告。