

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 数据验证
<a name="canvas-dataset-validation"></a>

在构建模型之前， SageMaker Canvas 会检查您的数据集中是否存在可能导致构建失败的问题。如果 SageMaker Canvas 发现任何问题，它会在您尝试**构建**模型之前在 “构建” 页面上向您发出警告。

您可以选择**验证数据**以查看数据集问题列表。然后，您可以使用 Can SageMaker vas [Data Wrangler 数据准备功能](canvas-data-prep.md)或您自己的工具在开始构建之前修复数据集。如果您不修复数据集的问题，那么您的构建就会失败。

如果您为了修复问题而对数据集进行了更改，则可以选择在尝试构建之前重新验证数据集。我们建议您在构建模型之前重新验证数据集。

下表显示了 SageMaker Canvas 在您的数据集中检查的问题以及如何解决这些问题。


| 问题 | 解决方案 | 
| --- | --- | 
| 数据的模型类型错误 | 尝试其他模型类型或使用不同的数据集。 | 
| 目标列中缺少值 | 替换缺失值，删除有缺失值的行，或使用不同的数据集。 | 
| 目标列中的唯一标签太多 | 验证您是否为目标列使用了正确的列，或者使用不同的数据集。 | 
| 目标列中的非数字值太多 | 选择不同的目标列，选择其他模型类型或使用不同的数据集。 | 
| 一个或多个列名包含双下划线 | 重命名这些列以删除所有双下划线，然后重试。 | 
| 数据集中没有一行是完整的 | 替换缺失值，或使用不同的数据集。 | 
| 对于数据中的行数来说，唯一标签太多 | 检查您使用的目标列是否正确，增加数据集中的行数，合并相似的标签或使用不同的数据集。 | 