

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 随机抽样
<a name="canvas-random-sample"></a>

SageMaker Canvas 使用随机采样方法对您的数据集进行采样。随机抽样方法意味着每行被选取为样本的几率相等。您可以在预览中选择一列以获取随机样本的汇总统计数据，例如均值和模式。

默认情况下，对于行数超过 20,000 的数据集， SageMaker Canvas 使用数据集中随机抽样大小为 20,000 行。对于小于 2 万行的数据集，默认样本大小为数据集中的行数。您可以通过在 C SageMaker anvas 应用程序的 “**构建**” 选项卡中选择 “**随机样本**” 来增加或减少样本量。您可以使用滑块选择所需的样本量，然后选择**更新**来更改样本量。您可以为数据集选择的最大样本量为 4 万行，最小样本量为 500 行。如果您选择较大的样本量，则数据集预览和汇总统计数据可能需要一些时间才能重新加载。

**构建**页面显示数据集中 100 行数据的预览。如果样本量与数据集大小相同，那么预览将使用数据集的前 100 行数据。否则，预览将使用随机样本的前 100 行数据。