

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# AutoGluon-表格超参数
<a name="autogluon-tabular-hyperparameters"></a>

下表包含 Amazon A SageMaker I AutoGluon-Tabular 算法所需或最常用的超参数子集。用户可以设置这些参数，以便于从数据中估算模型参数。 SageMaker AI AutoGluon-Tabular 算法是开源 [AutoGluon-](https://github.com/awslabs/autogluon) Tabular 软件包的实现。

**注意**  
默认超参数基于 [AutoGluon-表格样本笔记本](autogluon-tabular.md#autogluon-tabular-sample-notebooks)中的示例数据集。

默认情况下， SageMaker AI AutoGluon-Tabular 算法会根据分类问题的类型自动选择评估指标。该算法根据数据中的标签数量来检测分类问题的类型。对于回归问题，评估指标为均方根误差。对于二元分类问题，评估指标是接收器操作特性曲线 (AUC) 下方的面积。对于多元分类问题，评估指标是准确性。您可以使用 `eval_metric` 超参数来更改默认评估指标。有关 AutoGluon-Tabular 超参数的更多信息，包括描述、有效值和默认值，请参阅下表。


| 参数名称 | 说明 | 
| --- | --- | 
| eval\$1metric |  验证数据的评估指标。如果 `eval_metric` 设置为默认值 `"auto"`，则算法会根据分类问题的类型自动选择评估指标： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/autogluon-tabular-hyperparameters.html) 有效值：字符串，有关有效值，请参阅[AutoGluon 文档](https://auto.gluon.ai/stable/api/autogluon.tabular.TabularPredictor.html)。 默认值：`"auto"`。  | 
| presets |  `fit()` 中各个参数的预设配置列表。 [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/autogluon-tabular-hyperparameters.html) 有关更多详细信息，请参阅[AutoGluon 预测变量。](https://auto.gluon.ai/stable/api/autogluon.tabular.TabularPredictor.html) 有效值：字符串，以下任意值：（`"best_quality"`、`"high_quality"`、`good_quality"`、`"medium_quality"`、`"optimize_for_deployment"`、` or "interpretable"`）。 默认值：`"medium_quality"`。  | 
| auto\$1stack |  是否 AutoGluon 应自动使用装袋和多层堆叠组合来提高预测精度。如果您愿意承受更长的训练时间以最大限度地提高预测精度，请将 `auto_stack` 设置为 `"True"`。这会根据数据集属性自动设置 `num_bag_folds` 和 `num_stack_levels` 参数。 有效值：字符串，`"True"` 或 `"False"`。 默认值：`"False"`。  | 
| num\$1bag\$1folds |  用于模型装袋的折叠次数。`num_bag_folds` 等于 `k` 时，训练时间大约增加 `k` 倍。设置 `num_bag_folds` 为 0 可停用装袋。默认情况下，此功能处于禁用状态，但我们建议使用介于 5 到 10 之间的值，以最大限度地提高预测性能。增加 `num_bag_folds` 会得到偏差较低但更容易过度拟合的模型。对于此参数，1 是无效值，将引发 `ValueError`。大于 10 的值可能会导致收益递减，甚至可能由于过度拟合而损害整体结果。要进一步改善预测，请避免增加 `num_bag_folds`，而是改为增加 `num_bag_sets`。 有效值：字符串，介于 `"0"` 和 `"10"` 之间（含）的任何整数。 默认值：`"0"`。  | 
| num\$1bag\$1sets |  要执行的 k-折装袋重复次数（值必须大于或等于 1）。装袋期间模型训练总次数等于 `num_bag_folds` \$1 `num_bag_sets`。如果未指定 `time_limit`，则此参数默认为 1。如果未指定 `num_bag_folds`，则禁用此参数。大于 1 的值可以实现卓越的预测性能，尤其是在较小的问题上且启用堆叠的情况下。 有效值：整数，范围：[`1`，`20`]。 默认值：`1`。  | 
| num\$1stack\$1levels |  堆栈集合中使用的堆叠层数。模型训练时间大致增加 `num_stack_levels` \$1 1 倍。将此参数设置为 0 可停用堆栈组合。默认情况下，此参数处于禁用状态，但我们建议使用介于 1 到 3 之间的值，以最大限度地提高预测性能。为防止过度拟合和 `ValueError`，`num_bag_folds` 必须大于或等于 2。 有效值：浮点型，范围：[`0`，`3`]。 默认值：`0`。  | 
| refit\$1full |  正常训练过程结束后，是否在所有数据（训练和验证）上重新训练所有模型。有关更多详细信息，请参阅[AutoGluon 预测变量。](https://auto.gluon.ai/stable/api/autogluon.tabular.TabularPredictor.html) 有效值：字符串，`"True"` 或 `"False"`。 默认值：`"False"`。  | 
| set\$1best\$1to\$1refit\$1full |  是否更改预测器用于预测的默认模型。如果 `set_best_to_refit_full` 设置为 `"True"`，则默认模型将更改为在重新拟合（由 `refit_full` 激活）时，得到最高验证分数的模型。仅在设置 `refit_full` 后才有效。 有效值：字符串，`"True"` 或 `"False"`。 默认值：`"False"`。  | 
| save\$1space |  是否需要删除在新数据上进行预测所不需要的辅助模型文件，从而减少预测器所用的内存和磁盘大小。这对推理精度没有影响。如果唯一的目标是使用训练后的模型进行预测，我们建议将 `save_space` 设置为 `"True"`。如果 `save_space` 设置为 `"True"`，则某些高级功能可能不再可用。有关更多详细信息，请参阅 `[predictor.save\$1space()](https://auto.gluon.ai/stable/api/autogluon.tabular.TabularPredictor.save_space.html)` 文档。 有效值：字符串，`"True"` 或 `"False"`。 默认值：`"False"`。  | 
| verbosity |  打印消息的详细程度。`verbosity` 的等级范围从 `0` 到 `4`，级别越高，对应的打印报表更详细。`verbosity` 为 `0` 时将隐藏警告。 有效值：整数，以下任意值：（`0`、`1`、`2`、`3` 或 `4`）。 默认值：`2`。  | 