本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
支持的框架和 AWS 区域
在使用 SageMaker 智能筛选数据加载器之前,请检查您选择的框架是否受支持、实例类型在 AWS 账户中是否可用以及您的 AWS 账户是否在受支持的 AWS 区域。
注意
SageMaker 智能筛选支持 PyTorch 模型训练,采用传统数据并行和分布式数据并行,在所有 GPU 工作器上创建模型副本,并使用 AllReduce 操作。它不适用于模型并行技术,包括分片数据并行。由于 SageMaker 智能筛选适用于数据并行作业,因此请确保您训练的模型适合每个 GPU 内存。
支持的框架
SageMaker 智能筛选支持以下深度学习框架,并且可通过 AWS 深度学习容器获得。
主题
PyTorch
| 框架 | 框架版本 | 深度学习容器 URI |
|---|---|---|
| PyTorch | 2.1.0 |
|
有关预构建容器的更多信息,请参阅 AWS 深度学习容器 GitHub 存储库中的 SageMaker AI Framework Containers
AWS 区域
使用 SageMaker 智能筛选存储库打包的容器
实例类型
您可以将 SageMaker 智能筛选用于任何实例类型的任何 PyTorch 训练作业。我们建议您使用 P4d、P4de 或 P5 实例。