Unterstützte Framework-Images, AWS-Regionen und Instance-Typen - Amazon SageMaker AI

Unterstützte Framework-Images, AWS-Regionen und Instance-Typen

Diese Funktion unterstützt die folgenden Frameworks für Machine Learning und AWS-Regionen.

Anmerkung

Um dieses Feature nutzen zu können, vergewissern Sie sich, dass mindestens Version 2.180.0 des SageMaker Python SDK installiert ist.

In SageMaker Profiler vorinstallierte Framework-Images von SageMaker AI

SageMaker AI Profiler ist in den folgenden Deep-Learning-Containern von AWS für SageMaker AI vorinstalliert.

PyTorch-Images

PyTorch-Versionen AWS DLC Image-URI
2.2.0

763.104.351.884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.2.0-gpu-py310-cu121-ubuntu20.04-sagemaker

2.1.0

763.104.351.884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker

2.0.1

763.104.351.884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker

763.104.351.884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu121-ubuntu20.04-sagemaker

1.13.1

763.104.351.884.dkr.ecr.<region>.amazonaws.com/pytorch-training:1.13.1-gpu-py39-cu117-ubuntu20.04-sagemaker

TensorFlow-Images

TensorFlow-Versionen AWS DLC Image-URI
2.13.0

763.104.351.884.dkr.ecr.<region>.amazonaws.com/tensorflow-training:2.13.0-gpu-py310-cu118-ubuntu20.04-sagemaker

2.12.0

763.104.351.884.dkr.ecr.<region>.amazonaws.com/tensorflow-training:2.12.0-gpu-py310-cu118-ubuntu20.04-sagemaker

2.11.0

763.104.351.884.dkr.ecr.<region>.amazonaws.com/tensorflow-training:2.11.0-gpu-py39-cu112-ubuntu20.04-sagemaker

Wichtig

Die Verteilung und Wartung der Framework-Container in den obigen Tabellen unterliegen der Framework-Supportrichtlinie, die vom AWS-Service für Deep-Learning-Container verwaltet wird. Wir empfehlen Ihnen dringend, auf die derzeit unterstützten Framework-Versionen zu aktualisieren, wenn Sie frühere Framework-Versionen verwenden, die nicht mehr unterstützt werden.

Anmerkung

Wenn Sie SageMaker Profiler für andere Framework-Images oder Ihre eigenen Docker-Images verwenden möchten, können Sie SageMaker Profiler mithilfe der Binärdateien des Python-Pakets von SageMaker Profiler installieren, die im folgenden Abschnitt bereitgestellt werden.

Binärdateien für das Python-Paket von SageMaker Profiler

Wenn Sie Ihren eigenen Docker-Container konfigurieren, SageMaker Profiler in anderen vorgefertigten Containern für PyTorch und TensorFlow verwenden oder das Python-Paket für SageMaker Profiler lokal installieren möchten, verwenden Sie eine der folgenden Binärdateien. Wählen Sie je nach Python- und CUDA-Version in Ihrer Umgebung eine der folgenden Optionen aus.

PyTorch

TensorFlow

Weitere Informationen zur Installation von SageMaker Profiler mithilfe der Binärdateien finden Sie unter (Optional) Installieren des Python-Pakets von SageMaker Profiler.

Unterstützte AWS-Regionen

SageMaker Profiler ist in den folgenden AWS-Regionen verfügbar.

  • USA Ost (Nord-Virginia) (us-east-1)

  • USA Ost (Ohio) (us-east-2)

  • USA West (Oregon) (us-west-2)

  • Europa (Frankfurt) (eu-central-1)

  • Europa (Irland) (eu-west-1)

Unterstützte Instance-Typen

SageMaker Profiler unterstützt die Profilerstellung für Trainingsjobs für die folgenden Instance-Typen.

CPU- und GPU-Profilerstellung

  • ml.g4dn.12xlarge

  • ml.g5.24xlarge

  • ml.g5.48xlarge

  • ml.p3dn.24xlarge

  • ml.p4de.24xlarge

  • ml.p4d.24xlarge

  • ml.p5.48xlarge

Nur GPU-Profilerstellung

  • ml.g5.2xlarge

  • ml.g5.4xlarge

  • ml.g5.8xlarge

  • ml.g5.16.xlarge