Problembehandlung für SageMaker Profiler - Amazon SageMaker AI

Problembehandlung für SageMaker Profiler

Verwenden Sie die folgenden Frage-Antwort-Paare, um Probleme bei der Verwendung von SageMaker Profiler zu beheben.

F: Ich erhalte eine Fehlermeldung, ModuleNotFoundError: No module named 'smppy'.

Im Dezember 2023 wurde der Name des Python-Pakets von SageMaker Profiler von smppy in smprof geändert, um ein Problem mit doppelten Paketnamen zu beheben. smppy wird bereits von einem Open-Source-Paket verwendet.

Wenn Sie also smppy seit vor Dezember 2023 verwenden und dieses ModuleNotFoundError-Problem auftritt, kann es an dem veralteten Paketnamen in Ihrem Trainingsskript liegen, wenn Sie das neueste smprof-Paket installiert haben oder eines der neuesten In SageMaker Profiler vorinstallierte Framework-Images von SageMaker AI verwenden. Stellen Sie in diesem Fall sicher, dass Sie alle Erwähnungen von smppy in Ihrem Trainingsskript durch smprof ersetzen.

Um bei der Aktualisierung des Python-Paketnamens von SageMaker Profiler in Ihren Trainingsskripten Verwirrung darüber zu vermeiden, welche Version des Paketnamens Sie verwenden sollten, ziehen Sie in Betracht, eine bedingte Importanweisung zu verwenden, wie im folgenden Codeausschnitt gezeigt.

try: import smprof except ImportError: # backward-compatability for TF 2.11 and PT 1.13.1 images import smppy as smprof

Wenn Sie smppy während des Upgrades auf die neuesten PyTorch- oder TensorFlow-Versionen verwendet haben, stellen Sie außerdem sicher, dass Sie das neueste smprof-Paket installieren, indem Sie den Anweisungen unter (Optional) Installieren des Python-Pakets von SageMaker Profiler folgen.

F: Ich erhalte eine Fehlermeldung, ModuleNotFoundError: No module named 'smprof'.

Stellen Sie zunächst sicher, dass Sie einen der offiziell unterstützten Framework-Container von SageMaker AI verwenden. Andernfalls können Sie das smprof-Paket installieren, indem Sie den Anweisungen unter (Optional) Installieren des Python-Pakets von SageMaker Profiler folgen.

F: Ich kann ProfilerConfig nicht importieren.

Wenn Sie mit dem SageMaker Python SDK nicht ProfilerConfig in Ihr Job-Launcher-Skript importieren können, verfügt Ihre lokale Umgebung oder der Jupyter-Kernel möglicherweise über eine deutlich veraltete Version des SageMaker Python SDK. Stellen Sie sicher, dass Sie das SDK auf die neueste Version aktualisieren.

$ pip install --upgrade sagemaker

F: Ich erhalte eine Fehlermeldung, aborted: core dumped when importing smprof into my training script.

In einer früheren Version von smprof tritt dieses Problem bei PyTorch 2.0+ und PyTorch Lightning auf. Um dieses Problem zu beheben, installieren Sie auch das neueste smprof-Paket, indem Sie den Anweisungen unter (Optional) Installieren des Python-Pakets von SageMaker Profiler folgen.

F: Ich kann die SageMaker-Profiler-Benutzeroberfläche von SageMaker Studio nicht finden. Wo finde ich sie?

Wählen Sie eine der folgenden Optionen aus, wenn Sie Zugriff auf die SageMaker-AI-Konsole haben.

Wenn Sie ein Domain-Benutzer sind und keinen Zugriff auf die SageMaker-AI-Konsole haben, können Sie über SageMaker Studio Classic auf die Anwendung zugreifen. Wählen Sie in diesem Fall die folgende Option: