翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
さまざまなタイプのインスタンスローカルストレージのストレージパスの管理
SageMaker AI でトレーニングジョブのストレージパスを設定するときは、以下を考慮します。
-
分散トレーニングのトレーニングアーティファクトを
/opt/ml/output/dataディレクトリに保存する場合は、サブディレクトリを正しく追加するか、モデル定義またはトレーニングスクリプトを介してアーティファクト固有のファイル名を使用する必要があります。サブディレクトリとファイル名が正しく設定されていない場合、すべての分散トレーニングワーカーが Amazon S3 の同じ出力パスの同じファイル名に出力を書き込む可能性があります。 -
カスタムトレーニングコンテナを使用する場合は、SageMaker トレーニングジョブの環境設定に役立つ SageMaker Training Toolkit
がインストールされていることを確認してください。それ以外の場合は、Dockerfile の環境変数を明示的に指定する必要があります。詳細については、「Create a container with your own algorithms and models」を参照してください。 -
NVMe SSD ボリュームで ML インスタンスを使用する場合、SageMaker AI は Amazon EBS gp2 ストレージをプロビジョニングしません。使用可能なストレージは、NVMe タイプのインスタンスのストレージ容量に固定されます。SageMaker AI は、インスタンスストレージの容量全体を使用するように、トレーニングデータセット、チェックポイント、モデルアーティファクト、および出力のストレージパスを構成します。例えば、NVMe タイプのインスタンスストレージを使用する ML インスタンスファミリーには、
ml.p4d、ml.g4dn、およびml.g5が含まれます。EBS 専用ストレージオプションを指定し、インスタンスストレージなしで ML インスタンスを 使用する場合、SageMaker AI Estimator クラスのvolume_sizeパラメータ (ResourceConfigAPI を使用している場合はVolumeSizeInGB) を介して EBS ボリュームのサイズを定義する必要があります。例えば、EBS ボリュームを使用する ML インスタンスファミリーには、ml.c5とml.p2が含まれます。インスタンスタイプとそのインスタンスストレージタイプやボリュームを検索するには、「Amazon EC2 インスタンスタイプ」を参照してください。 -
SageMaker トレーニングジョブのデフォルトのパスは、ML インスタンスの Amazon EBS ボリューム、または NVMe SSD ボリュームにマウントされます。SageMaker AI にトレーニングスクリプトを適応させる場合、SageMaker AI の環境変数とトレーニングストレージロケーションのデフォルトのパス に関する前のトピックで一覧表示されているデフォルトのパスを使用していることを確認してください。トレーニング中に一時的に大きなオブジェクトを保存するためのスクラッチスペースとして、
/tmpディレクトリを使用することをお勧めします。したがって、スペース不足のエラーを回避するため、/userや/homeなど、システムが割り当てられたスペースの小さなディスクにマウントされたディレクトリは使用しないでください。
詳細については、AWS 機械学習ブログ「Choose the best data source for your Amazon SageMaker training job