

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# チェックポイントを有効にする
<a name="model-checkpoints-enable"></a>

チェックポイントを有効にすると、SageMaker AI はチェックポイントを Amazon S3 に保存し、トレーニングジョブをチェックポイント S3 バケットと同期します。チェックポイント S3 バケットには、S3 汎用バケットまたは S3 ディレクトリバケットを使用できます。

![\[トレーニング中のチェックポイント書き込みのアーキテクチャ図。\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/images/checkpoints_write.png)


次の例は、SageMaker AI 推定器を構築する際に、チェックポイントのパスを設定する方法を示しています。チェックポイントを有効にするには、推定器に `checkpoint_s3_uri` パラメータと `checkpoint_local_path` パラメータを指定します。

次のテンプレート例は、一般的な SageMaker AI 推定器を作成し、チェックポイントを有効にする方法を示します。`image_uri` パラメータを指定すると、このテンプレートをサポート対象のアルゴリズムに使用できます。SageMaker AI がサポートするチェックポイントアルゴリズムの Docker イメージ URI を見つけるには、「[Docker Registry Paths and Example Code](https://docs.aws.amazon.com/sagemaker/latest/dg-ecr-paths/sagemaker-algo-docker-registry-paths)」を参照してください。`estimator` と `Estimator` は、他の SageMaker AI フレームワークの推定器の親クラスや推定器クラス (`[TensorFlow](https://sagemaker.readthedocs.io/en/stable/frameworks/tensorflow/using_tf.html#create-an-estimator)`、`[PyTorch](https://sagemaker.readthedocs.io/en/stable/frameworks/pytorch/using_pytorch.html#create-an-estimator)`、`[MXNet](https://sagemaker.readthedocs.io/en/stable/frameworks/mxnet/using_mxnet.html#create-an-estimator)`、`[HuggingFace](https://huggingface.co/docs/sagemaker/train#create-a-hugging-face-estimator)`、`[XGBoost](https://sagemaker.readthedocs.io/en/stable/frameworks/xgboost/using_xgboost.html#create-an-estimator)` など) に置き換えることができます。

```
import sagemaker
from sagemaker.estimator import Estimator

bucket=sagemaker.Session().default_bucket()
base_job_name="sagemaker-checkpoint-test"
checkpoint_in_bucket="checkpoints"

# The S3 URI to store the checkpoints
checkpoint_s3_bucket="s3://{}/{}/{}".format(bucket, base_job_name, checkpoint_in_bucket)

# The local path where the model will save its checkpoints in the training container
checkpoint_local_path="/opt/ml/checkpoints"

estimator = Estimator(
    ...
    image_uri="<ecr_path>/<algorithm-name>:<tag>" # Specify to use built-in algorithms
    output_path=bucket,
    base_job_name=base_job_name,
    
    # Parameters required to enable checkpointing
    checkpoint_s3_uri=checkpoint_s3_bucket,
    checkpoint_local_path=checkpoint_local_path
)
```

次の 2 つのパラメータは、チェックポイントのパスを指定します。
+ `checkpoint_local_path` - モデルがチェックポイントを定期的に保存するトレーニングコンテナのローカルパスを指定します。デフォルトでは、パスは `'/opt/ml/checkpoints'` に設定されています。他のフレームワークを使用する場合、または独自のトレーニングコンテナを取り込む場合は、トレーニングスクリプトのチェックポイント設定のパスが `'/opt/ml/checkpoints'` に指定されていることを確認します。
**注記**  
デフォルトの SageMaker AI チェックポイント設定と一致するように、ローカルパスを `'/opt/ml/checkpoints'` に指定することをお勧めします。独自のローカルパスを指定する場合は、トレーニングスクリプトにおけるチェックポイントの保存パスと SageMaker AI 推定器の `checkpoint_local_path` パラメータが一致していることを確認してください。
+ `checkpoint_s3_uri` - チェックポイントをリアルタイムで保存する S3 バケットの URI。S3 汎用バケットまたは S3 ディレクトリバケットを指定して、チェックポイントを保存できます。S3 ディレクトリバケットの詳細については、*Amazon Simple Storage Service ユーザーガイド*の「[ディレクトリバケットの概要](https://docs.aws.amazon.com/AmazonS3/latest/userguide/directory-buckets-overview.html)」を参照してください。

SageMaker AI 推定器パラメータの完全なリストについては、*[Amazon SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable) ドキュメント*の[推定器 API](https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html#sagemaker.estimator.Estimator) を参照してください。