

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 체크포인트 지정 활성화
<a name="model-checkpoints-enable"></a>

체크포인트 지정이 활성화된 후에는 SageMaker AI가 Amazon S3에 체크포인트를 저장하고, 훈련 작업을 체크포인트 S3 버킷과 동기화합니다. 체크포인트 S3 버킷에 S3 범용 버킷 또는 S3 디렉터리 버킷을 사용할 수 있습니다.

![훈련 중 체크포인트를 기록하는 아키텍처 다이어그램.](http://docs.aws.amazon.com/ko_kr/sagemaker/latest/dg/images/checkpoints_write.png)


다음 예시에서는 SageMaker AI 예측기를 구문화할 때 체크포인트 경로를 구성하는 방법을 보여줍니다. 체크포인트 지정을 활성화하려면 `checkpoint_s3_uri` 파라미터 및 `checkpoint_local_path` 파라미터를 예측기에 추가하세요.

다음 예시 템플릿에서는 일반 SageMaker AI 예측기를 만들고 체크포인트 지정을 사용하는 방법을 보여줍니다. `image_uri` 파라미터를 지정하면 이 템플릿을 지원 대상 알고리즘에 사용할 수 있습니다. SageMaker AI에서 지원하고 체크포인트 기능이 포함된 알고리즘의 Docker 이미지 URI를 찾으려면 [Docker Registry Paths and Example Code](https://docs.aws.amazon.com/sagemaker/latest/dg-ecr-paths/sagemaker-algo-docker-registry-paths)를 참조하세요. `estimator` 및 `Estimator`를 SageMaker AI 프레임워크의 다른 예측기 상위 클래스 및 예측기 클래스(예: `[TensorFlow](https://sagemaker.readthedocs.io/en/stable/frameworks/tensorflow/using_tf.html#create-an-estimator)`, `[PyTorch](https://sagemaker.readthedocs.io/en/stable/frameworks/pytorch/using_pytorch.html#create-an-estimator)`, `[MXNet](https://sagemaker.readthedocs.io/en/stable/frameworks/mxnet/using_mxnet.html#create-an-estimator)`, `[HuggingFace](https://huggingface.co/docs/sagemaker/train#create-a-hugging-face-estimator)`, `[XGBoost](https://sagemaker.readthedocs.io/en/stable/frameworks/xgboost/using_xgboost.html#create-an-estimator)`)로 바꿀 수도 있습니다.

```
import sagemaker
from sagemaker.estimator import Estimator

bucket=sagemaker.Session().default_bucket()
base_job_name="{{sagemaker-checkpoint-test}}"
checkpoint_in_bucket="{{checkpoints}}"

# The S3 URI to store the checkpoints
checkpoint_s3_bucket="s3://{}/{}/{}".format(bucket, base_job_name, checkpoint_in_bucket)

# The local path where the model will save its checkpoints in the training container
checkpoint_local_path="/opt/ml/checkpoints"

estimator = Estimator(
    ...
    image_uri="{{<ecr_path>}}/{{<algorithm-name>}}:{{<tag>}}" # Specify to use built-in algorithms
    output_path=bucket,
    base_job_name=base_job_name,
    
    # Parameters required to enable checkpointing
    checkpoint_s3_uri=checkpoint_s3_bucket,
    checkpoint_local_path=checkpoint_local_path
)
```

다음 2개 파라미터는 체크포인트 지정용 경로를 지정합니다.
+ `checkpoint_local_path` – 모델이 훈련 컨테이너에서 체크포인트를 주기적으로 저장하는 로컬 경로를 지정합니다. 기본 경로는 `'/opt/ml/checkpoints'`(으)로 설정됩니다. 다른 프레임워크를 사용하거나 자체 훈련 컨테이너를 가져오려면 훈련 스크립트의 체크포인트 구성에서 경로가 `'/opt/ml/checkpoints'`(으)로 지정되어 있는지 확인하세요.
**참고**  
`'/opt/ml/checkpoints'`가 SageMaker AI의 기본값 체크포인트 설정과 일치하도록 로컬 경로를 지정하는 것이 좋습니다. 로컬 경로를 직접 지정하려면 훈련 스크립트의 체크포인트 저장 경로와 SageMaker AI 예측기의 `checkpoint_local_path` 파라미터가 일치해야 합니다.
+ `checkpoint_s3_uri` – 체크포인트가 실시간으로 저장되는 S3 버킷의 URI입니다. 체크포인트를 저장할 S3 범용 버킷 또는 S3 디렉터리 버킷을 지정할 수 있습니다. S3 디렉터리 버킷에 대한 자세한 내용은 *Amazon Simple Storage Service 사용 설명서*의 [디렉터리 버킷](https://docs.aws.amazon.com/AmazonS3/latest/userguide/directory-buckets-overview.html)을 참조하세요.

SageMaker AI 예측기 파라미터의 전체 목록을 확인하려면 *[Amazon SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable) 설명서*의 [예측기 API](https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html#sagemaker.estimator.Estimator)를 참조하세요.