워크로드 배포 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

워크로드 배포

다음 예시에서는 Karpenter를 사용한 HyperPod 오토 스케일링이 워크로드 수요에 따라 노드를 자동으로 프로비저닝하는 방법을 보여줍니다. 이 예시에서는 기본 규모 조정 동작과 다중 가용 영역 배포 패턴을 보여줍니다.

간단한 워크로드 배포
  1. 다음 Kubernetes 배포에는 복제본 또는 포드당 1개의 CPU 및 256M의 메모리를 요청하는 포드가 포함됩니다. 이 시나리오에서는 포드가 아직 구동되지 않습니다.

    kubectl apply -f https://raw.githubusercontent.com/aws/karpenter-provider-aws/refs/heads/main/examples/workloads/inflate.yaml
  2. 스케일 업 프로세스를 테스트하려면 다음 명령을 실행합니다. Karpenter는 클러스터에 새 노드를 추가합니다.

    kubectl scale deployment inflate --replicas 10
  3. 스케일 다운 프로세스를 테스트하려면 다음 명령을 실행합니다. Karpenter는 클러스터에서 노드를 제거합니다.

    kubectl scale deployment inflate --replicas 0
여러 AZ에 워크로드 배포
  1. 다음 명령을 실행하여 배포 중인 포드가 최대 스큐 1로 여러 가용 영역에 고르게 분산되어야 하는 Kubernetes 배포를 실행하는 워크로드를 배포합니다.

    kubectl apply -f https://raw.githubusercontent.com/aws/karpenter-provider-aws/refs/heads/main/examples/workloads/spread-zone.yaml
  2. 다음 명령을 실행하여 포드 수를 조정합니다.

    kubectl scale deployment zone-spread --replicas 15

    Karpenter는 다른 가용 영역에서 하나 이상의 노드가 있는 클러스터에 새 노드를 추가합니다.

자세한 예는 GitHub의 Karpenter example workloads를 참조하세요.