기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS PCS에서 클러스터 업데이트
AWS PCS를 사용하면 UpdateCluster API 또는 콘솔을 통해 생성된 클러스터 구성을 업데이트할 수 있습니다. 인프라를 재구축하지 않고도 클러스터 설정을 수정하여 운영 오버헤드를 줄이고 중단을 최소화할 수 있습니다.
클러스터 업데이트의 이점
AWS PCS 클러스터를 업데이트하면 서비스 중단 없이 HPC 인프라를 새로운 요구 사항에 맞게 조정할 수 있습니다. 클러스터를 다시 빌드하는 데 필요한 시간 이상이 아닌 몇 분 정도 걸립니다. 이 기능은 가동 중지 시간을 최소화해야 하는 프로덕션 환경과 워크로드 패턴 변화에 따라 클러스터 설정을 조정해야 하는 팀에 중요합니다.
지원되는 구성 변경 사항
세 가지 주요 설정 범주를 수정할 수 있습니다.
-
회계 구성 - 관리형 회계를 활성화 또는 비활성화하고 보존 설정을 구성합니다.
-
축소 동작 -
scaleDownIdleTime파라미터를 조정하여 동적 인스턴스가 유휴 상태로 유지되는 시간을 제어한 후 AWS PCS가 자동으로 종료합니다. -
Slurm 사용자 지정 설정 - Prolog, Epilog 및 SelectTypeParameters.
제한 사항
클러스터 생성 후에는 특정 구성을 수정할 수 없습니다. 다음이 포함됩니다.
-
보안 그룹 구성
-
VPC 서브넷 선택
-
클러스터 크기
-
Slurm 버전
-
클러스터 이름
이러한 설정은 클러스터 아키텍처의 기본이며 수정하려면 새 클러스터를 생성해야 합니다.
클러스터 업데이트를 위한 사전 조건
클러스터를 업데이트하기 전에 다음 조건이 충족되는지 확인합니다.
-
클러스터는
ACTIVE,UPDATE_FAILED또는SUSPENDED상태여야 합니다. -
연결된 모든 리소스(대기열, 컴퓨팅 노드 그룹)는
ACTIVE상태여야 합니다. -
UpdateCluster 작업에 대한 적절한 IAM 권한이 있어야 합니다.
-
진행 중인 다른 업데이트 작업은 없습니다.
프로세스 및 작업 영향 업데이트
업데이트 작업 중에 클러스터 컨트롤러에 잠시 연결할 수 없게 되더라도 컴퓨팅 노드는 기존 작업을 계속 실행합니다. 그러나 시스템은이 기간 동안 새 작업 제출을 수락하거나 일정을 결정할 수 없습니다.
콘솔 및 API 인터페이스를 통해 클러스터 업데이트를 모니터링할 수 있습니다. 클러스터는 업데이트 중에 다음 상태를 통해 전환됩니다.
-
UPDATING- 업데이트 진행 중 -
ACTIVE- 업데이트가 성공적으로 완료되었습니다. -
UPDATE_FAILED- 업데이트에 오류가 발생했습니다.
업데이트 중 결제
업데이트 작업 중에 AWS 도 PCS 클러스터에 대한 표준 시간당 요금이 계속 부과됩니다. 회계를 비활성화하도록 클러스터를 업데이트하면 클러스터가 UPDATING 상태가 되는 즉시 회계 기능에 대한 청구가 중지됩니다. 회계를 활성화하면 클러스터가 업데이트를 성공적으로 완료하고 ACTIVE 상태로 돌아갈 때까지 결제가 시작되지 않습니다.