기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS PCS의 Slurm 버전에 대해 자주 묻는 질문
AWS PCS는 여러 Slurm 버전에 대한 지원을 유지합니다. 새 Slurm 버전이 도입되면 AWS PCS는 해당 버전이 SchedMD에서 지원 종료(EOS)에 도달할 때까지 기술 지원 및 보안 패치를 제공합니다. AWS PCS는 AWS 용어와 일치하도록 Slurm 버전의 EOS 날짜를 수명 종료(EOL)로 지칭합니다.
AWS PCS는 Slurm 버전을 얼마나 오래 지원하나요?
AWS Slurm 버전에 대한 PCS 지원은 SchedMD의 메이저 버전 지원 주기와 일치합니다. AWS PCS는 현재 버전과 2개의 최신 이전 메이저 버전을 지원합니다. SchedMD가 새 메이저 버전을 릴리스하면 AWS PCS는 지원되는 가장 오래된 버전에 대한 지원을 종료합니다. AWS PCS는 가능한 한 빨리 Slurm의 새 메이저 버전을 릴리스하지만 SchedMD의 릴리스와 AWS PCS에서의 가용성 사이에 지연이 있을 수 있습니다.
클러스터가 새 Slurm 패치 버전 릴리스를 받으려면 어떻게 해야 하나요?
버그 및 보안 수정을 해결하기 위해 AWS PCS는 내부 서비스 소유 계정에서 실행되는 클러스터 컨트롤러에 패치를 자동으로 적용하도록 설계되었습니다. 의 EC2 인스턴스에 패치를 설치하려면 컴퓨팅 노드 그룹의 AWS 계정 Amazon Machine Image(AMI)를 업데이트하고 업데이트된 AMI를 사용하도록 컴퓨팅 노드 그룹을 업데이트합니다. 자세한 내용은 AWS PCS용 사용자 지정 Amazon 머신 이미지(AMIs) 단원을 참조하십시오.
참고
Slurm 컨트롤러는 업데이트하는 동안 사용할 수 없습니다. 실행 중인 작업은 영향을 받지 않습니다. 클러스터의 컨트롤러를 사용할 수 없게 되기 전에 제출된 작업은 컨트롤러를 사용할 수 있을 때까지 보류됩니다.
예정된 Slurm 버전 EOL 이벤트에 대한 정보는 어떻게 받나요?
EOL 날짜 6개월 전에 이메일 메시지가 전송됩니다. 매월 EOL 날짜 1주일 전에 최종 이메일 메시지와 함께 EOL 날짜 1주일 전에 이메일 메시지가 전송됩니다. EOL 날짜 이후에는 EOL Slurm 버전으로 AWS PCS 클러스터를 실행하는 고객에게 12개월 동안 매월 이메일 메시지를 보냅니다. 해당 버전에 대한 보안 취약성이 식별되면 EOL Slurm 버전이 있는 클러스터를 일시 중지할 수 있습니다.
클러스터에서 사용하는 Slurm 버전이 EOL Slurm 버전을 실행 중인지 확인하려면 어떻게 해야 하나요?
EOL Slurm 버전의 클러스터가 실행 중임을 알리는 이메일 메시지가 전송됩니다. EOL Slurm 버전을 사용하는 클러스터의 세부 정보가 포함된 AWS Health Dashboard 알림을 알림에 게시합니다. 또한 AWS PCS 콘솔을 사용하여 EOL Slurm 버전이 있는 클러스터를 식별할 수 있습니다.
Slurm 버전이 EOL에 가깝거나 그 이상인 경우 어떻게 해야 하나요?
지원되는 최신 버전의 Slurm으로 새 클러스터를 생성하고 컴퓨팅 노드 그룹 AMIs. AMIs의 Slurm 버전과 실행 중인 EC2 인스턴스는 클러스터의 Slurm 버전보다 2개 이상 뒤쳐서는 안 됩니다. 자세한 내용은 AWS PCS용 사용자 지정 Amazon 머신 이미지(AMIs) 단원을 참조하십시오.
EOL 날짜까지 최신 버전의 Slurm으로 전환하지 않으면 어떻게 되나요?
EOL Slurm 버전으로 새 클러스터를 생성할 수 없습니다. 기존 클러스터는 AWS 지원 없이 최대 12개월 동안 작동할 수 있으며 작업을 유지 관리하는 데 즉각적인 조치가 필요하지 않습니다. EOL 날짜 이후에는 지원, 보안 업데이트 및 가용성이 보장되지 않습니다. 보안상의 이유로 클러스터를 일시 중지할 수 있습니다. 지원되는 Slurm 버전을 사용하여 AWS PCS 클러스터에 대한 보안 및 지원을 유지하는 것이 좋습니다.
EOL Slurm 버전으로 클러스터를 운영할 경우 어떤 위험이 있나요?
EOL Slurm 버전이 있는 클러스터에는 상당한 보안 및 운영 위험이 있습니다. SchedMD의 활성 모니터링이 없으면 보안 취약성이 감지되지 않거나 해결되지 않을 수 있습니다. 중요한 취약성이 발견되면 클러스터를 즉시 일시 중지할 수 있습니다.
클러스터가 일시 중지되면 작업, 클러스터 컴퓨팅, 스토리지 및 네트워킹 리소스는 어떻게 되나요?
AWS PCS에서 관리하는 모든 리소스가 종료됩니다. 여기에는 Slurm 컨트롤러, 컴퓨팅 노드 그룹 및 EC2 인스턴스가 포함됩니다. 컴퓨팅 인스턴스에서 실행되는 모든 작업은 즉시 종료되고 클러스터는 일시 중지 상태로 전환됩니다. 외부 파일 시스템과 같은 고객 관리형 리소스는 그대로 유지됩니다. AWS PCS 콘솔 및 API 작업을 사용하여 클러스터의 구성에 액세스할 수 있습니다.
일시 중지된 클러스터를 다시 시작하여 나머지 작업을 재개할 수 있습니까?
아니요, 일시 중지된 클러스터를 다시 시작할 수 없습니다. 일시 중지된 클러스터의 구성을 사용하여 지원되는 Slurm 버전으로 새 클러스터를 생성할 수 있습니다. 나머지 작업은 외부 파일 시스템에 저장한 경우 실행할 수 있습니다.
12개월 유예 기간 이후에 연장을 요청할 수 있나요?
아니요. 12개월 유예 기간 이후에는 클러스터를 실행하도록 확장을 요청할 수 없습니다. 지원되는 Slurm 버전으로 전환하는 데 도움이 되도록 연장된 시간을 제공합니다. 클러스터 작업이 중단되지 않도록 Slurm 버전이 EOL에 도달하기 전에 전환하는 것이 좋습니다.