AWS PCS에서 사용자 지정 Slurm 설정 문제 해결 - AWS PCS

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS PCS에서 사용자 지정 Slurm 설정 문제 해결

Slurm 사용자 지정 설정으로 AWS PCS 리소스를 생성하거나 업데이트할 때 오류가 발생하면 로깅을 사용하여 문제를 진단하고 해결할 수 있습니다.

호환되지 않는 Slurm 사용자 지정 설정 문제 해결

문제: 클러스터, 컴퓨팅 노드 그룹 또는 대기열 작업을 수행할 때 다음과 비슷한 오류 메시지가 표시됩니다.

{OPERATION} failed. The Slurm custom settings of the cluster might be incompatible. Check the settings and try again.

이 오류는 다음 작업에서 발생할 수 있습니다.

  • CreateCluster

  • CreateComputeNodeGroup

  • UpdateComputeNodeGroup

  • CreateQueue

  • UpdateQueue

해결 방법: 로깅을 활성화하여 특정 문제를 이해하고 호환되지 않는 설정을 해결합니다.

호환되지 않는 Slurm 사용자 지정 설정 문제를 해결하려면
  1. 클러스터가 아직 존재하지 않는 경우 클러스터를 생성하거나 기존 클러스터가 로깅을 활성화할 수 있는 상태인지 확인합니다.

  2. 클러스터에 대한 로깅을 활성화합니다. 자세한 지침은 AWS PCS에 대한 로깅 및 모니터링 섹션을 참조하세요.

    참고

    클러스터가 생성되면 로깅을 활성화할 수 있습니다.

  3. 로그를 검토하여 비호환성을 유발하는 특정 Slurm 구성 문제를 식별합니다.

  4. 로그 정보를 기반으로 호환되지 않는 사용자 지정 설정을 수정하고 작업을 다시 시도합니다.

지원되는 Slurm 사용자 지정 설정에 대한 자세한 내용은 다음을 참조하세요.