기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS PCS의 Slurm 버전 릴리스 정보
이 주제에서는 현재 AWS PCS에서 지원되는 각 Slurm 버전의 중요한 변경 사항에 대해 설명합니다. 클러스터를 업그레이드할 때 이전 버전과 새 버전 간의 변경 사항을 검토하는 것이 좋습니다.
AWS PCS에 구현된 변경 사항
-
이제 Slurm requeue_on_resume_failure SchedulerParameter가 기본적으로 활성화됩니다.
-
"stderr"는 Slurm 25.05에서 비활성화되었으므로 LogTimeFormat의 옵션으로 제거되었습니다.
-
AWS PCS는 다중 클러스터 sackd 구성을 지원합니다. 로그인 노드는 여러 클러스터에 액세스할 수 있습니다.
Slurm 25.05에 대한 자세한 내용은 다음 간행물을 참조하세요.
AWS PCS에 구현된 변경 사항
-
AWS PCS는 Slurm 회계를 지원합니다. 자세한 내용은 AWS PCS의 Slurm 회계 단원을 참조하십시오.
Slurm 24.11에 대한 자세한 내용은 다음 간행물을 참조하세요.
AWS PCS에 구현된 변경 사항
-
이제 새 Slurm Step Manager 모듈이 AWS PCS에서 기본적으로 활성화됩니다. 이 모듈은 단계 관리를 중앙 컨트롤러에서 컴퓨팅 노드로 오프로드하여 단계 사용량이 많은 환경에서 시스템 동시성을 크게 개선함으로써 상당한 이점을 제공합니다. 이 구성을 지원하고 더 나은 격리
Prolog및Epilog프로세스 실행을 위해 새 prolog 플래그(Contain,Alloc)가 활성화됩니다. -
컨트롤러에서 컴퓨팅 노드로의 계층적 통신은 Slurm 노드 내 통신을 최적화하도록 활성화되어 확장성과 성능을 개선합니다. 또한 라우팅 구성은 이제 플러그인의 기본 라우팅 알고리즘 대신 컨트롤러와의 통신에 파티션 노드 목록을 사용하여 시스템 복원력을 개선합니다.
-
새 해시 플러그인은 이전를
HashPlugin=hash/sha3대체합니다hash/k12 plugin. 이제 AWS PCS 클러스터에서이 기능이 기본적으로 활성화됩니다. -
Slurm 컨트롤러 로그에는 이제에 대한 모든 인바운드 원격 프로시저 호출(RPC)에 대한 향상된 감사 기능이 포함됩니다
slurmctld. 로그에는 연결 처리 전 소스 주소, 인증된 사용자 및 RPC 유형이 포함됩니다.
Slurm 24.05에 대한 자세한 내용은 다음 간행물을 참조하세요.
AWS PCS에서 변경할 수 있는 Slurm 설정
-
의
SuspendTime기본값은 입니다60. AWS PCSscaleDownIdleTimeInSeconds구성 파라미터를 사용하여 설정합니다. 자세한 내용은 AWS PCS API 참조에서ClusterSlurmConfiguration데이터 형식의scaleDownIdleTimeInSeconds파라미터를 참조하세요. -
MaxJobCount및MaxArraySize는 클러스터에 대해 선택한 크기를 기반으로 합니다. 자세한 내용은 PCSCreateClusterAPI 참조에서 API 작업의size파라미터를 참조하세요. AWS -
SelectTypeParametersSlurm 설정은 기본적으로 입니다CR_CPU. 클러스터를 생성할 때slurmCustomSettings에서 설정할 값으로 제공할 수 있습니다. 자세한 내용은 API 작업의slurmCustomSettings파라미터 및 PCSCreateClusterAPI 참조의 SlurmCustomSetting을 참조하세요. AWS -
클러스터
Epilog수준에서Prolog및를 설정할 수 있습니다. 클러스터를 생성할 때slurmCustomSettings에서 설정할 값으로 제공할 수 있습니다. 자세한 내용은CreateCluster및 PCS API 참조의 SlurmCustomSetting을 참조하세요. AWS -
컴퓨팅 노드 그룹 수준에서
Weight및RealMemory를 설정할 수 있습니다. 컴퓨팅 노드 그룹을 생성할 때에서slurmCustomSettings설정할 값으로 제공할 수 있습니다. 자세한 내용은 PCS API 참조의CreateComputeNodeGroup및 SlurmCustomSetting을 참조하세요. AWS