릴리스 정보 및 문서 기록 - AWS ParallelCluster

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

릴리스 정보 및 문서 기록

다음 표에서는 AWS ParallelCluster 사용 설명서의 주요 업데이트 및 새로운 기능에 대해 설명합니다. 사용자로부터 받은 의견을 수렴하기 위해 설명서가 자주 업데이트됩니다.

AWS ParallelCluster
변경 사항 설명 날짜

AWS ParallelCluster 버전 3.13.2 릴리스

업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster.

버그 수정:

  • 컴퓨팅 리소스가 EC2 APIupdate-compute-fleet를 통해 더 이상 액세스할 수 없는 만료된 용량 예약을 참조할 때 update-cluster 및가 실패할 수 있는 버그를 수정합니다. APIs

  • 상위 이미지에 최신 커널 버전이 제공되지 않을 때 발생하는 Rocky 9의 build-image 실패를 수정했습니다. https://github.com/aws/aws-parallelcluster/issues/6874 참조하십시오.

2025년 6월 24일

AWS ParallelCluster 버전 3.13.1 릴리스

업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster.

변경 사항:

  • Slurm을 버전 24.05.8로 업그레이드합니다.

  • EFA 설치 프로그램을 1.41.0(1.38.1부터)으로 업그레이드합니다.

    • Efa-driver: efa-2.15.0-1

    • Efa-config: efa-config-1.18-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-2.1.0-1

    • Rdma-core: rdma-core-57.0-1

    • Open MPI: openmpi40-aws-4.1.7-2 및 openmpi50-aws-5.0.6

  • 비 Amazon Linux AMI의 경우 amazon-efs-utils를 버전 2.3.1(v2.1.0에서)로 업그레이드합니다.

  • us-isob-east-1 및 us-iso-east-1에서 DCV를 지원합니다.

  • us-isob-east-1 및 us-iso-east-1에서 Lustre 및 Ontap용 FSX를 지원합니다.

  • 시작 부분에 고정하고 완료 시 고정 해제하여 ParallelCluster 이미지 빌드 전체에서 커널 일관성을 보장합니다.

버그 수정:

  • ARM 성능 라이브러리 설치 시 격리된 환경에서 빌드 이미지가 실패하는 버그를 수정했습니다.

  • 스크립트 'update_directory_service_password.sh'가 AD 암호를 업데이트하지 못하게 하는 버그를 수정했습니다.

2025년 6월 4일

AWS ParallelCluster 버전 3.13.0 릴리스

업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster.

사용 중단:

  • Ubuntu 20.04는 2025년 5월에 End-Of-Standard-Support에 포함되므로 Ubuntu 20.04를 지원하는 마지막 ParallelCluster 릴리스입니다.

개선 사항:

  • Ubuntu 24.04에 대한 지원을 추가합니다.

  • ap-southeast-7 리전에 대한 지원을 추가합니다.

  • 보안을 강화하기 위해 공식 ParallelCluster AMIs에서 미사용 서비스 컵 및 wpa_supplicant를 비활성화합니다.

변경 사항:

  • Slurm을 버전 24.05.7로 업그레이드합니다.

  • AL2를 제외한 모든 OS에 대해 NVIDIA 드라이버를 버전 570.86.15(550.127.08에서)로 업그레이드합니다. OSs

  • AL2를 제외한 모든 OS에 대해 CUDA Toolkit을 버전 12.8.0(12.4.1부터)으로 업그레이드합니다. OSs

  • AL2(3.9.20부터)를 제외한 모든 OSs에 대해 Python을 3.12.8로 업그레이드합니다. AL2

  • Ubuntu 22.04에서는 커널을 컴파일하는 데 사용된 것과 동일한 컴파일러 버전으로 Nvidia 드라이버를 설치합니다.

  • 버전 2.0-33aws-cfn-bootstrap으로 업그레이드합니다.

  • EFA 설치 프로그램을 1.38.0(1.36.0에서)으로 업그레이드합니다.

    • Efa-driver: efa-2.13.0-1

    • Efa-config: efa-config-1.17-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma-core: rdma-core-54.0-1

    • 오픈 MPI: openmpi40-aws-4.1.7-1openmpi50-aws-5.0.5

  • amazon-efs-utils 버전 2.1.0으로 업그레이드합니다.

  • 타사 쿡북 제거: apt-7.5.22 및 pyenv-4.2.3.

  • 서드 파티 쿡북 종속성 업그레이드:

    • line-4.5.21(line-4.5.13에서)

    • nfs-5.1.5(nfs-5.1.2부터)

    • openssh-2.11.14(Openssh-2.11.12부터)

    • yum-7.4.20(yum-7.4.13부터)

    • yum-epel-5.0.8(yum-epel-5.0.2에서)

  • Pmix를 5.0.6(5.0.3에서)으로 업그레이드합니다.

  • ARM PL을 버전 24.10(23.10부터)으로 업그레이드합니다.

  • Lambda 계층 및 설치 관리자에서 Python을 버전 3.12.8(3.9.17부터)로 업그레이드합니다.

  • Lambda 계층 및 설치 관리자에서 NodeJS를 버전 20.18.3(18.20.3부터)으로 업그레이드합니다.

  • OpenSSH 9.7 이상에서 지원되지 않는 DSA로 로그인 노드에 대한 DSA 키 생성을 제거합니다.

  • 컴퓨팅 노드 시작 시 Slurm에서 인스턴스 ID 및 인스턴스 유형 정보를 설정합니다.

  • 이제 NVIDIA 설치 프로그램에서 더 이상 사용되지 않는 'no-cc-version-check' 옵션 없이 NVIDIA 드라이버를 설치합니다.

  • 최대 10개의 로그인 노드 풀을 적용할 검사기를 추가합니다.

  • 기본 루트 볼륨 크기를 45GB로 업데이트합니다.

버그 수정:

  • 컴퓨팅 노드 부트스트래핑에 대한 cfn-init 사용을 제거하여 노드 스케일 업 시간을 줄입니다.

  • 프록시를 사용할 때 컴퓨팅 노드 부트스트랩 실패를 일으키는 문제를 해결합니다.

  • Ubuntu 22.04에서는 설치 실패를 방지하기 위해 커널을 컴파일하는 데 사용된 것과 동일한 컴파일러 버전으로 Nvidia 드라이버를 설치합니다.- 업데이트 중에 헤드 노드에서만 aws-parallelcluster-node 패키지 재정의 실행을 수정합니다.

  • 다중 사용자 환경(Active Directory와 통합됨)에서 Pyxis/Enroot를 통해 실행된 컨테이너화된 작업이 실패하는 문제를 해결합니다.

  • 디렉터리 서비스를 사용할 때 Rocky 9.5 이상에서 노드 부트스트랩 실패를 유발하는 authselect 사용을 수정했습니다.

2025년 4월 1일

AWS ParallelCluster 버전 3.12.0 릴리스

업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster.

개선 사항:

  • 새 빌드 이미지 구성 섹션을 추가하여 NVIDIA 소프트웨어 및 Lustre 클라이언트 설치를 Build/Installation 켜거나 끕니다. 기본적으로 NVIDIA 소프트웨어는 공식 ParallelCluster AMIs에 포함되어 있지만에서 설치하지 않습니다build-image. 기본적으로 Lustre 클라이언트가 설치됩니다.

  • CLI 명령 export-cluster-logs 및는 이제 기본적으로 로그를 기본 ParallelCluster 버킷 또는 구성에 지정된 경우 CustomS3Bucket으로 내보낼 export-image-logs 수 있습니다.

  • Amazon DCV 지원을 ARM 인스턴스의 Ubuntu2204로 확장합니다.

변경 사항:

  • NVIDIA 드라이버를 버전 550.127.08(550.90.07에서)로 업그레이드합니다. 이를 통해 NVIDIA의 알려진 문제를 해결할 수 있습니다. 자세한 내용은 NVIDIA 데이터 센터 설명서알려진 문제를 참조하세요.

  • Amazon DCV를 버전 로 업그레이드합니다2024.0-18131.

    • server: 2024.0-18131-1

    • xdcv: 2024.0.631-1

    • gl: 2024.0.1078-1

    • web_viewer: 2024.0-18131-1

  • EFA 설치 프로그램을 1.36.0으로 업그레이드

    • Efa-driver: efa-2.13.0-1

    • Efa-config: efa-config-1.17-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma-core: rdma-core-54.0-1

    • 오픈 MPI: openmpi40-aws-4.1.7-1openmpi50-aws-5.0.5

  • 실패 시 slurmctld를 자동으로 다시 시작합니다.

  • mysql-community-client를 버전 8.0.39로 업그레이드합니다.

  • 수명이 종료된 Python 3.7 및 3.8에 대한 지원을 제거합니다.

버그 수정:

  • 클러스터 업데이트 중에 사용자 지정 작업 스크립트 시퀀스의 변경 사항이 감지되지 않는 문제를 해결합니다.

  • AWS ParallelCluster API에 누락된 권한을 추가하여 로그인 노드를 배포하는 데 필요한 Elastic Load Balancing 및 Auto Scaling에 대한 서비스 연결 역할을 생성합니다.

  • 로컬 영역을 올바르게 처리할 수 있도록 볼륨을 관리할 때 리전을 가져오는 방식의 문제를 해결합니다.

  • 업데이트 AccessPointIds 중에에 EFS 파일 시스템을 추가하는 데 실패하는 문제를 해결합니다.

  • PCAPI를 사용할 때 유형이 아닌 파라미터String(예: )를 업데이트할 때 클러스터 업데이트가 실패할 수 있는 문제를 해결합니다MaxCount.

  • 외부 OpenZFS를 탑재할 때 더 이상 포트 111, 2049, 20001, 20002, 20003에 대한 아웃바운드 규칙을 설정할 필요가 없습니다.

2024년 12월 19일

AWS ParallelCluster 버전 3.11.1 릴리스

기능:

  • 이제 Pyxis는 기본적으로 비활성화되므로 제품 설명서에 설명된 대로 수동으로 활성화해야 합니다.

  • ParallelCluster Lambda Layer에서 Python 런타임을 버전 3.12로 업그레이드합니다.

  • setuptools의 버전 고정을 70.0.0 이전 버전으로 제거합니다.

  • libjwt를 버전 1.17.0으로 업그레이드.

  • 전체 변경 로그

버그 수정

  • 작업 제출 실패로 이어질 수 있는 ParallelCluster의 Pyxis Slurm 플러그인을 구성하는 방식의 문제를 해결합니다.

  • 정책의 퍼블릭 템플릿에서 로그인 노드에 필요한 누락된 권한을 추가하여 로그인 노드가 있는 구성에서 배포가 실패하는 문제를 해결합니다. https://github.com/aws/aws-parallelcluster/issues/6483

2024년 10월 21일

AWS ParallelCluster 버전 3.11.0 릴리스

개선 사항

  • 로그인 노드에서 사용자 지정 작업에 대한 지원을 추가합니다.

  • 로그인 노드에 대한 DCV 연결을 허용합니다.

  • ap-southeast-3 리전에 대한 지원을 추가합니다.

  • 로그인 노드 네트워크 로드 밸런서에 보안 그룹을 추가합니다.

  • 로그인 노드에 대한 AllowedIps 구성을 추가합니다.

  • 탑재SharedStorage/EfsSettings/AccessPointId에 대한 선택적 EFS 액세스 포인트를 지정하는 새 구성 추가

  • 최대 10개의 로그인 노드 풀을 허용합니다.

  • 공식 pcluster AMIs에 enroot 및 pyxis 설치

변경 사항

  • [BREAKING] API DescribeCluster 및 CLI 명령에서 반환describe-clusterloginNodes 필드가 여러 로그인 노드 풀을 지원하도록 사전에서 배열로 변경되었습니다. 이 변경 사항은 이전 버전과의 호환성을 깨뜨리므로 이러한 작업은 이전 버전과 함께 배포된 클러스터와 호환되지 않습니다.

  • Slurm을 23.11.10(23.11.7부터)로 업그레이드합니다.

  • Pmix를 5.0.3(5.0.2에서)으로 업그레이드합니다.

  • EFA 설치 프로그램을 1.34.0으로 업그레이드

    • Efa-driver: efa-2.10.0-1

    • Efa-config: efa-config-1.17-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma-core: rdma-core-52.0-1

    • 오픈 MPI: openmpi40-aws-4.1.6-3openmpi50-aws-5.0.3-11

  • NVIDIA 드라이버를 버전 550.90.07(535.183.01에서)로 업그레이드합니다.

  • CUDA 도구 키트를 버전 12.4.1(12.2.2부터)로 업그레이드합니다.

  • Python을 3.9.20(3.9.19부터)로 업그레이드합니다.

  • Intel MPI 라이브러리를 2021.13.1.769(2021.12.1.8부터)로 업그레이드합니다.

버그 수정

  • 용량 블록을 사용할 때 배치 그룹을 구성하지 EfaPlacementGroupValidator 않도록 검사기를 수정했습니다.

  • 보안 그룹 규칙 이후에 FSx for Lustre 파일 시스템이 생성되도록 하여 가끔 발생하는 클러스터 생성 실패를 수정합니다.

  • 배치 그룹이 활성화된 경우 클러스터 삭제 실패를 수정합니다.

  • SSH 액세스를 제한할 때 로그인 노드가 비정상으로 표시되는 문제를 해결합니다.

  • 올바른 S3 URL을 가져올 수 retrieve_supported_regions 있도록 수정했습니다.

  • 페이지 매김describe_images을 사용하도록 수정했습니다.

  • LoginNodes/Networking/SubnetIds에 기본 VPC 서브넷을 지정할 때 No route tables found 버그를 수정합니다. LoginNodes/Networking/SubnetIds

2024년 9월 26일

AWS ParallelCluster 버전 3.10.1 릴리스

버그 수정

  • 중국 리전에서 이미지 빌드 실패를 수정했습니다.

2024년 7월 8일

AWS ParallelCluster 버전 3.10.0 릴리스

개선 사항:

  • 새 구성 섹션을 추가하여 클러스터를 외부 Slurmdbd에 Scheduling/SlurmSettings/ExternalSlurmdbd 연결합니다.

  • 격리된 네트워크에서 build-image를 실행하도록 허용합니다.

  • Amazon Linux 2023에 대한 지원을 추가합니다.

  • 에 대한 지원을 price-capacity-optimized로 추가합니다AllocationStrategy.

  • 용량 블록이 있는 배치 그룹의 사용을 방지하기 위해 검사기를 추가합니다.

변경 사항:

  • CentOS 7은 더 이상 지원되지 않습니다.

  • Cinc Client를 18.4.12에서 18.2.7로 업그레이드합니다.

  • munge를 버전 0.5.16(0.5.15에서)으로 업그레이드합니다.

  • Pmix를 5.0.2(4.2.9에서)로 업그레이드합니다.

  • 서드 파티 쿡북 종속성 업그레이드:

    • apt-7.5.22(apt-7.5.14부터)

    • openssh-2.11.12(Openssh-2.11.3부터)

  • 타사 쿡북 제거: selinux-6.1.12.

  • EFA 설치 프로그램을 1.32.0으로 업그레이드

    • Efa-driver: efa-2.8.0-1

    • Efa-config: efa-config-1.16-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.21.0-1

    • Rdma-core: rdma-core-50.0-1

    • 오픈 MPI: openmpi40-aws-4.1.6-3openmpi50-aws-5.0.2-12

  • NVIDIA 드라이버를 버전 535.183.01(535.154.05에서)로 업그레이드합니다.

  • Python을 3.9.19(3.9.17부터)로 업그레이드합니다.

  • Intel MPI 라이브러리를 2021.12.1.8(2021.9.0.43482부터)로 업그레이드합니다.

버그 수정:

  • AutoExportPolicyAutoImportPolicy 선택 사항을 만들도록 데이터 리포지토리 연결 구성을 수정합니다.

  • 클러스터 삭제 중 인스턴스가 종료 또는 종료 상태일 때 컴퓨팅 플릿 정리를 완료하는 문제를 수정했습니다. 이는 종료 주기가 더 긴 인스턴스 유형에 대한 클러스터 삭제 실패를 방지하기 위한 것입니다.

  • 클러스터 구성의 Monitoring 섹션에서 Cloudwatch 대시보드를 활성화하고 경보를 비활성화할 수 있습니다.

  • ParallelCluster 사용자 지정 리소스가를 사용하여 검사기를 억제하도록 허용합니다PclusterCluster/SuppressValidators.

  • 모든 사용자 로그인 시 실행되지 않고 PATH 환경 변수에 추가되지 /etc/profile.d/pcluster.sh 않도록 cfn_bootstrap_virtualenv를 제거합니다.

  • DescribeCluster 응답에서 필드를 failureReason로 대체하여 ParallelCluster API 사양을 수정failures합니다.

  • 누락된 CloudFormation 스택 상태를 추가하여 ParallelCluster API 사양을 수정합니다. IMPORT_*, REVIEW_IN_PROGRESSUPDATE_FAILED.

  • 클러스터 업데이트가 전송 중 암호화가 있는 EFS 파일 시스템을 포함하지 못하는 문제를 수정했습니다.

  • EFS를 공유 내부 데이터에 사용할 때 헤드 노드 재부팅 시 slurmctld 및 slurmdbd 서비스가 다시 시작되지 않는 문제를 수정했습니다.

  • Ubuntu 시스템에서 ParallelCluster에서 가져온 구성으로 클래시된 cloud-init 로그 파일의 기본 로그 순회 구성을 제거합니다.

  • RHEL 8.10 이상에서 이미지 빌드 실패를 수정합니다.

2024년 6월 27일

AWS ParallelCluster 버전 3.9.3 릴리스

업그레이드하려면 sudo pip install --upgrade aws-parallelcluster를 입력

기능:

  • us-iso-east-1에서 FSx Lustre에 대한 지원을 공유 스토리지 유형으로 추가했습니다.

버그 수정:

  • Slurm 팬아웃 문제를 방지하려면 Slurm 구성의 SlurmctldParameters에서 cloud_dns를 제거합니다.

    인스턴스 시작 시 IP 주소를 설정하므로 필수는 아닙니다.

2024년 6월 19일

AWS ParallelCluster 버전 3.9.2 릴리스

기능:

  • Slurm을 23.11.7(23.11.4부터)로 업그레이드합니다.

  • 자세한 내용은 GitHub의 CHANGELOG 3.9.2를 참조하십시오.

2024년 5월 28일

AWS ParallelCluster 버전 3.9.1 릴리스

업그레이드하려면 다음을 입력합니다. sudo pip install --upgrade aws-parallelcluster

버그 수정

  • 업데이트 클러스터 작업의 일부로 파일 시스템을 마운트 해제할 때 공유 스토리지 mountdir의 반복 삭제를 제거합니다.

2024년 4월 11일

AWS ParallelCluster 버전 3.9.0 릴리스

업그레이드하려면 다음을 입력합니다. sudo pip install --upgrade aws-parallelcluster

개선 사항:

  • 사용자가 기본 사용자의 홈 디렉터리를 /home(기본값) 대신 /local/home으로 이동할 수 있도록 구성 파라미터 DeploymentSettings/DefaultUserHome을 추가합니다.

  • 컴퓨팅 플릿을 중지할 필요 없이 MinCount, MaxCount, QueueComputeResource 구성 파라미터를 업데이트할 수 있도록 허용합니다. 이제 Scheduling/SlurmSettings/QueueUpdateStrategy를 TERMINATE로 설정하여 업데이트할 수 있습니다. AWS ParallelCluster 는 클러스터 업데이트를 통해 수행되는 클러스터 용량의 크기 조정 중에 제거된 노드만 종료합니다.

  • 컴퓨팅 및 로그인 플릿을 교체하지 않고 Efs, FsxLustre, FsxOntap, FsxOpenZfs 및 FileCache 유형의 외부 공유 스토리지를 업데이트할 수 있도록 허용합니다.

  • RHEL9 지원 추가.

  • build-image 프로세스를 통해 생성된 CustomAmi로 Rocky Linux 9에 대한 지원을 추가합니다. 현재 public official AWS ParallelCluster Rocky9 Linux AMI를 사용할 수 없습니다.

  • 사용자 지정 Slurm 설정 거부 목록에서 CommunicationParameters를 제거합니다.

  • 지원되는 OSes에서 기본 사용자의 sudo 액세스를 비활성화하는 DeploymentSettings/DisableSudoAccessForDefaultUser 파라미터를 추가합니다.

  • ParallelCluster에서 생성한 FSx for Lustre 파일 시스템에 대한 변경 사항: Lustre 서버 버전을 2.15.로 변경

  • ['cluster']['nvidia']['kernel_open'] 쿡북 노드 속성을 통해 AMI를 구축할 때 오픈 소스 Nvidia 드라이버와 클로즈 소스 Nvidia 드라이버 중에서 선택할 수 있는 가능성을 추가합니다.

  • * clustermgtd 구성 옵션 ec2_instance_missing_max_count를 추가하여 최종 Amazon EC2에 대해 구성 가능한 재시도 횟수가 실행 인스턴스와의 인스턴스 일관성을 설명할 수 있도록 합니다.

변경 사항

  • Slurm을 23.11.4(23.02.7부터)로 업그레이드합니다.

  • NVIDIA 드라이버를 버전 535.154.05로 업그레이드합니다.

  • pcluster CLI 및 aws-parallelcluster-batch-cli에서 Python 3.11, 3.12에 대한 지원을 추가합니다.

  • MaximumNetworkCards 범위를 루핑하는 대신 Amazon EC2 DescribeInstances 응답 목록 NetworkCardIndex의 네트워크 카드 인덱스를 사용하여 네트워크 인터페이스를 구축합니다.

  • 인스턴스 유형 P3, G3, P2 및 G2를 사용하는 경우 GPU 아키텍처가 3.8.0 릴리스의 일부로 도입된 오픈 소스 Nvidia 드라이버(OpenRM)와 호환되지 않으므로 클러스터 생성에 실패합니다.

  • 타사 쿡북 종속성 업그레이드: nfs-5.1.2(nfs-5.0.0에서)

  • EFA 설치 프로그램을 1.30.0.으로 업그레이드

    • Efa-driver: efa-2.6.0-1

    • Efa-config: efa-config-1.15-1

    • Efa-profile: efa-profile-1.6-1

    • Libfabric-aws: libfabric-aws-1.19.0

    • Rdma-core: rdma-core-46.0-1

    • 오픈 MPI: openmpi40-aws-4.1.6-2openmpi50-aws-5.0.0-11

  • NICE DCV를 버전 2023.1-16388.로 업그레이드

    • server: 2023.1.16388-1

    • xdcv: 2023.1.565-1

    • gl: 2023.1.1047-1

    • web_viewer: 2023.1.16388-1

버그 수정

  • 로그인 노드에서 Active Directory 사용자로 제출할 때 작업 실패 문제를 해결합니다. 헤드 노드의 외부 Active Directory와의 통합이 불완전하게 구성되었기 때문에 문제가 발생했습니다.

  • CloudFormation 템플릿 parallelclutser-policies.yaml에 정의된 IAM 정책을 리팩터링하여 IAM 제한을 초과하는 정책으로 인한 ParallelCluster API 배포 실패를 방지합니다.

  • 헤드 노드가 키를 쓸 때 예상보다 많은 시간이 걸릴 때 로그인 노드가 부트스트랩에 실패하는 문제를 해결합니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2024년 3월 5일

AWS ParallelCluster 버전 3.8.0 릴리스

AWS ParallelCluster 버전 3.8.0 릴리스.

개선 사항:

  • Amazon EC2 Capacity Blocks for ML에 대한 지원을 추가합니다.

  • build-image 프로세스를 통해 생성된 CustomAmi로 Rocky Linux 8에 대한 지원을 추가합니다. 현재 퍼블릭 official AWS ParallelCluster Rocky8 Linux AMI를 사용할 수 없습니다.

  • Slurm 컴퓨팅 노드용 Amazon EC2 인스턴스를 시작할 때 사용할 클러스터 조정 전략을 제어하는 Scheduling/ScalingStrategy 파라미터를 추가합니다. 가능한 값은 all-or-nothing, greedy-all-or-nothing, best-effort이며 기본값은 all-or-nothing입니다.

  • 클러스터 내 공유 파일 시스템 리소스의 헤드 노드 루트 볼륨에서 NFS 내보내기 대신 EFS 스토리지를 사용하도록 HeadNode/SharedStorageType 파라미터를 추가합니다. ParallelCluster, Intel, Slurm 및 /home 데이터. 이렇게 개선하면 헤드 노드 네트워킹의 부하가 줄어듭니다.

  • 구성 파일의 SharedStorage 섹션을 통해 /home을 EFS 또는 FSx 외부 공유 스토리지로 탑재할 수 있습니다.

  • 새 파라미터를 추가하여 SlurmSettings/MungeKeySecretArn가 AWS Secrets Manager의 외부 사용자 정의 MUNGE 키를 사용하도록 허용합니다.

  • Monitoring/Alarms/Enabled 파라미터를 추가하여 클러스터에 대한 Amazon CloudWatch 경보를 전환합니다.

  • 헤드 노드 경보를 추가하여 Amazon EC2 상태 확인, CPU 사용률 및 헤드 노드의 전체 상태를 모니터링하고 클러스터로 생성된 CloudWatch Dashboard에 추가합니다.

  • PERSISTENT_2를 관리형 FSx for Lustre에 대한 DeploymentType으로 사용할 때 데이터 리포지토리 연결에 대한 지원을 추가합니다.

  • 사용자가 Slurm 회계에 사용할 데이터베이스 서버의 데이터베이스에 대한 사용자 지정 이름을 지정할 수 있도록 Scheduling/SlurmSettings/Database/DatabaseName 파라미터를 추가합니다.

  • 컴퓨팅 리소스에서 CapacityReservationTarget/CapacityReservationId를 구성할 때 선택적 구성 파라미터 InstanceType을 작성합니다.

  • AWS ParallelCluster API에서 생성한 IAM 역할 및 정책의 접두사를 지정할 수 있는 가능성을 추가합니다.

  • AWS ParallelCluster API에서 생성한 IAM 역할 및 정책에 적용할 권한 경계를 지정할 수 있는 가능성을 추가합니다.

변경 사항

  • Slurm을 23.02.7(23.02.6부터)로 업그레이드합니다.

  • NVIDIA 드라이버를 버전 535.129.03으로 업그레이드합니다.

  • CUDA Toolkit을 버전 12.2.2로 업그레이드합니다.

  • 오픈 소스 NVIDIA GPU 드라이버(OpenRM)를 NVIDIA 클로즈 소스 모듈 대신 Linux용 NVIDIA 커널 모듈로 사용합니다.

  • Scheduling/ScalingStrategy 클러스터 all_or_nothing_batch 구성을 위해 Slurm 재개 프로그램에서 구성 파라미터에 대한 지원을 제거합니다.

  • 클러스터 경보 명명 규칙이 '[cluster-name]-[component-name]-[metric]'으로 변경되었습니다.

  • 루트 볼륨과 추가 볼륨 모두에서 ADC 리전의 기본 EBS 볼륨 유형을 gp2에서 gp3으로 변경합니다.

  • 이제 AWS ParallelCluster API 인프라에서 생성한 모든 IAM 역할에 API에 대한 선택적 권한 경계가 적용됩니다.

    • EFA 설치 프로그램을 1.29.1으로 업그레이드

    • Efa-driver: efa-2.6.0-1

    • Efa-config: efa-config-1.15-1

    • Efa-profile: efa-profile-1.5-1

    • Libfabric-aws: libfabric-aws-1.19.0-1

    • Rdma-core: rdma-core-46.0-1

    • Open MPI: openmpi40-aws-4.1.6-1

  • 버전 2.3.1이 사용되는 Centos 7을 제외하고 지원되는 OSes에서 GDRCopy를 버전 2.4로 업그레이드합니다.

  • aws-cfn-bootstrap이 버전 2.0-28로 업그레이드됩니다.

  • aws-parallelcluster-batch-cli에서 Python 3.10에 대한 지원을 추가합니다.

버그 수정

  • 컴퓨팅 리소스에 선언된 인스턴스 유형 목록을 수정할 때 클러스터 업데이트 롤백 후 일관성 없는 조정 구성을 수정합니다.

  • 클러스터 구성 파일을 통해 외부 LDAP 서버와 통합된 클러스터에서 루트 권한이 없는 사용자를 전환할 때 사용자 SSH 키 생성을 수정합니다.

  • 설정 시 Slurm 절전 모드 비활성화를 수정했습니다ScaledownIdletime = -1.

  • Slurm 회계용 update_slurm_database_password.sh 스크립트에서 하드 코딩된 경로를 Slurm 설치 다이어로 수정했습니다.

2023년 12월 19일

AWS ParallelCluster 버전 3.7.2 릴리스

AWS ParallelCluster 버전 3.7.2 릴리스.

변경 사항:

  • Slurm을 23.02.6로 업그레이드합니다.

2023년 10월 25일

AWS ParallelCluster 버전 3.7.1 릴리스

AWS ParallelCluster 버전 3.7.1 릴리스.

변경 사항:

  • Slurm을 23.02.5(23.02.4부터)로 업그레이드합니다.

    • Pmix를 4.2.6으로 업그레이드합니다(3.2.3에서).

    • libjwt를 1.15.3으로 업그레이드합니다(1.12.0에서).

  • EFA 설치 관리자를 1.26.1로 업그레이드하여 P5에서 RDMA writedata 문제를 해결합니다.

    • Efa-driver: efa-2.5.0-1.

    • Efa-config: efa-config-1.15-1.

    • Efa-profile: efa-profile-1.5-1.

    • Libfabric-aws: libfabric-aws-1.18.2-1.

    • ERdma-core: rdma-core-46.0-1.

    • Open MPI: openmpi40-aws-4.1.5-4.

2023년 9월 22일

AWS ParallelCluster 버전 3.7.0 릴리스

AWS ParallelCluster 버전 3.7.0 릴리스.

개선 사항:

  • 구성 YAML 파일을 사용하여 컴퓨팅 리소스의 정적 및 동적 노드 우선 순위 AWS ParallelCluster 구성을 지원합니다.

  • Ubuntu 22에 대한 지원 추가 RSA 키는 기본적으로 지원되지 않습니다.

  • 대기열 구성 설정 JobExclusiveAllocation을 추가하여 언제든지 파티션의 노드를 단일 작업에만 독점적으로 할당할 수 있습니다.

  • 클러스터 생성 및 클러스터 업데이트 시 aws-parallelcluster-node 패키지 재정의를 허용합니다. 헤드 노드의 경우 클러스터 업데이트에도 적용됩니다. 개발 목적으로만 유용합니다.

  • 컴퓨팅 노드에서 NFS 서버를 시작하지 마세요.

  • 로그인 노드에 대한 지원을 추가합니다.

  • Slurm 컴퓨팅 리소스에 여러 인스턴스 유형이 지정된 경우 메모리 기반 스케줄링을 허용합니다.

  • 기존 Amazon File Cache를 공유 스토리지로 탑재하기 위한 지원을 추가합니다.

변경 사항:

  • Slurm 동적 노드에 기본적으로 1000의 우선 순위(가중치)를 할당합니다. 이렇게 하면 Slurm이 유휴 동적 노드보다 유휴 정적 노드의 우선 순위를 지정할 수 있습니다.

  • aws-parallelcluster-node 데몬이 관리형 Slurm 파티션만 처리 AWS ParallelCluster 하도록 합니다.

  • EFS-utils 워치독 폴링 간격을 10초로 늘입니다. 이 변경 사항은 워치독이 실행되도록 하는 유일한 조건인 EncryptionInTransittrue로 설정된 경우에 적용됩니다.

  • EFA 설치 프로그램을 1.25.1으로 업그레이드

    • Efa-driver: efa-2.1.1g에서 efa-2.5.0-1

    • Efa-config: efa-config-1.13-1에서 efa-config-1.15-1

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-aws-1.17.1-1에서 libfabric-aws-1.18.1-0

    • Rdma-core: rdma-core-43.0-1에서 rdma-core-46.0-1

    • Open MPI: openmpi40-aws-4.1.5-1에서 openmpi40-aws-4.1.5-4

  • Slurm을 버전 23.02.4로 업그레이드합니다.

  • Imds/ImdsSupport의 기본값을 v1.0에서 v2.0으로 변경

  • Ubuntu 18을 더 이상 사용하지 마세요.

  • Centos 7의 제한을 고려하여 기본 루트 볼륨 크기를 40GB로 업데이트

  • 루트 노드만 읽을 수 있도록 헤드 노드 내의 /tmp/wait_condition_handle.txt 파일에 대한 권한을 제한

  • 노드 패키지 대몬(daemon)이 PC에서 관리하는 Slurm 파티션과 노드 목록을 인식하는 데 사용할 Slurm partition-nodelist 매핑 JSON 파일 생성

  • NVIDIA 드라이버를 버전 535.54.03로 업그레이드

  • CUDA 라이브러리를 버전 12.2.0로 업그레이드

  • NVIDIA Fabric Manager를 nvidia-fabricmanager-535로 업그레이드합니다.

  • Ubuntu 22.04에서만 ARM PL을 버전 23.04.1로 업그레이드

  • NICE DCV를 버전 2023.0-15487으로 업그레이드하세요.

    • 서버: 2023.0.15487-1

    • xdcv: 2023.0.551-1

    • gl: 2023.0.1039-1

    • web_viewer: 2023.0.15487-1

버그 수정:

  • 값이 -1보다 작게 설정되지 않도록 ScaledownIdletime 값에 유효성 검사를 추가합니다.

  • DCV가 활성화된 GPU 인스턴스에서 Ubuntu 딥 러닝 AMI를 사용하여 클러스터 생성 실패를 수정했습니다.

  • CustomLambdarole을 사용하여 ParallelCluster CloudFormation 사용자 지정 리소스 공급자를 생성할 때 끊김 현상이 발생하는 IAM 정책이 생성되는 문제를 수정했습니다.

  • 여러 네트워크 인터페이스가 있는 인스턴스에서 SlurmSettings/Dns/UseEc2HostnamesTrue임을 사용할 때 컴퓨팅 노드 DNS 이름이 잘못 정렬되는 문제를 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2023년 8월 30일

설명서 전용 릴리스

AWS ParallelCluster 버전 3별 사용 설명서가 게시되었습니다.

설명서 전용 릴리스

  • AWS ParallelCluster 버전 3에는 별도의 사용 설명서가 있습니다.

2023년 7월 17일

AWS ParallelCluster 버전 3.6.1 릴리스

AWS ParallelCluster 버전 3.6.1 릴리스.

변경 사항:

  • 컴퓨팅 노드가 여러 Slurm 파티션에 추가되는 clustermgtd 경우에서 볼 수 있는 노드의 중복을 방지합니다.

버그 수정:

  • 루트 볼륨 디바이스 이름(/dev/sda1/dev/xvda)의 하드 코딩을 제거하고 중에 사용된 AMIs에서 검색합니다create-cluster.

  • CloudFormation 사용자 지정 리소스를 True로 설정된 ElasticIp과 사용할 때 클러스터 생성 실패 수정

  • 대용량 구성 파일과 함께 AWS CloudFormation 사용자 지정 리소스를 사용할 때 클러스터 생성 및 업데이트 실패를 수정합니다.

  • Ubuntu에서 ptrace 보호 기능이 비활성화되지 않고 libfabric에서 크로스 메모리 연결(CMA)이 허용되지 않는 문제를 수정했습니다.

  • 여러 인스턴스 유형을 사용하고 인스턴스가 반환되지 않는 경우 용량이 빠르게 부족한 장애 조치 로직을 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2023년 7월 5일

AWS ParallelCluster 버전 3.6.0 릴리스

AWS ParallelCluster 버전 3.6.0 릴리스.

설명서:

개선 사항:

  • RHEL8 지원 추가

  • AWS CloudFormation을 사용하여 클러스터를 생성하고 관리하기 위한 CloudFormation 사용자 지정 리소스를 추가합니다. CloudFormation

  • 구성 YAML 파일에서 클러스터 Slurm 구성을 사용자 지정하기 위한 지원을 추가합니다. AWS ParallelCluster

  • LUA를 지원하여 Slurm을 빌드합니다.

  • 클러스터당 대기열의 최대 개수를 10개에서 50개로 늘입니다. 각 대기열에는 최대 50개의 컴퓨팅 리소스가 포함될 수 있습니다. 각 클러스터에는 최대 50개의 컴퓨팅 리소스가 포함될 수 있습니다.

  • OnNodeStart, OnNodeConfigured, 및 OnNodeUpdated 파라미터로 구성된 이벤트에 대해 여러 사용자 지정 작업 스크립트의 시퀀스를 지정하는 지원 추가

  • 작업을 실행하기 전에 컴퓨팅 노드에 GPU 상태 점검을 적용하기 위한 새 구성 섹션 HealthChecks/Gpu 추가

  • SlurmQueuesSlurmQueues/ComputeResources 구성에 대한 Tags 지원을 추가합니다.

  • Monitoring 구성에 DetailedMonitoring에 대한 지원을 추가합니다.

  • AWS ParallelCluster CloudWatch 대시보드에서 헤드 노드 메모리 및 루트 볼륨 디스크 사용률 추적에 대한 mem_used_percentdisk_used_percent 지표를 추가하고 이러한 지표를 모니터링하기 위한 경보를 설정합니다.

  • AWS ParallelCluster 관리형 로그에 대한 로그 순환 지원을 추가합니다.

  • CloudWatch 대시보드에서 일반적인 컴퓨팅 노드 오류와 동적 노드 최장 유휴 시간을 추적할 수 있습니다.

  • SSL 소켓을 생성할 때 DCV 인증 서버가 최소한 TLS-1.2 프로토콜을 사용하도록 강제

  • aarch64, centos7alinux2를 제외한 지원되는 모든 운영 체제에 NVIDIA 데이터 센터 GPU 관리자(DCGM) 패키지를 설치

  • 기본적으로 커널 모듈 nvidia-uvm을 로드하여 통합 가상 메모리(UVM) 기능을 CUDA 드라이버에 제공

  • NVIDIA 퍼시스턴스 대몬(daemon)을 시스템 서비스로 설치

변경 사항:

  • Slurm을 버전23.02.2( 버전 )으로 업그레이드합니다22.05.8.

  • munge를 버전 0.5.15에서 버전 0.5.14으로 업그레이드

  • Slurm을 30TreeWidth으로 설정합니다.

  • Slurm prologepilog 구성을 /opt/slurm/etc/scripts/epilog.d/ 각각 대상 디렉터리 /opt/slurm/etc/scripts/prolog.d/ 및 로 설정합니다.

  • 컴퓨팅 노드 등록 중에 스크립트를 실행BatchStartTimeout하려면 Slurm을 최대 Prolog 3분으로 설정합니다.

  • CloudWatch Logs의 기본 RetentionInDays을 14일에서 180일로 증가

  • EFA 설치 프로그램을 1.22.1으로 업그레이드

    • Dkms: 2.8.3-2

    • Efa-driver: efa-2.1.1g(변경 없음)

    • Efa-config: efa-config-1.13-1(변경 없음)

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-aws-1.17.0-1에서 libfabric-aws-1.17.1-1

    • Rdma-core: rdma-core-43.0-1(변경 없음)

    • Open MPI: openmpi40-aws-4.1.5-1(변경 없음)

  • Amazon Linux 2에서 Lustre 클라이언트 버전을 2.12로 업그레이드 Ubuntu 20.04, 18.04, CentOS >= 7.7에 Lustre 클라이언트 2.12가 설치되었습니다.

  • CentOS 7.6에서 Lustre 클라이언트 버전을 2.10.8로 업그레이드

  • NVIDIA 드라이버를 버전 470.141.03에서 버전 470.182.03으로 업그레이드

  • NVIDIA Fabric Manager를 버전 470.141.03에서 버전 470.182.03으로 업그레이드

  • NVIDIA CUDA Toolkit을 버전 11.7.1에서 버전 11.8.0으로 업그레이드

  • NVIDIA CUDA 샘플을 버전 11.8.0으로 업그레이드

  • Intel MPI Library를 버전 2021 업데이트 6에서 버전 2021 업데이트 9로 업그레이드 자세한 내용은 Intel® MPI Library 2021 Update 9를 참조하세요.

  • NICE DCV를 버전 2022.2-14521에서 버전 2023.0-15022로 업그레이드

    • server: 버전 2022.2-14521-1에서 2023.0.15022-1

    • xdcv: 버전 2022.2.519-1에서 2023.0.547-1

    • gl: 버전 2022.2.1012-1에서 2023.0.1027-1

    • web_viewer: 버전 2022.2.14521-1에서 2023.0.15022-1

  • aws-cfn-bootstrap을 버전 2.0-24로 업그레이드

  • AWS 배치 클러스터용 컨테이너 이미지를 빌드할 때 CodeBuild 환경에서 사용하는 이미지 업그레이드:

    • aws/codebuild/amazonlinux2-x86_64-standard:3.0에서 aws/codebuild/amazonlinux2-x86_64-standard:4.0

    • aws/codebuild/amazonlinux2-aarch64-standard:1.0에서 aws/codebuild/amazonlinux2-aarch64-standard:2.0

버그 수정:

  • 잘못된 오류가 보고되지 않도록 Amazon EFS 및 Amazon FSx 네트워크 보안 그룹 검증기를 수정

  • build-image 작업 중에 Image Builder에서 생성한 리소스의 태깅이 누락되는 문제를 수정합니다.

  • MaxCount 속성에 대해 수치 비교를 항상 수행하도록 MaxCount 에 대한 업데이트 정책 수정

  • 여러 네트워크 카드가 있는 컴퓨팅 노드 인스턴스의 IP 정렬을 수정했습니다.

  • 대기열 파라미터 업데이트가 수행되고 Slurm 회계 구성이 업데이트되지 않은 slurm_parallelcluster_slurmdbd.conf 경우 StoragePass에서의 교체를 수정했습니다.

  • 기존 EFS 파일 시스템으로 클러스터를 생성할 때 누락된 보안 그룹이 생성되는 문제를 수정했습니다.

  • cfn-hup 대몬(daemon)을 다시 시작할 때 실패하는 문제를 수정했습니다.

  • INVALID_REG 플래그가 있는 동적 노드를 Slurm 보호 모드의 부트스트랩 실패로 간주합니다. Slurm 등록에 실패한 정적 노드는 이미 이후에 부트스트랩 실패로 처리됩니다node_replacement_timeout.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2023년 5월 22일

AWS ParallelCluster 버전 3.5.1 릴리스

AWS ParallelCluster 버전 3.5.1 릴리스.

개선 사항:

변경 사항:

  • EFA 설치 프로그램을 1.22.0으로 업그레이드

    • Efa-driver: efa-2.1.1-1에서 efa-2.1.1g

    • Efa-config: efa-config-1.12-1에서 efa-config-1.13-1

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-aws-1.16.1amzn3.0-1에서 libfabric-aws-1.17.0-1

    • Rdma-core: rdma-core-43.0-1(변경 없음)

    • Open MPI: openmpi40-aws-4.1.4-3에서 openmpi40-aws-4.1.5-1

    NICE DCV를 버전 2022.2-14521으로 업그레이드하세요.

    • server: 2022.2.14521-1

    • xdcv: 2022.2.519-1

    • gl: 2022.2.1012-1

    • web_viewer: 2022.2.14521-1

버그 수정:

  • 클러스터 업데이트의 공유 Amazon EBS 볼륨을 제거할 때 일부로 MountDir/etc/exports 사이의 패턴이 일치하여 노드 시작이 실패할 수 있는 문제를 수정

  • clustermgtd 반복마다 compute_console_output 로그 파일이 잘리지 않도록 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2023년 3월 29일

AWS ParallelCluster 버전 3.5.0 릴리스

AWS ParallelCluster 버전 3.5.0 릴리스.

개선 사항:

  • AWS ParallelCluster UI를 사용하여 클러스터에 액세스하고 관리할 수 있습니다.

  • 워크로드에서 참조할 수 있는 버전이 지정된 AWS ParallelCluster 정책을 CloudFormation 템플릿에 추가합니다.

  • 자체 코드와 함께 사용할 수 있는 AWS ParallelCluster Python 라이브러리를 추가합니다.

  • 컴퓨팅 노드 부트스트랩 장애 시 Amazon CloudWatch에 컴퓨팅 노드 콘솔 출력 로깅 추가

  • 클러스터 생성 실패 시 describe-cluster 출력에 실패 코드 및 이유가 포함된 실패 필드 추가

  • 하위 프로세스 모듈을 호출하는 동안 악의적인 문자열 삽입을 방지하기 위해 유효성 검사기 추가

  • 정적 노드를 프로비저닝하는 동안 클러스터 상태가 PROTECTED로 변경되면 클러스터 생성이 실패합니다.

변경 사항:

  • Slurm 버전으로 업그레이드22.05.8( 버전에서22.05.7)

  • EFA 설치 프로그램을 1.21.0으로 업그레이드

    • Efa-driver: efa-2.1에서 efa-2.1.1-1

    • Efa-config: efa-config-1.11-1에서 efa-config-1.12-1

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-aws-1.16.1에서 libfabric-aws-1.16.1amzn3.0-1

    • Rdma-core: rdma-core-43.0-2에서 rdma-core-43.0-1

    • Open MPI: openmpi40-aws-4.1.4-3(변경 없음)

  • Slurm 컨트롤러 로그를 보다 상세하게 만들고 Slurm 절전 플러그인에 대한 추가 로깅을 활성화합니다.

버그 수정:

  • Slurm 회계가 활성화된 경우 클러스터 이름이 40자를 초과하지 않는지 확인하여 클러스터 데이터베이스 생성을 수정합니다.

  • Amazon EC2 인스턴스 상태 확인이 실패할 경우 Slurm을 통해 재부팅된 컴퓨팅 노드가 교체clustermgtd되는의 문제를 수정했습니다.

  • 헤드 노드의 잘못된 IAM 정책으로 인해 다른 계정과 용량 예약을 공유하는 컴퓨팅 노드가 시작되지 않았던 문제를 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook, aws-parallelcluster-node, aws-parallelcluster-ui 패키지의 CHANGELOG 파일을 참조하세요.

2023년 2월 20일

AWS ParallelCluster 버전 3.4.1 릴리스

AWS ParallelCluster 버전 3.4.1 릴리스.

버그 수정:

  • 컴퓨팅 노드의 내부 레지스트리에 업데이트가 잘못 적용될 수 있는 Slurm 스케줄러 문제를 수정했습니다. 결과적으로 이 문제가 발생하면 EC2 인스턴스를 사용할 수 없게 되거나 잘못된 인스턴스 유형으로 뒷받침될 수 있습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2023년 1월 13일

AWS ParallelCluster 버전 3.4.0 릴리스

AWS ParallelCluster 버전 3.4.0 릴리스.

개선 사항:

  • 용량 가용성을 올리기 위해 여러 가용 영역에서 노드를 시작하는 기능 지원

  • 용량 가용성을 올리기 위해 각 대기열에 여러 서브넷을 지정하는 기능 지원

  • Iam / ResourcePrefix에 새 구성 파라미터를 추가하여에서 생성한 IAM 리소스의 경로 및 이름에 대한 접두사를 지정합니다 AWS ParallelCluster.

  • Lambda 함수에서 사용하는 Vpc 구성을 지정하기 위한 새 구성 섹션 DeploymentSettings/ AWS ParallelCluster LambdaFunctionsVpcConfig를 추가합니다. LambdaFunctionsVpcConfig

  • 클러스터 업데이트 중에 헤드 노드에서 실행할 사용자 지정 스크립트를 지정하는 기능 추가 Slurm을 스케줄러로 사용할 때 HeadNode / CustomActions / OnNodeUpdated를 사용하여 스크립트를 지정할 수 있습니다.

변경 사항:

  • 기존 파일 시스템에 대한 Amazon EFS 탑재 대상 생성 제거

  • amazon-efs-utils를 사용하여 EFS 파일 시스템 탑재 전송 중 암호화 및 IAM 인증 사용자를 사용하여 EFS 파일 시스템을 탑재할 수 있습니다.

  • CentOS7 및 Ubuntu에 stunnel 5.67를 설치하여 EFS 전송 중 암호화 지원

  • EFA 설치 프로그램을 1.18.0에서 1.20.0로 업그레이드

    • Efa-driver: efa-1.16.0-1에서 efa-2.1

    • Efa-config: efa-config-1.11-1(변경 없음)

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1에서 libfabric-aws-1.16.1

    • Rdma-core: rdma-core-41.0-2에서 rdma-core-43.0-2

    • Open MPI: openmpi40-aws-4.1.4-2에서 openmpi40-aws-4.1.4-3

  • Slurm을 22.05.5에서 버전 22.05.7로 업그레이드

  • Python을 3.9.153.7.13에서 3.9.163.7.16로 업그레이드

  • Slurm를 사용하면 IDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING 상태의 22.05.7동적 노드가 비정상으로 간주되지 않습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 12월 22일

AWS ParallelCluster 버전 3.3.1 릴리스

AWS ParallelCluster 버전 3.3.1 릴리스.

변경 사항:

  • 공식 AWS ParallelCluster 제품 AMIs 이제 Amazon EC2 사용 중단 후 2년 후에 사용할 수 있습니다.

  • 콜드 스타트 페널티를 줄이고 제한 시간을 방지하려면 AWS ParallelCluster API Lambda의 메모리 크기를 2048로 늘립니다.

버그 수정:

  • 관리형 FSx for Lustre 파일 시스템의 교체 및 컴퓨팅 플릿 서브넷 ID 변경을 포함하는 클러스터 업데이트 시 데이터 손실을 방지합니다.

  • SharedStorage는 클러스터 업데이트 작업에 DeletionPolicy 적용됩니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster 패키지 CHANGELOG 파일을 참조하세요.

2022년 12월 2일

AWS ParallelCluster 설명서 전용 hpc6id 참고 사항

AWS ParallelCluster 설명서 전용 업데이트

  • AWS ParallelCluster 는 HeadNode/InstanceType 설정에 대한 hpc6id 인스턴스 유형을 지원하지 않습니다.

2022년 12월 2일

AWS ParallelCluster 버전 3.1.5 릴리스

AWS ParallelCluster 버전 3.1.5 릴리스.

개선 사항:

  • 유휴 노드 종료를 방해하는 Slurm 문제 수정

  • EFA 설치 프로그램을 1.18.0으로 업그레이드

    • Efa-driver: efa-1.16.0-1

    • Efa-config: efa-config-1.9-1에서 efa-config-1.11-1

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-1.13.2에서 libfabric-aws-1.16.0~amzn4.0-1

    • Rdma-core: rdma-core-37.0에서 rdma-core-41.0-2

    • Open MPI: openmpi40-aws-4.1.1-2에서 openmpi40-aws-4.1.4-2

변경 사항:

  • 클러스터 업데이트를 위해 AWS ParallelCluster API 스택에서 ParallelClusterUserRole 사용하는 lambda:UntagResourcelambda:ListTags 및를 추가합니다.

  • Intel MPI Library를 버전 2021 Update 4에서 버전 2021 Update 6으로 업그레이드했습니다. 자세한 내용은 Intel® MPI Library 2021 Update 6을 참조하세요.

  • NVIDIA 드라이버를 버전 470.103.01에서 버전 470.141.03으로 업그레이드

  • NVIDIA Fabric Manager를 470.103.01에서 버전 470.141.03으로 업그레이드

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 11월 16일

AWS ParallelCluster 버전 3.3.0 릴리스

AWS ParallelCluster 버전 3.3.0 릴리스.

개선 사항:

  • Slurm을 스케줄러로 사용할 때 컴퓨팅 리소스에 대한 여러 인스턴스 할당 구성에 대한 지원을 추가합니다. 자세한 내용은 Slurm을 사용한 다중 인스턴스 유형 할당을 참조하세요.

  • 업데이트된 구성을 사용하여 클러스터 업데이트로 SharedStorage 추가 및 제거에 대한 지원을 추가합니다. 자세한 내용은 공유 스토리지를 참조하세요.

  • 스토리지 보존을 지원하기 DeletionPolicy 위해 EfsFsxLustre 공유 스토리지 설정에 대한 새 구성 파라미터를 추가합니다.

  • 새 구성 파라미터 Scheduling / SlurmSettings / Database를 사용하여 Slurm 회계에 대한 지원을 추가합니다. ./Scheduling-v3.html#Scheduling-v3-SlurmSettings-Database 자세한 내용은 Slurm accounting with AWS ParallelCluster를 참조하세요.

  • 온디맨드 용량 예약(ODCR) 및 용량 예약 리소스 그룹에 대한 지원을 추가합니다. 자세한 내용은 온디맨드 용량 예약(ODCR)을 사용하여 인스턴스 시작을 참조하세요.

  • 새 구성 파라미터를 추가하여 클러스터에서 지원할 IMDS 버전 또는 클러스터의 빌드 이미지 인프라, Imds / ImdsSupport 및 빌드, Imds / ImdsSupport, 구성을 지정합니다.

  • SlurmQueues/ComputeResources 섹션에 네트워킹/PlacementGroup 대한 지원을 추가합니다.

  • 기기당 하나의 ENI로 제한되는 여러 네트워크 인터페이스가 있는 인스턴스에 대한 지원 추가

  • 연결된 보안 그룹에서 CIDR 블록을 확인하여 외부 Amazon EFS 파일 시스템의 네트워킹 검증 개선

  • 구성된 인스턴스 유형이 배치 그룹을 지원하는지 확인하는 검사기 추가

  • 안정성과 성능을 높이기 위해 NFS 스레드를 최소[256, 최대(8, num_cores * 4)]로 구성

  • 구성 시간을 줄이기 위해 빌드 시 NFS 설치를 이동

  • AWS ParallelCluster API를 배포할 때 생성되고 Docker 이미지 빌드 이벤트에 대한 알림에 사용되는 EcrImageBuilder SNS 주제에 대해 서버 측 암호화를 활성화합니다.

변경 사항:

  • SlurmQueues / 네트워킹 / PlacementGroup /의 동작을 변경합니다Enabled. 이제 모든 컴퓨팅 리소스에 대한 단일 관리형 배치 그룹 대신 각 컴퓨팅 리소스에 대해 고유한 관리형 배치 그룹을 생성합니다.

  • SlurmQueues / Networking / PlacementGroup / Name에 대한 지원을 선호하는 이름 지정 방법으로 추가합니다.

  • 태그 업데이트 시 헤드 노드 교체를 방지하기 위해 시작 템플릿에서 인스턴스 정의로 헤드 노드 태그로 이동

  • 시작 템플릿에서 설정된 CpuOptions를 통하지 않고 cloud-init를 통해 실행되는 멀티스레딩 비활성화

  • API 인프라, API Docker 컨테이너 및 클러스터 Lambda 리소스에서 Python을 버전 3.9로, NodeJS를 버전 16으로 업그레이드

  • aws-parallelcluster-batch-cli에서 Python 3.6에 대한 지원 제거

  • Slurm을 21.08.8-2에서 버전 22.05.5로 업그레이드

  • NVIDIA 드라이버를 버전 470.129.06에서 470.141.03로 업그레이드

  • NVIDIA Fabric Manager를 470.129.06에서 버전 470.141.03로 업그레이드

  • 엔비디아 CUDA Toolkit을 버전 11.7.1(from 11.4.4)로 업그레이드

  • AWS ParallelCluster virtualenvs에 사용되는 Python을에서 3.7.13로 업그레이드합니다3.9.15.

  • EFA 설치 프로그램을 버전 1.18.0으로 업그레이드

    • Efa-driver: efa-1.16.0-1(변경 없음)

    • Efa-config: from efa-config-1.10-1에서 efa-config-1.11-1

    • Efa-profile: efa-profile-1.5-1(변경 없음)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn2.0-1에서 libfabric-aws-1.16.0~amzn4.0-1

    • Rdma-core: rdma-core-37.0에서 rdma-core-41.0-2

    • Open MPI: openmpi40-aws-4.1.1-2에서 openmpi40-aws-4.1.4-2

  • NICE DCV를 2022.0-12760에서 버전 2022.1-13300로 업그레이드

  • Queues을 위해 SingleSubnetValidator 금지 활성화

  • 에필로그가 아직 실행 중일 수 있으므로 노드가 COMPLETING 상태일 때는 DRAIN 노드 교체 금지

버그 수정:

  • 잘못된 필터가 AWS ParallelCluster 전달될 때 ListClusterLogStreams 명령의 필터 파라미터 검증이 실패하도록 수정했습니다.

  • FileSystemId가 다른 SharedStorage/EfsSettings 파라미터와 함께 지정된 경우 파라미터 SharedStorage/EfsSettings. 이전에는 FileSystemId이 포함되지 않았습니다.

  • 구성의 다른 변경 사항과 함께 SharedStorage의 순서를 변경할 때 클러스터 업데이트를 수정합니다.

  • APIUpdateParallelClusterLambdaRole에서 CloudWatch에 로그를 업로드 AWS ParallelCluster 하도록 수정했습니다.

  • 쿡북을 실행하기 전에 패키지를 설치할 때 Cinc가 로컬 CA 인증서 번들을 사용하지 않는 문제를 수정했습니다.

  • Build:UpdateOsPackages:Enabled:true가 설정되었을 때 pcluster build-image로 ubuntu를 업그레이드할 때 멈추는 문제를 수정했습니다.

  • 중복 키에 실패를 일으켜 YAML 클러스터 구성의 파싱 수정

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 11월 2일

AWS ParallelCluster 설명서 전용 API 참조가 추가되었습니다.

AWS ParallelCluster 설명서 전용 업데이트

2022년 10월 27일

AWS ParallelCluster 버전 3.2.1 릴리스

AWS ParallelCluster 버전 3.2.1 릴리스.

개선 사항:

  • 여러 NIC가 있는 Amazon EC2 인스턴스를 더 잘 지원하도록 호스트 라우팅 테이블을 다른 네트워크 카드에 연결하는 로직을 개선하세요.

변경 사항:

  • NVIDIA 드라이버를 버전 470.141.03로 업그레이드

  • NVIDIA Fabric Manager를 버전 470.141.03로 업그레이드

  • 노드 성능에 부정적인 영향을 줄 수 있는 cron 작업 태스크 man-dbmlocate를 비활성화

  • Intel MPI Library를 2021.6.0.602로 업그레이드

  • 이러한 보안 위험에 대응하여 Python을 3.7.10에서 3.7.13으로 업그레이드하세요.

버그 수정:

  • 클러스터 구성을 사용할 수 없을 때 DescribeCluster에 오류가 발생하는 것을 방지

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 10월 3일

AWS ParallelCluster 버전 3.2.0 릴리스

AWS ParallelCluster 버전 3.2.0 릴리스.

개선 사항:

변경 사항:

  • EFA 설치 프로그램을 버전 1.17.2로 업그레이드

    • Efa-driver: efa-1.16.0-1

    • EFA 구성: efa-config-1.10-1

    • EFA 프로필: efa-profile-1.5-1

    • Libfabric: libfabric-aws-1.16.0~amzn2.0-1

    • RDMA 코어: rdma-core-41.0-2

    • Open MPI: openmpi40-aws-4.1.4-2

  • NICE DCV를 버전 2022.0-12760으로 업그레이드

  • NVIDIA 드라이버를 버전 470.129.06로 업그레이드

  • NVIDIA Fabric Manager를 버전 470.129.06으로 업그레이드

  • 루트 볼륨과 추가 볼륨 모두에서 기본 EBS 볼륨 유형을 gp2에서 gp3으로 변경

  • 다음에 의해 생성된 FSx for Lustre 파일 시스템에 대한 변경 사항 AWS ParallelCluster:

    • 기본 배포 유형을 Scratch_2로 변경

    • Lustre 서버 버전을 2.12로 변경

  • 기존 /를 전달할 truePlacementGroup PlacementGroup / Enabled를 로 설정할 필요가 없습니다Id.

  • PlacementGroup/Enabled가 명시적으로 false로 설정된 경우 PlacementGroup/Id 설정을 허용하지 않습니다.

  • AWS ParallelCluster에서 만든 모든 리소스에 parallelcluster:cluster-name 태그 추가

  • 클러스터 업데이트를 lambda:UntagResource 위해 AWS ParallelCluster API 스택에서 ParallelClusterUserRole 사용하는 lambda:ListTags 및를 추가합니다.

  • 구성 파라미터 HeadNode/Imds/Secured가 활성화된 경우 IPv6 액세스를 IMDS에서 루트 및 클러스터 관리자로만 제한합니다.

  • 사용자 지정 AMI에서는 ParallelCluster 기본값인 35GiB 대신 AMI 루트 볼륨 크기를 사용합니다. 클러스터 구성 파일에서 값을 변경할 수 있습니다.

  • 구성 파라미터 Scheduling/SlurmQueues/ComputeResources/SpotPrice가 필요한 최소 스팟 요청 이행 가격보다 낮으면 컴퓨팅 플릿이 자동으로 비활성화됩니다.

  • 업데이트 중에 섹션을 추가하거나 제거할 때 변경 세트의 requested_value 값과 current_value 값을 표시합니다.

  • 여러 네트워크 카드로 인스턴스를 구성할 때 configure_nw_interface.sh와 충돌을 방지하기 위해 딥 러닝 AMI에서 사용할 수 있는 aws-ubuntu-eni-helper 서비스를 비활성화

  • Python 3.6에 대한 지원 제거

  • 여러 네트워크 카드로 인스턴스를 구성할 때 모든 네트워크 인터페이스의 MTU를 9001로 설정

  • 컴퓨팅 노드 FQDN을 구성할 때 후행 점을 제거

  • POWERING_DOWN에서 정적 노드를 관리

  • 작업이 아직 실행 중일 수 있으므로 POWER_DOWN의 동적 노드를 교체하지 않습니다.

  • 클러스터 구성에서 Scheduling 파라미터가 업데이트된 경우에만 클러스터 업데이트 시간에 clustermgtdslurmctld 대몬(daemon)을 재시작

  • slurmctldslurmd systemd 서비스 파일 업데이트

  • 구성 파라미터 HeadNode/Imds/Secured가 활성화된 경우 IPv6 액세스를 루트 및 클러스터 관리자로만 제한합니다.

  • 노드를 사용할 수 없을 때 작업을 다시 시작하기 전에 대기 중인 작업을 기다려야 하는 시간을 줄이기 위해 Slurm 구성을 AuthInfo=cred_expire=70로 설정

  • 서드 파티 쿡북 종속성 업그레이드:

    • apt-7.4.0에서 apt-7.4.2로

    • 라인-4.0.1번에서 라인-4.5.2번으로

    • openssh-2.9.1에서 opensh-2.10.3으로

    • pyenv-3.4.2에서 pyenv-3.5.1로

    • selinux-3.1.1에서 selinux-6.0.4로

    • yum-6.1.1에서 yum-7.4.0으로

    • yum-epel-4.1.2에서 yum-epel-4.5.0으로

버그 수정:

  • 사용자 지정 AMI를 빌드할 때 AWS ParallelCluster 검증 및 테스트 단계를 건너뛰도록 기본 동작을 수정합니다.

  • computemgtd의 파일 핸들 누수 문제를 수정했습니다.

  • 시작된 인스턴스를 EC2 DescribeInstances 응답에서 아직 사용할 수 없었기 때문에 간헐적으로 시작된 인스턴스가 즉시 종료되는 경합 상태를 수정했습니다.

  • Arm 프로세서의 인스턴스 유형에서 DisableSimultaneousMultithreading 파라미터에 대한 지원을 수정했습니다.

  • 이전 버전에서 업그레이드할 때 AWS ParallelCluster API 스택 업데이트 실패를 수정합니다. EcrImageDeletionLambdaRoleListImagePipelineImages 작업에 사용되는 리소스 패턴 추가

  • FSx for Lustre 파일 시스템을 생성할 때 Amazon S3에서 가져오거나 내보내는 데 필요한 누락된 권한을 추가하는 AWS ParallelCluster API를 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 7월 27일

AWS ParallelCluster 올해 현재까지 설명서 전용 업데이트

AWS ParallelCluster 설명서 전용 업데이트.

새로운 섹션:

섹션 업데이트:

2022년 7월 6일

AWS ParallelCluster 버전 3.1.4 릴리스

AWS ParallelCluster 버전 3.1.4 릴리스.

개선 사항:

변경 사항:

  • Slurm을 버전 21.08.8-2로 업그레이드

  • JWT를 사용하는 빌드 Slurm 지원

  • 기존 /를 전달할 truePlacementGroup PlacementGroup / Enabled를 로 설정할 필요가 없습니다Id.

  • 클러스터 생성 및 이미지 생성을 위해 ParallelCluster API 스택이 사용하는 ParallelClusterUserRolelambda:TagResource 추가

버그 수정:

  • --filters 옵션과 함께 export-cluster-logs 명령을 사용할 때 클러스터의 로그를 내보내는 기능을 수정했습니다.

  • /home 공유 디렉터리를 사용하여 Multi-node-Parallel 작업 실행을 조정하도록 AWS 배치 도커 진입점을 수정했습니다.

  • 용량 부족으로 실패한 정적 노드를 부트스트랩 실패 노드로 처리하지 않도록 Slurm 비정상 정적 노드를 다운으로 설정할 때 노드 주소를 재설정합니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 5월 16일

AWS ParallelCluster 버전 3.1.3 릴리스

AWS ParallelCluster 버전 3.1.3 릴리스.

개선 사항:

  • 예를 들어 SSH 로그인 중, 다른 사용자로 전환할 때, 다른 사용자로 명령을 실행할 때 홈 디렉터리 생성과 함께 SSH 키 생성을 실행합니다.

  • 구성 파라미터 DirectoryService/DomainName에 FQDN 및 LDAP 고유 이름 모두에 대한 지원을 추가합니다. 이제 새 유효성 검사기가 두 구문을 모두 검사합니다.

  • 헤드 노드에 배포된 새 update_directory_service_password.sh 스크립트는 SSSD 구성에서 Active Directory 암호의 수동 업데이트를 지원합니다. 암호는 클러스터 구성에서 AWS Secrets Manager에 의해 검색됩니다.

  • 기본 VPC가 없는 환경에서 API 인프라를 배포하기 위한 지원 추가

변경 사항:

  • build-image 명령을 통해 생성된 x86_64 공식 AMI 및 AMI에서 더 심층적인 C-State를 비활성화하여 높은 성능과 짧은 지연 시간을 보장합니다.

  • OS 패키지 업데이트 및 보안 수정

  • Amazon Linux 2 기본 이미지를 커널 5.10과 함께 AMI를 사용하도록 변경

버그 수정:

  • 새로운 EC2 Image Builder 정책으로 인해 이미지 빌드가 성공한 후 DELETE_FAILED의 빌드 이미지 스택이 수정되었습니다.

  • 구성 파라미터 DirectoryService/DomainAddr에 여러 도메인 주소가 포함된 경우 ldap_uri SSSD 속성으로의 변환을 수정합니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelclusterCHANGELOG 파일 및 aws-parallelcluster-cookbook 패키지를 참조하세요.

2022년 4월 20일

AWS ParallelCluster 버전 3.1.2 릴리스

AWS ParallelCluster 버전 3.1.2 릴리스.

변경 사항:

  • Slurm을 21.08.5에서 버전 21.08.6로 업그레이드

버그 수정:

  • 인터넷 액세스 없이 서브넷에 클러스터를 배포할 때 컴퓨팅 노드의 /etc/hosts 파일 업데이트를 수정

  • 컴퓨팅 노드 부트스트랩이 클러스터에 가입하기 전에 임시 드라이브가 초기화될 때까지 대기하도록 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster 패키지 CHANGELOG 파일을 참조하세요.

2022년 3월 2일

AWS ParallelCluster 버전 3.1.1 릴리스

AWS ParallelCluster 버전 3.1.1 릴리스.

  • AWS Directory Service를 통해 관리되는 Active Directory(AD) 도메인과 통합하여 여러 사용자 클러스터 환경에 대한 지원을 추가합니다.

  • 클러스터 구성 파일에 UseEc2Hostnames에 대한 지원을 추가합니다. true로 설정하면 컴퓨팅 노드에 Amazon EC2 기본 호스트 이름(예: ip-1-2-3-4)을 사용합니다.

  • 인터넷에 접속할 수 없는 서브넷에서의 클러스터 생성 지원

  • 대기열당 여러 컴퓨팅 인스턴스 유형에 대한 지원 추가

  • NVIDIA 카드가 있는 Slurmon ARM 인스턴스에서 GPU 스케줄링 지원 추가

  • AWS ParallelCluster CLI에 cluster-name (-n), (-r), region (image-id-i) 및 cluster-configuration / image-configuration (-c)에 대한 약어 플래그를 추가합니다.

  • FSx for Lustre AutoImportPolicy 파라미터 NEW_CHANGED_DELETED 옵션에 대한 지원을 추가합니다.

  • 컴퓨팅 노드에서 사용하는 EC2 LaunchTemplates 리소스에 parallelcluster:compute-resource-name 태그 추가

  • 일부 헤드 노드 및/또는 대기열에 SecurityGroups 파라미터가 지정된 경우 사용자 지정 보안 그룹으로부터의 인바운드 연결을 허용하도록 클러스터 내에 생성된 보안 그룹을 개선

  • ARM용 NVIDIA 드라이버 및 CUDA 라이브러리 설치

변경 사항:

  • Slurm을 20.11.8에서 버전 21.08.5로 업그레이드

  • Slurm 플러그인을 21.08에서 버전 20.11로 업그레이드

  • NICE DCV를 2021.1-10851에서 버전 2021.3-11591로 업그레이드

  • NVIDIA 드라이버를 버전 470.57.02에서 470.103.01로 업그레이드

  • NVIDIA 패브릭 매니저를 버전 470.57.02에서 470.103.01로 업그레이드

  • CUDA를 버전 11.4.0에서 11.4.4로 업그레이드

  • Intel MPI가 버전 2019 업데이트 8에서 버전 2021 Update 4 버전으로 업데이트되었습니다. 자세한 내용은 Intel® MPI Library 2021 Update 4를 참조하세요.

  • PMIx를 버전 3.1.5에서 3.2.3로 업그레이드

  • /home/logs/compute에 장애가 발생한 컴퓨팅 노드의 덤핑 제거 컴퓨팅 노드 로그 파일은 CloudWatch 및 Amazon EC2 콘솔 로그에서 사용할 수 있습니다.

  • SlurmQueuesComputeResources 길이 검사기를 차단할 수 있게 했습니다.

  • Amazon Linux 2에서 인스턴스 시작 시 패키지 업데이트 비활성화

  • AWS ParallelCluster 사용자 지정 이미지를 구축할 때 Amazon EC2 ImageBuilder의 향상된 이미지 메타데이터를 비활성화합니다.

  • cloud-init 데이터 소스를 EC2로 명시적으로 설정합니다. 이를 통해 Ubuntu 및 CentOS 플랫폼의 부팅 시간이 절약됩니다.

  • 컴퓨팅 플릿 시작 템플릿 이름에 인스턴스 유형 대신 컴퓨팅 리소스 이름 사용

  • 원하지 않는 텍스트가 발생하지 않도록 stderr 및 stdout을 CLI 로그 파일로 리디렉션

  • 구성/설치 레시피를 기본 쿡북과 호출되는 별도의 쿡북으로 이동 기존 진입점은 유지되며 이전 버전과 호환됩니다.

  • 클러스터 생성 중에 인터넷에 접속하지 않도록 AMI 빌드 중에 인텔 HPC 플랫폼의 종속성을 다운로드

  • Slurm 노드를 구성할 때 컴퓨팅 리소스 이름에서 - 제거 금지

  • NVIDIA 드라이버가 설치되지 않은 경우 Slurm에서 GPU 구성 금지

  • BatchUserRole에서 ecs:ListContainerInstances 권한 수정

  • 이전에 None 접두사로 내보낸 접두사가 지정되지 않은 경우 클러스터 로그 내보내기를 수정

  • 클러스터 업데이트 실패 시 롤백이 수행되지 않는 문제를 수정

  • BatchUserRole에서 ecs:ListContainerInstances 권한 수정

  • 지원되지 않는 KmsKeyId 항목이 지정된 경우 오류를 발생시켜 HeadNode에 대한 RootVolume 스키마를 수정

  • Amazon FSx 누락된 지표가 CloudWatch 대시보드에 표시되도록 수정

  • EfaSecurityGroupValidator 수정 이전에는 사용자 지정 보안 그룹이 제공되고 EFA가 활성화된 경우 잘못된 오류가 발생할 가능성이 있었습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2022년 2월 10일

AWS ParallelCluster 버전 3.0.3 릴리스

AWS ParallelCluster 버전 3.0.3 릴리스.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelclusterCHANGELOG 파일 및 aws-parallelcluster-cookbook 패키지를 참조하세요.

2022년 1월 17일

AWS ParallelCluster 버전 3.0.2 릴리스

AWS ParallelCluster 버전 3.0.2 릴리스.

Elastic Fabric Adapter 설치 프로그램을 1.14.1로 업그레이드

  • EFA 구성: efa-config-1.9에서 efa-config-1.9-1

  • EFA 프로필: efa-profile-1.5에서 efa-profile-1.5-1

  • EFA 커널 모듈: efa-1.13.0에서 efa-1.14.2

  • RDMA 코어: rdma-core-35에서 rdma-core-37.0

  • Libfabric: libfabric-1.13.0에서 libfabric-1.13.2

  • Open MPI: openmpi40-aws-4.1.1-2(변경 없음)

인스턴스 유형에서 지원하는 경우 GPUDirect RDMA는 항상 활성화됩니다. GdrSupport 구성 옵션은 효과가 없습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2021년 11월 5일

AWS ParallelCluster 버전 3.0.1 릴리스

AWS ParallelCluster 버전 3.0.1 릴리스.

클러스터 구성 마이그레이션 도구

  • 이제 고객은 클러스터 구성을 AWS ParallelCluster 버전 2 형식에서 YAML 기반 AWS ParallelCluster 버전 3 형식으로 마이그레이션할 수 있습니다. 자세한 내용은 pcluster3-config-converter를 참조하세요.

헤드 노드를 중지할 수 있습니다.

  • 컴퓨팅 플릿을 중지한 후 Amazon EC2 콘솔 또는 stop-instances AWS CLI 명령을 사용하여 헤드 노드를 중지했다가 나중에 다시 시작할 수 있습니다.

~/.aws/config 파일에서 읽은 기본 AWS 리전

  • pcluster 명령의 경우 구성 파일, 환경 또는 명령줄에 AWS 리전이 지정되지 않은 경우 ~/.aws/config 파일 [default] 섹션의 region 설정에 지정된 기본 AWS 리전이 사용됩니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2021년 10월 27일

AWS ParallelCluster 버전 3.0.0 릴리스

AWS ParallelCluster 버전 3.0.0 릴리스.

Amazon API Gateway를 통한 클러스터 관리 지원

  • 이제 고객은 Amazon API Gateway를 사용하여 HTTP 엔드포인트를 통해 클러스터를 관리하고 배포할 수 있습니다. 이를 통해 스크립트 기반 또는 이벤트 기반 워크플로의 새로운 가능성이 열립니다.

    AWS ParallelCluster 명령줄 인터페이스(CLI)도이 API와의 호환성을 위해 재설계되었으며 새 JSON 출력 옵션이 포함되어 있습니다. 이 새로운 기능을 통해 고객은 CLI를 사용하여 유사한 빌딩 블록 기능을 구현할 수도 있습니다.

사용자 지정 AMI 생성 개선

  • 이제 고객은 EC2 Image Builder를 사용하여 사용자 지정 AMI를 생성하고 관리하는 보다 강력한 프로세스에 액세스할 수 있습니다. 이제 사용자 지정 AMIs 별도의 AWS ParallelCluster 구성 파일을 통해 관리할 수 있으며 명령 AWS ParallelCluster 줄 인터페이스에서 pcluster build-image 명령을 사용하여 생성할 수 있습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbookaws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.

2021년 9월 10일

PCUI
변경 사항 설명 날짜

PCUI 버전 2025.04.0 릴리스

PCUI 버전 2025.04.0 릴리스

주요 변경 사항:

  • PC 버전의 기본값을 제거합니다. 이제 사용자는 사용할 PC 버전을 지정해야 합니다.

기능:

  • 새 스택 파라미터 'AdditionalPoliciesPCAPI'를 추가하여 기본 스택 파라미터 외에도 ParallelCluster API Lambda 역할에 대한 사용자 지정 권한을 추가합니다.

버그 수정:

보안:

  • Python을 3.9에서 3.12로 업그레이드합니다.

  • 취약성 CVE-2024-21538을 해결하기 위해 교차 스폰을 7.0.3에서 7.0.6으로 업그레이드합니다.

  • CVE-2024-35195를 해결하기 위해 2.31.0에서 2.32.0으로 요청을 업그레이드합니다.

  • urllib3를 1.26.18에서 1.26.19로 업그레이드하여 CVE-2024-37891을 해결합니다.

  • CWE-1395를 처리하도록 암호화를 42.0.4에서 44.0.1로 업그레이드합니다.

  • CVE-2024-39689를 처리하도록 certifi를 2023.7.22에서 2024.7.4로 업그레이드합니다.

  • jinja2를 3.1.3에서 3.1.6으로 업그레이드하여 CVE-2024-56201CVE-2024-56326을 해결합니다.

  • serverless_wsgi.py를 버전 3.0.5로 업그레이드합니다.

  • CVE-202CVE-2024-34069CVE-2024-4976667을 처리하도록 Werkzeug를 2.3.8에서 버전 3.CVE-2024-49767.

  • CVE-2024-39338을 처리하도록 Axios를 1.6.7에서 버전 1.8.2로 업그레이드합니다.

  • CVE-2024-51479, CVE-2024-4CVE-2024-469822714.1.1을 해결하려면 Next.js를 14.2.25에서 버전 로 업그레이드합니다. CVE-2025-29927

  • idna를 3.4에서 버전 3.7로 업그레이드하여 CVE-2024-3651을 해결합니다.

  • nanoid를 3.3.7에서 버전 3.3.8로 업그레이드하여 CVE-2024-55565를 해결합니다.

  • CVE-2022-29217을 해결하기 위해 python-jose를 3.3.0에서 버전 3.4.0으로 업그레이드합니다.

2025년 4월 16일

PCUI 버전 2024.11.0 릴리스

PCUI 버전 2024.11.0 릴리스

버그 수정:

  • 스택 업데이트에서 정책이 제거되어 Lambda 함수에 영향을 미치지 않도록 ECR 프라이빗 리포지토리에 대한 정책을 명시적으로 설정합니다. 이 정책에는 Lambda 함수가 코드를 가져오는 데 필요한 권한이 포함되어 있습니다.

2024년 11월 22일

PCUI 버전 2024.10.0 릴리스

PCUI 버전 2024.10.0 릴리스

변경 사항:

  • AWS ParallelCluster 3.11.1에 대한 지원을 추가합니다.

  • 마법사에서 온디맨드 용량 예약 및 용량 블록에 대한 지원을 추가합니다.

  • 마법사에서 지원되는 인스턴스 유형 목록에 g6, m7 및 p5 패밀리를 추가합니다.

  • 새 스택 선택적 파라미터를 추가하여 PCUI와 Cognito 모두에 대한 사용자 지정 도메인을 구성합니다.

버그 수정:

  • 사용자 지정 도메인 설정을 방해하는 버그를 수정합니다.

보안:

  • 취약성 CVE-2024-6221을 해결하려면 Flask-CORS를 3.0.10에서 4.0.2로 업그레이드합니다.

  • 취약성 CVE-2024-4068을 해결하기 위해 lint를 13.0.3에서 15.2.5로 업그레이드합니다.

  • 전체 변경 로그

2024년 10월 22일

PCUI 버전 2024.05.0 릴리스

PCUI 버전 2024.05.0이 릴리스되었습니다.

버그 수정:

  • 사용자가 작업 상태 패널을 열 때 UI를 차단하는 프런트엔드의 버그를 수정했습니다.

  • 전체 변경 로그

2024년 5월 14일

PCUI 버전 2024.04.0 릴리스

PCUI 버전 2024.04.0이 릴리스되었습니다.

기능:

2024년 4월 17일

PCUI 버전 2024.03.0 릴리스

PCUI 버전 2024.03.0이 릴리스되었습니다.

기능:

  • AWS ParallelCluster 버전 3.9.0에 대한 지원이 추가되었습니다.

  • Ubuntu 22.04 및 Red Hat Enterprise Linux 9에 대한 지원 추가

  • 더 이상 사용되지 않는 Ubuntu 18.04

버그 수정

  • 많은 클러스터를 사용할 때 일부 클러스터가 표시되지 않는 문제를 수정했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2024년 3월 12일

PCUI 버전 2024.02.0 릴리스

PCUI 버전 2024.02.0 릴리스

변경 사항:

  • Lambda 런타임 환경을 Python v3.9로 업데이트

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2024년 2월 8일

PCUI 버전 2023.12.0 릴리스

PCUI 버전 2023.12.0 릴리스.

기능:

  • 프라이빗 네트워킹을 사용한 PCUI 배포에 대한 지원이 추가되었습니다.

  • PCUI 및 PCAPI 인프라에서 생성한 모든 IAM 역할에 권한 경계를 선택적으로 적용할 수 있는 가능성을 추가했습니다.

  • PCUI 및 PCAPI 인프라에서 생성한 모든 IAM 역할 및 정책에 접두사를 선택적으로 적용할 수 있는 가능성을 추가했습니다.

  • 마법사에 기능 패리티 없이 ParallelCluster 버전 3.8.0에 대한 지원이 추가되었습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2023년 12월 21일

PCUI 버전 2023.10.0 릴리스

PCUI 버전 2023.10.0이 릴리스되었습니다.

기능:

  • 마법사의 기능 패리티가 FSx 파일 캐시 및 메모리 기반 예약과 여러 인스턴스 유형과의 호환성으로 제한된 ParallelCluster 3.7.2에 대한 지원이 추가되었습니다.

버그 수정:

  • PCUI에 Cost Explorer와 상호 작용할 수 있는 권한이 없는 경우 UI 오류를 유발하는 문제를 수정했습니다.

개선 사항

  • 액세스 토큰 TTL을 10분에서 5분으로 줄여 보안을 개선했습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2023년 10월 20일

PCUI 버전 2023.06.0 릴리스

PCUI 버전 2023.06.0이 릴리스되었습니다.

변경 사항:

  • 기본 AWS ParallelCluster API 버전을 3.6.0으로 업그레이드했습니다.

버그 수정:

  • 끊어진 배포 for AWS GovCloud(미국 서부) 리전을 수정했습니다.

  • 이제 생성 시작 후 분할 패널이 클러스터 세부 정보를 올바르게 로드합니다.

참고:

  • Cost Monitoring 기능은 AWS GovCloud(미국) 리전에서 사용할 수 없습니다.

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2023년 6월 7일

PCUI 버전 2023.05.0 릴리스

PCUI 버전 2023.05.0이 릴리스되었습니다.

개선 사항:

  • AWS ParallelCluster 버전 3.6.0부터 RHEL 8에 대한 지원을 추가합니다.

  • 클러스터 비용 모니터링 추가

  • AWS ParallelCluster 버전 3.6.0부터 대기열 및 컴퓨팅 리소스 할당량을 늘립니다.

변경 사항:

  • 클러스터 생성 마법사 사용자 인터페이스가 개선되었습니다.

  • PCUI 배포 속도가 향상되었습니다.

  • 새 사용자 추가를 위한 인터페이스가 개선되었습니다.

  • 대기열은 기본적으로 헤드 노드 서브넷에 있습니다.

버그 수정:

  • 클러스터 생성이 완료된 후 올바른 지역으로 전환

  • “클러스터 편집” 특성에서 로딩 표시기 표시 수정

  • EBS SnapshotId 속성이 제거될 때 클러스터 생성 수정

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2023년 5월 16일

PCUI 버전 2023.04.0 릴리스

PCUI 버전 2023.04.0이 릴리스되었습니다.

개선 사항:

  • 클러스터 생성 마법사 재설계

  • 클러스터 로그 페이지 재설계

  • 공유 스토리지에 사용자 지정 이름 설정 추가

  • 클러스터에 스토리지를 추가할 때 여러 스토리지 선택 추가

  • Amazon EFS 및 FSx for Lustre에 대한 DeletionPolicy 지원 추가

  • 클러스터 구성에 ImdsSupport 설정 추가

  • C7 인스턴스 유형에 대한 지원 추가

  • 이전 AWS Systems Manager 문서 버전으로 되돌리기 자습서가 추가되었습니다.

변경 사항:

  • 클러스터 구성 YAML 크기는 최대 1MB입니다.

  • Boto3 IAM 임시 보안 인증을 통한 권한 부여로 인해 사용자가 로그아웃되지 않습니다.

  • HPC 인스턴스 선택 시 멀티스레딩 옵션 비활성화

  • 클러스터 생성 페이지에서 비활성화 롤백 제거

  • 필요한 정보가 제공될 때까지 사용자는 PCUI를 사용할 수 없습니다.

  • 대기열을 최대 10개까지 추가할 수 있습니다.

  • PCUI 설치 중에 SSM-SessionManagerRunShell 문서가 덮어쓰이지 않습니다.

버그 수정:

  • 비밀번호 재설정의 깨진 링크 수정

  • EcrPrivateRepository가 비어 있지 않음으로 인한 delete stack 깨짐 문제 수정

  • 다중 사용자 관리 속성 섹션의 SSH 키 생성 확인란의 초기화 문제를 수정했습니다.

  • 속성이 정의되지 않은 작업으로 인해 발생하는 충돌이 수정되었습니다.

  • SCRATCH FSx 설정을 수정했습니다.

  • 한 번 클릭해도 여전히 활성화되어 있는 인스턴스 시작 및 중지 버튼 수정

변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.

2023년 4월 17일

Terraform
변경 사항 설명 날짜

Terraform Provider for AWS ParallelCluster 1.1.0 릴리스

버그 수정:

  • 로그인 노드가 있는 클러스터를 배포하는 데 ParallelCluster API 3.11.x를 사용할 때 terraform-apply 오류가 발생하는 문제를 수정했습니다.

2024년 12월 6일

Terraform Module for AWS ParallelCluster 1.1.0 릴리스

변경 사항:

  • 모든 모듈 예제에서 AWS ParallelCluster Terraform Provider 1.x를 사용합니다.

  • 스택 이름이 ParallelClusterAPI인 모든 예제에서 ParallelClusterAPI 3.11.1을 사용합니다.

  • 모든 모듈 예제에서 로그인 노드를 배포합니다.

2024년 12월 6일

Terraform Provider for AWS ParallelCluster 1.0.0 릴리스

기능:

2024년 6월 26일

Terraform Module for AWS ParallelCluster 1.0.0 릴리스

기능:

2024년 6월 26일