AWS ParallelCluster
변경 사항 |
설명 |
날짜 |
AWS ParallelCluster 버전 3.13.2 릴리스
|
업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster .
버그 수정:
|
2025년 6월 24일
|
AWS ParallelCluster 버전 3.13.1 릴리스
|
업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster .
변경 사항:
-
Slurm을 버전 24.05.8로 업그레이드합니다.
-
EFA 설치 프로그램을 1.41.0(1.38.1부터)으로 업그레이드합니다.
-
Efa-driver: efa-2.15.0-1
-
Efa-config: efa-config-1.18-1
-
Efa-profile: efa-profile-1.7-1
-
Libfabric-aws: libfabric-aws-2.1.0-1
-
Rdma-core: rdma-core-57.0-1
-
Open MPI: openmpi40-aws-4.1.7-2 및 openmpi50-aws-5.0.6
-
비 Amazon Linux AMI의 경우 amazon-efs-utils를 버전 2.3.1(v2.1.0에서)로 업그레이드합니다.
-
us-isob-east-1 및 us-iso-east-1에서 DCV를 지원합니다.
-
us-isob-east-1 및 us-iso-east-1에서 Lustre 및 Ontap용 FSX를 지원합니다.
-
시작 부분에 고정하고 완료 시 고정 해제하여 ParallelCluster 이미지 빌드 전체에서 커널 일관성을 보장합니다.
버그 수정:
|
2025년 6월 4일
|
AWS ParallelCluster 버전 3.13.0 릴리스
|
업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster .
사용 중단:
개선 사항:
-
Ubuntu 24.04에 대한 지원을 추가합니다.
-
ap-southeast-7 리전에 대한 지원을 추가합니다.
-
보안을 강화하기 위해 공식 ParallelCluster AMIs에서 미사용 서비스 컵 및 wpa_supplicant를 비활성화합니다.
변경 사항:
-
Slurm을 버전 24.05.7로 업그레이드합니다.
-
AL2를 제외한 모든 OS에 대해 NVIDIA 드라이버를 버전 570.86.15(550.127.08에서)로 업그레이드합니다. OSs
-
AL2를 제외한 모든 OS에 대해 CUDA Toolkit을 버전 12.8.0(12.4.1부터)으로 업그레이드합니다. OSs
-
AL2(3.9.20부터)를 제외한 모든 OSs에 대해 Python을 3.12.8로 업그레이드합니다. AL2
-
Ubuntu 22.04에서는 커널을 컴파일하는 데 사용된 것과 동일한 컴파일러 버전으로 Nvidia 드라이버를 설치합니다.
-
버전 2.0-33aws-cfn-bootstrap 으로 업그레이드합니다.
-
EFA 설치 프로그램을 1.38.0(1.36.0에서)으로 업그레이드합니다.
-
Efa-driver: efa-2.13.0-1
-
Efa-config: efa-config-1.17-1
-
Efa-profile: efa-profile-1.7-1
-
Libfabric-aws : libfabric-aws-1.22.0-1
-
Rdma-core: rdma-core-54.0-1
-
오픈 MPI: openmpi40-aws-4.1.7-1 및 openmpi50-aws-5.0.5
-
amazon-efs-utils 버전 2.1.0으로 업그레이드합니다.
-
타사 쿡북 제거: apt-7.5.22 및 pyenv-4.2.3.
-
서드 파티 쿡북 종속성 업그레이드:
-
line-4.5.21(line-4.5.13에서)
-
nfs-5.1.5(nfs-5.1.2부터)
-
openssh-2.11.14(Openssh-2.11.12부터)
-
yum-7.4.20(yum-7.4.13부터)
-
yum-epel-5.0.8(yum-epel-5.0.2에서)
-
Pmix를 5.0.6(5.0.3에서)으로 업그레이드합니다.
-
ARM PL을 버전 24.10(23.10부터)으로 업그레이드합니다.
-
Lambda 계층 및 설치 관리자에서 Python을 버전 3.12.8(3.9.17부터)로 업그레이드합니다.
-
Lambda 계층 및 설치 관리자에서 NodeJS를 버전 20.18.3(18.20.3부터)으로 업그레이드합니다.
-
OpenSSH 9.7 이상에서 지원되지 않는 DSA로 로그인 노드에 대한 DSA 키 생성을 제거합니다.
-
컴퓨팅 노드 시작 시 Slurm에서 인스턴스 ID 및 인스턴스 유형 정보를 설정합니다.
-
이제 NVIDIA 설치 프로그램에서 더 이상 사용되지 않는 'no-cc-version-check' 옵션 없이 NVIDIA 드라이버를 설치합니다.
-
최대 10개의 로그인 노드 풀을 적용할 검사기를 추가합니다.
-
기본 루트 볼륨 크기를 45GB로 업데이트합니다.
버그 수정:
-
컴퓨팅 노드 부트스트래핑에 대한 cfn-init 사용을 제거하여 노드 스케일 업 시간을 줄입니다.
-
프록시를 사용할 때 컴퓨팅 노드 부트스트랩 실패를 일으키는 문제를 해결합니다.
-
Ubuntu 22.04에서는 설치 실패를 방지하기 위해 커널을 컴파일하는 데 사용된 것과 동일한 컴파일러 버전으로 Nvidia 드라이버를 설치합니다.- 업데이트 중에 헤드 노드에서만 aws-parallelcluster-node 패키지 재정의 실행을 수정합니다.
-
다중 사용자 환경(Active Directory와 통합됨)에서 Pyxis/Enroot를 통해 실행된 컨테이너화된 작업이 실패하는 문제를 해결합니다.
-
디렉터리 서비스를 사용할 때 Rocky 9.5 이상에서 노드 부트스트랩 실패를 유발하는 authselect 사용을 수정했습니다.
|
2025년 4월 1일
|
AWS ParallelCluster 버전 3.12.0 릴리스
|
업그레이드하려면를 입력합니다sudo pip install --upgrade aws-parallelcluster .
개선 사항:
-
새 빌드 이미지 구성 섹션을 추가하여 NVIDIA 소프트웨어 및 Lustre 클라이언트 설치를 Build/Installation 켜거나 끕니다. 기본적으로 NVIDIA 소프트웨어는 공식 ParallelCluster AMIs에 포함되어 있지만에서 설치하지 않습니다build-image . 기본적으로 Lustre 클라이언트가 설치됩니다.
-
CLI 명령 export-cluster-logs 및는 이제 기본적으로 로그를 기본 ParallelCluster 버킷 또는 구성에 지정된 경우 CustomS3Bucket으로 내보낼 export-image-logs 수 있습니다.
-
Amazon DCV 지원을 ARM 인스턴스의 Ubuntu2204로 확장합니다.
변경 사항:
-
NVIDIA 드라이버를 버전 550.127.08(550.90.07에서)로 업그레이드합니다. 이를 통해 NVIDIA의 알려진 문제를 해결할 수 있습니다. 자세한 내용은 NVIDIA 데이터 센터 설명서의 알려진 문제를 참조하세요.
-
Amazon DCV를 버전 로 업그레이드합니다2024.0-18131 .
-
EFA 설치 프로그램을 1.36.0 으로 업그레이드
-
Efa-driver: efa-2.13.0-1
-
Efa-config: efa-config-1.17-1
-
Efa-profile: efa-profile-1.7-1
-
Libfabric-aws: libfabric-aws-1.22.0-1
-
Rdma-core: rdma-core-54.0-1
-
오픈 MPI: openmpi40-aws-4.1.7-1 및 openmpi50-aws-5.0.5
-
실패 시 slurmctld를 자동으로 다시 시작합니다.
-
mysql-community-client를 버전 8.0.39로 업그레이드합니다.
-
수명이 종료된 Python 3.7 및 3.8에 대한 지원을 제거합니다.
버그 수정:
-
클러스터 업데이트 중에 사용자 지정 작업 스크립트 시퀀스의 변경 사항이 감지되지 않는 문제를 해결합니다.
-
AWS ParallelCluster API에 누락된 권한을 추가하여 로그인 노드를 배포하는 데 필요한 Elastic Load Balancing 및 Auto Scaling에 대한 서비스 연결 역할을 생성합니다.
-
로컬 영역을 올바르게 처리할 수 있도록 볼륨을 관리할 때 리전을 가져오는 방식의 문제를 해결합니다.
-
업데이트 AccessPointIds 중에에 EFS 파일 시스템을 추가하는 데 실패하는 문제를 해결합니다.
-
PCAPI를 사용할 때 유형이 아닌 파라미터String (예: )를 업데이트할 때 클러스터 업데이트가 실패할 수 있는 문제를 해결합니다MaxCount .
-
외부 OpenZFS를 탑재할 때 더 이상 포트 111, 2049, 20001, 20002, 20003에 대한 아웃바운드 규칙을 설정할 필요가 없습니다.
|
2024년 12월 19일
|
AWS ParallelCluster 버전 3.11.1 릴리스
|
기능:
-
이제 Pyxis는 기본적으로 비활성화되므로 제품 설명서에 설명된 대로 수동으로 활성화해야 합니다.
-
ParallelCluster Lambda Layer에서 Python 런타임을 버전 3.12로 업그레이드합니다.
-
setuptools의 버전 고정을 70.0.0 이전 버전으로 제거합니다.
-
libjwt를 버전 1.17.0으로 업그레이드.
전체 변경 로그
버그 수정
|
2024년 10월 21일
|
AWS ParallelCluster 버전 3.11.0 릴리스
|
개선 사항
로그인 노드에서 사용자 지정 작업에 대한 지원을 추가합니다. 로그인 노드에 대한 DCV 연결을 허용합니다. ap-southeast-3 리전에 대한 지원을 추가합니다. 로그인 노드 네트워크 로드 밸런서에 보안 그룹을 추가합니다. 로그인 노드에 대한 AllowedIps 구성을 추가합니다. 탑재SharedStorage/EfsSettings/AccessPointId 에 대한 선택적 EFS 액세스 포인트를 지정하는 새 구성 추가 최대 10개의 로그인 노드 풀을 허용합니다. 공식 pcluster AMIs에 enroot 및 pyxis 설치
변경 사항
[BREAKING] API DescribeCluster 및 CLI 명령에서 반환describe-cluster 된 loginNodes 필드가 여러 로그인 노드 풀을 지원하도록 사전에서 배열로 변경되었습니다. 이 변경 사항은 이전 버전과의 호환성을 깨뜨리므로 이러한 작업은 이전 버전과 함께 배포된 클러스터와 호환되지 않습니다.
Slurm을 23.11.10(23.11.7부터)로 업그레이드합니다. Pmix를 5.0.3(5.0.2에서)으로 업그레이드합니다. EFA 설치 프로그램을 1.34.0 으로 업그레이드
Efa-driver: efa-2.10.0-1 Efa-config: efa-config-1.17-1 Efa-profile: efa-profile-1.7-1 Libfabric-aws: libfabric-aws-1.22.0-1 Rdma-core: rdma-core-52.0-1 오픈 MPI: openmpi40-aws-4.1.6-3 및 openmpi50-aws-5.0.3-11
NVIDIA 드라이버를 버전 550.90.07(535.183.01에서)로 업그레이드합니다. CUDA 도구 키트를 버전 12.4.1(12.2.2부터)로 업그레이드합니다. Python을 3.9.20(3.9.19부터)로 업그레이드합니다. Intel MPI 라이브러리를 2021.13.1.769(2021.12.1.8부터)로 업그레이드합니다.
버그 수정
용량 블록을 사용할 때 배치 그룹을 구성하지 EfaPlacementGroupValidator 않도록 검사기를 수정했습니다. 보안 그룹 규칙 이후에 FSx for Lustre 파일 시스템이 생성되도록 하여 가끔 발생하는 클러스터 생성 실패를 수정합니다. 배치 그룹이 활성화된 경우 클러스터 삭제 실패를 수정합니다. SSH 액세스를 제한할 때 로그인 노드가 비정상으로 표시되는 문제를 해결합니다. 올바른 S3 URL을 가져올 수 retrieve_supported_regions 있도록 수정했습니다. 페이지 매김describe_images 을 사용하도록 수정했습니다. LoginNodes/Networking/SubnetIds에 기본 VPC 서브넷을 지정할 때 No route tables found 버그를 수정합니다. LoginNodes/Networking/SubnetIds
|
2024년 9월 26일
|
AWS ParallelCluster 버전 3.10.1 릴리스
|
버그 수정
|
2024년 7월 8일
|
AWS ParallelCluster 버전 3.10.0 릴리스
|
개선 사항:
-
새 구성 섹션을 추가하여 클러스터를 외부 Slurmdbd에 Scheduling/SlurmSettings/ExternalSlurmdbd 연결합니다.
-
격리된 네트워크에서 build-image를 실행하도록 허용합니다.
-
Amazon Linux 2023에 대한 지원을 추가합니다.
-
에 대한 지원을 price-capacity-optimized 로 추가합니다AllocationStrategy .
-
용량 블록이 있는 배치 그룹의 사용을 방지하기 위해 검사기를 추가합니다.
변경 사항:
-
CentOS 7은 더 이상 지원되지 않습니다.
-
Cinc Client를 18.4.12에서 18.2.7로 업그레이드합니다.
-
munge를 버전 0.5.16(0.5.15에서)으로 업그레이드합니다.
-
Pmix를 5.0.2(4.2.9에서)로 업그레이드합니다.
-
서드 파티 쿡북 종속성 업그레이드:
-
타사 쿡북 제거: selinux-6.1.12.
-
EFA 설치 프로그램을 1.32.0 으로 업그레이드
-
Efa-driver: efa-2.8.0-1
-
Efa-config: efa-config-1.16-1
-
Efa-profile: efa-profile-1.7-1
-
Libfabric-aws: libfabric-aws-1.21.0-1
-
Rdma-core: rdma-core-50.0-1
-
오픈 MPI: openmpi40-aws-4.1.6-3 및 openmpi50-aws-5.0.2-12
-
NVIDIA 드라이버를 버전 535.183.01(535.154.05에서)로 업그레이드합니다.
-
Python을 3.9.19(3.9.17부터)로 업그레이드합니다.
-
Intel MPI 라이브러리를 2021.12.1.8(2021.9.0.43482부터)로 업그레이드합니다.
버그 수정:
-
AutoExportPolicy 및 AutoImportPolicy 선택 사항을 만들도록 데이터 리포지토리 연결 구성을 수정합니다.
-
클러스터 삭제 중 인스턴스가 종료 또는 종료 상태일 때 컴퓨팅 플릿 정리를 완료하는 문제를 수정했습니다. 이는 종료 주기가 더 긴 인스턴스 유형에 대한 클러스터 삭제 실패를 방지하기 위한 것입니다.
-
클러스터 구성의 Monitoring 섹션에서 Cloudwatch 대시보드를 활성화하고 경보를 비활성화할 수 있습니다.
-
ParallelCluster 사용자 지정 리소스가를 사용하여 검사기를 억제하도록 허용합니다PclusterCluster/SuppressValidators .
-
모든 사용자 로그인 시 실행되지 않고 PATH 환경 변수에 추가되지 /etc/profile.d/pcluster.sh 않도록 cfn_bootstrap_virtualenv 를 제거합니다.
-
DescribeCluster 응답에서 필드를 failureReason 로 대체하여 ParallelCluster API 사양을 수정failures 합니다.
-
누락된 CloudFormation 스택 상태를 추가하여 ParallelCluster API 사양을 수정합니다. IMPORT_* , REVIEW_IN_PROGRESS 및 UPDATE_FAILED .
-
클러스터 업데이트가 전송 중 암호화가 있는 EFS 파일 시스템을 포함하지 못하는 문제를 수정했습니다.
-
EFS를 공유 내부 데이터에 사용할 때 헤드 노드 재부팅 시 slurmctld 및 slurmdbd 서비스가 다시 시작되지 않는 문제를 수정했습니다.
-
Ubuntu 시스템에서 ParallelCluster에서 가져온 구성으로 클래시된 cloud-init 로그 파일의 기본 로그 순회 구성을 제거합니다.
-
RHEL 8.10 이상에서 이미지 빌드 실패를 수정합니다.
|
2024년 6월 27일
|
AWS ParallelCluster 버전 3.9.3 릴리스
|
업그레이드하려면 sudo pip install --upgrade aws-parallelcluster 를 입력
기능:
버그 수정:
|
2024년 6월 19일
|
AWS ParallelCluster 버전 3.9.2 릴리스
|
기능:
|
2024년 5월 28일
|
AWS ParallelCluster 버전 3.9.1 릴리스
|
업그레이드하려면 다음을 입력합니다. sudo pip install --upgrade
aws-parallelcluster
버그 수정
|
2024년 4월 11일
|
AWS ParallelCluster 버전 3.9.0 릴리스
|
업그레이드하려면 다음을 입력합니다. sudo pip install --upgrade
aws-parallelcluster
개선 사항:
-
사용자가 기본 사용자의 홈 디렉터리를 /home (기본값) 대신 /local/home 으로 이동할 수 있도록 구성 파라미터 DeploymentSettings/DefaultUserHome 을 추가합니다.
-
컴퓨팅 플릿을 중지할 필요 없이 MinCount , MaxCount , Queue 및 ComputeResource 구성 파라미터를 업데이트할 수 있도록 허용합니다. 이제 Scheduling/SlurmSettings/QueueUpdateStrategy 를 TERMINATE로 설정하여 업데이트할 수 있습니다. AWS ParallelCluster 는 클러스터 업데이트를 통해 수행되는 클러스터 용량의 크기 조정 중에 제거된 노드만 종료합니다.
-
컴퓨팅 및 로그인 플릿을 교체하지 않고 Efs, FsxLustre, FsxOntap, FsxOpenZfs 및 FileCache 유형의 외부 공유 스토리지를 업데이트할 수 있도록 허용합니다.
-
RHEL9 지원 추가.
-
build-image 프로세스를 통해 생성된 CustomAmi 로 Rocky Linux 9에 대한 지원을 추가합니다. 현재 public official AWS ParallelCluster Rocky9 Linux AMI를 사용할 수 없습니다.
-
사용자 지정 Slurm 설정 거부 목록에서 CommunicationParameters 를 제거합니다.
-
지원되는 OSes에서 기본 사용자의 sudo 액세스를 비활성화하는 DeploymentSettings/DisableSudoAccessForDefaultUser 파라미터를 추가합니다.
-
ParallelCluster에서 생성한 FSx for Lustre 파일 시스템에 대한 변경 사항: Lustre 서버 버전을 2.15. 로 변경
-
['cluster']['nvidia']['kernel_open'] 쿡북 노드 속성을 통해 AMI를 구축할 때 오픈 소스 Nvidia 드라이버와 클로즈 소스 Nvidia 드라이버 중에서 선택할 수 있는 가능성을 추가합니다.
-
* clustermgtd 구성 옵션 ec2_instance_missing_max_count 를 추가하여 최종 Amazon EC2에 대해 구성 가능한 재시도 횟수가 실행 인스턴스와의 인스턴스 일관성을 설명할 수 있도록 합니다.
변경 사항
-
Slurm을 23.11.4(23.02.7부터)로 업그레이드합니다.
-
NVIDIA 드라이버를 버전 535.154.05로 업그레이드합니다.
-
pcluster CLI 및 aws-parallelcluster-batch-cli에서 Python 3.11, 3.12에 대한 지원을 추가합니다.
-
MaximumNetworkCards 범위를 루핑하는 대신 Amazon EC2 DescribeInstances 응답 목록 NetworkCardIndex 의 네트워크 카드 인덱스를 사용하여 네트워크 인터페이스를 구축합니다.
-
인스턴스 유형 P3, G3, P2 및 G2를 사용하는 경우 GPU 아키텍처가 3.8.0 릴리스의 일부로 도입된 오픈 소스 Nvidia 드라이버(OpenRM)와 호환되지 않으므로 클러스터 생성에 실패합니다.
-
타사 쿡북 종속성 업그레이드: nfs-5.1.2(nfs-5.0.0에서)
-
EFA 설치 프로그램을 1.30.0. 으로 업그레이드
-
Efa-driver: efa-2.6.0-1
-
Efa-config: efa-config-1.15-1
-
Efa-profile: efa-profile-1.6-1
-
Libfabric-aws: libfabric-aws-1.19.0
-
Rdma-core: rdma-core-46.0-1
-
오픈 MPI: openmpi40-aws-4.1.6-2 및 openmpi50-aws-5.0.0-11
-
NICE DCV를 버전 2023.1-16388. 로 업그레이드
버그 수정
-
로그인 노드에서 Active Directory 사용자로 제출할 때 작업 실패 문제를 해결합니다. 헤드 노드의 외부 Active Directory와의 통합이 불완전하게 구성되었기 때문에 문제가 발생했습니다.
-
CloudFormation 템플릿 parallelclutser-policies.yaml에 정의된 IAM 정책을 리팩터링하여 IAM 제한을 초과하는 정책으로 인한 ParallelCluster API 배포 실패를 방지합니다.
-
헤드 노드가 키를 쓸 때 예상보다 많은 시간이 걸릴 때 로그인 노드가 부트스트랩에 실패하는 문제를 해결합니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster-ui 패키지 CHANGELOG 파일을 참조하세요.
|
2024년 3월 5일
|
AWS ParallelCluster 버전 3.8.0 릴리스
|
AWS ParallelCluster 버전 3.8.0 릴리스.
개선 사항:
-
Amazon EC2 Capacity Blocks for ML에 대한 지원을 추가합니다.
-
build-image 프로세스를 통해 생성된 CustomAmi 로 Rocky Linux 8에 대한 지원을 추가합니다. 현재 퍼블릭 official AWS ParallelCluster Rocky8 Linux AMI를 사용할 수 없습니다.
-
Slurm 컴퓨팅 노드용 Amazon EC2 인스턴스를 시작할 때 사용할 클러스터 조정 전략을 제어하는 Scheduling/ScalingStrategy 파라미터를 추가합니다. 가능한 값은 all-or-nothing , greedy-all-or-nothing , best-effort 이며 기본값은 all-or-nothing 입니다.
-
클러스터 내 공유 파일 시스템 리소스의 헤드 노드 루트 볼륨에서 NFS 내보내기 대신 EFS 스토리지를 사용하도록 HeadNode/SharedStorageType 파라미터를 추가합니다. ParallelCluster, Intel, Slurm 및 /home 데이터. 이렇게 개선하면 헤드 노드 네트워킹의 부하가 줄어듭니다.
-
구성 파일의 SharedStorage 섹션을 통해 /home 을 EFS 또는 FSx 외부 공유 스토리지로 탑재할 수 있습니다.
-
새 파라미터를 추가하여 SlurmSettings/MungeKeySecretArn 가 AWS Secrets Manager의 외부 사용자 정의 MUNGE 키를 사용하도록 허용합니다.
-
Monitoring/Alarms/Enabled 파라미터를 추가하여 클러스터에 대한 Amazon CloudWatch 경보를 전환합니다.
-
헤드 노드 경보를 추가하여 Amazon EC2 상태 확인, CPU 사용률 및 헤드 노드의 전체 상태를 모니터링하고 클러스터로 생성된 CloudWatch Dashboard에 추가합니다.
-
PERSISTENT_2 를 관리형 FSx for Lustre에 대한 DeploymentType 으로 사용할 때 데이터 리포지토리 연결에 대한 지원을 추가합니다.
-
사용자가 Slurm 회계에 사용할 데이터베이스 서버의 데이터베이스에 대한 사용자 지정 이름을 지정할 수 있도록 Scheduling/SlurmSettings/Database/DatabaseName 파라미터를 추가합니다.
-
컴퓨팅 리소스에서 CapacityReservationTarget/CapacityReservationId 를 구성할 때 선택적 구성 파라미터 InstanceType 을 작성합니다.
-
AWS ParallelCluster API에서 생성한 IAM 역할 및 정책의 접두사를 지정할 수 있는 가능성을 추가합니다.
-
AWS ParallelCluster API에서 생성한 IAM 역할 및 정책에 적용할 권한 경계를 지정할 수 있는 가능성을 추가합니다.
변경 사항
-
Slurm을 23.02.7(23.02.6부터)로 업그레이드합니다.
-
NVIDIA 드라이버를 버전 535.129.03으로 업그레이드합니다.
-
CUDA Toolkit을 버전 12.2.2로 업그레이드합니다.
-
오픈 소스 NVIDIA GPU 드라이버(OpenRM)를 NVIDIA 클로즈 소스 모듈 대신 Linux용 NVIDIA 커널 모듈로 사용합니다.
-
새 Scheduling/ScalingStrategy 클러스터 all_or_nothing_batch 구성을 위해 Slurm 재개 프로그램에서 구성 파라미터에 대한 지원을 제거합니다.
-
클러스터 경보 명명 규칙이 '[cluster-name]-[component-name]-[metric]'으로 변경되었습니다.
-
루트 볼륨과 추가 볼륨 모두에서 ADC 리전의 기본 EBS 볼륨 유형을 gp2에서 gp3으로 변경합니다.
-
이제 AWS ParallelCluster API 인프라에서 생성한 모든 IAM 역할에 API에 대한 선택적 권한 경계가 적용됩니다.
-
EFA 설치 프로그램을 1.29.1 으로 업그레이드
-
Efa-driver: efa-2.6.0-1
-
Efa-config: efa-config-1.15-1
-
Efa-profile: efa-profile-1.5-1
-
Libfabric-aws: libfabric-aws-1.19.0-1
-
Rdma-core: rdma-core-46.0-1
-
Open MPI: openmpi40-aws-4.1.6-1
-
버전 2.3.1이 사용되는 Centos 7을 제외하고 지원되는 OSes에서 GDRCopy를 버전 2.4로 업그레이드합니다.
-
aws-cfn-bootstrap 이 버전 2.0-28로 업그레이드됩니다.
-
aws-parallelcluster-batch-cli에서 Python 3.10에 대한 지원을 추가합니다.
버그 수정
-
컴퓨팅 리소스에 선언된 인스턴스 유형 목록을 수정할 때 클러스터 업데이트 롤백 후 일관성 없는 조정 구성을 수정합니다.
-
클러스터 구성 파일을 통해 외부 LDAP 서버와 통합된 클러스터에서 루트 권한이 없는 사용자를 전환할 때 사용자 SSH 키 생성을 수정합니다.
-
설정 시 Slurm 절전 모드 비활성화를 수정했습니다ScaledownIdletime = -1 .
-
Slurm 회계용 update_slurm_database_password.sh 스크립트에서 하드 코딩된 경로를 Slurm 설치 다이어로 수정했습니다.
|
2023년 12월 19일
|
AWS ParallelCluster 버전 3.7.2 릴리스
|
AWS ParallelCluster 버전 3.7.2 릴리스.
변경 사항:
|
2023년 10월 25일
|
AWS ParallelCluster 버전 3.7.1 릴리스
|
AWS ParallelCluster 버전 3.7.1 릴리스.
변경 사항:
|
2023년 9월 22일
|
AWS ParallelCluster 버전 3.7.0 릴리스
|
AWS ParallelCluster 버전 3.7.0 릴리스.
개선 사항:
-
구성 YAML 파일을 사용하여 컴퓨팅 리소스의 정적 및 동적 노드 우선 순위 AWS ParallelCluster 구성을 지원합니다.
-
Ubuntu 22에 대한 지원 추가 RSA 키는 기본적으로 지원되지 않습니다.
-
대기열 구성 설정 JobExclusiveAllocation 을 추가하여 언제든지 파티션의 노드를 단일 작업에만 독점적으로 할당할 수 있습니다.
-
클러스터 생성 및 클러스터 업데이트 시 aws-parallelcluster-node 패키지 재정의를 허용합니다. 헤드 노드의 경우 클러스터 업데이트에도 적용됩니다. 개발 목적으로만 유용합니다.
-
컴퓨팅 노드에서 NFS 서버를 시작하지 마세요.
-
로그인 노드에 대한 지원을 추가합니다.
-
Slurm 컴퓨팅 리소스에 여러 인스턴스 유형이 지정된 경우 메모리 기반 스케줄링을 허용합니다.
-
기존 Amazon File Cache를 공유 스토리지로 탑재하기 위한 지원을 추가합니다.
변경 사항:
-
Slurm 동적 노드에 기본적으로 1000의 우선 순위(가중치)를 할당합니다. 이렇게 하면 Slurm이 유휴 동적 노드보다 유휴 정적 노드의 우선 순위를 지정할 수 있습니다.
-
aws-parallelcluster-node 데몬이 관리형 Slurm 파티션만 처리 AWS ParallelCluster 하도록 합니다.
-
EFS-utils 워치독 폴링 간격을 10초로 늘입니다. 이 변경 사항은 워치독이 실행되도록 하는 유일한 조건인 EncryptionInTransit 가 true 로 설정된 경우에 적용됩니다.
-
EFA 설치 프로그램을 1.25.1 으로 업그레이드
-
Efa-driver: efa-2.1.1g 에서 efa-2.5.0-1 로
-
Efa-config: efa-config-1.13-1 에서 efa-config-1.15-1 로
-
Efa-profile: efa-profile-1.5-1 (변경 없음)
-
Libfabric-aws: libfabric-aws-1.17.1-1 에서 libfabric-aws-1.18.1-0 로
-
Rdma-core: rdma-core-43.0-1 에서 rdma-core-46.0-1 로
-
Open MPI:
openmpi40-aws-4.1.5-1 에서 openmpi40-aws-4.1.5-4 로
-
Slurm을 버전 23.02.4로 업그레이드합니다.
-
Imds/ImdsSupport의 기본값을 v1.0에서 v2.0으로 변경
-
Ubuntu 18을 더 이상 사용하지 마세요.
-
Centos 7의 제한을 고려하여 기본 루트 볼륨 크기를 40GB로 업데이트
-
루트 노드만 읽을 수 있도록 헤드 노드 내의 /tmp/wait_condition_handle.txt 파일에 대한 권한을 제한
-
노드 패키지 대몬(daemon)이 PC에서 관리하는 Slurm 파티션과 노드 목록을 인식하는 데 사용할 Slurm partition-nodelist 매핑 JSON 파일 생성
-
NVIDIA 드라이버를 버전 535.54.03로 업그레이드
-
CUDA 라이브러리를 버전 12.2.0로 업그레이드
-
NVIDIA Fabric Manager를 nvidia-fabricmanager-535로 업그레이드합니다.
-
Ubuntu 22.04에서만 ARM PL을 버전 23.04.1로 업그레이드
-
NICE DCV를 버전 2023.0-15487 으로 업그레이드하세요.
버그 수정:
-
값이 -1보다 작게 설정되지 않도록 ScaledownIdletime 값에 유효성 검사를 추가합니다.
-
DCV가 활성화된 GPU 인스턴스에서 Ubuntu 딥 러닝 AMI를 사용하여 클러스터 생성 실패를 수정했습니다.
-
CustomLambdarole을 사용하여 ParallelCluster CloudFormation 사용자 지정 리소스 공급자를 생성할 때 끊김 현상이 발생하는 IAM 정책이 생성되는 문제를 수정했습니다.
-
여러 네트워크 인터페이스가 있는 인스턴스에서 SlurmSettings/Dns/UseEc2Hostnames 가 True 임을 사용할 때 컴퓨팅 노드 DNS 이름이 잘못 정렬되는 문제를 수정했습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2023년 8월 30일
|
설명서 전용 릴리스
|
AWS ParallelCluster 버전 3별 사용 설명서가 게시되었습니다.
설명서 전용 릴리스
|
2023년 7월 17일
|
AWS ParallelCluster 버전 3.6.1 릴리스
|
AWS ParallelCluster 버전 3.6.1 릴리스.
변경 사항:
버그 수정:
-
루트 볼륨 디바이스 이름(/dev/sda1 및 /dev/xvda )의 하드 코딩을 제거하고 중에 사용된 AMIs에서 검색합니다create-cluster .
-
CloudFormation 사용자 지정 리소스를 True 로 설정된 ElasticIp 과 사용할 때 클러스터 생성 실패 수정
-
대용량 구성 파일과 함께 AWS CloudFormation 사용자 지정 리소스를 사용할 때 클러스터 생성 및 업데이트 실패를 수정합니다.
-
Ubuntu에서 ptrace 보호 기능이 비활성화되지 않고 libfabric에서 크로스 메모리 연결(CMA)이 허용되지 않는 문제를 수정했습니다.
-
여러 인스턴스 유형을 사용하고 인스턴스가 반환되지 않는 경우 용량이 빠르게 부족한 장애 조치 로직을 수정했습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2023년 7월 5일
|
AWS ParallelCluster 버전 3.6.0 릴리스
|
AWS ParallelCluster 버전 3.6.0 릴리스.
설명서:
개선 사항:
변경 사항:
-
Slurm을 버전23.02.2 ( 버전 )으로 업그레이드합니다22.05.8 .
-
munge를 버전 0.5.15 에서 버전 0.5.14 으로 업그레이드
-
Slurm을 30TreeWidth 으로 설정합니다.
-
Slurm prolog 및 epilog 구성을 /opt/slurm/etc/scripts/epilog.d/ 각각 대상 디렉터리 /opt/slurm/etc/scripts/prolog.d/ 및 로 설정합니다.
-
컴퓨팅 노드 등록 중에 스크립트를 실행BatchStartTimeout 하려면 Slurm을 최대 Prolog 3분으로 설정합니다.
-
CloudWatch Logs의 기본 RetentionInDays 을 14일에서 180일로 증가
-
EFA 설치 프로그램을 1.22.1 으로 업그레이드
-
Dkms: 2.8.3-2
-
Efa-driver: efa-2.1.1g (변경 없음)
-
Efa-config: efa-config-1.13-1 (변경 없음)
-
Efa-profile: efa-profile-1.5-1 (변경 없음)
-
Libfabric-aws: libfabric-aws-1.17.0-1 에서 libfabric-aws-1.17.1-1 로
-
Rdma-core: rdma-core-43.0-1 (변경 없음)
-
Open MPI: openmpi40-aws-4.1.5-1 (변경 없음)
-
Amazon Linux 2에서 Lustre 클라이언트 버전을 2.12 로 업그레이드 Ubuntu 20.04, 18.04, CentOS >= 7.7에 Lustre 클라이언트 2.12 가 설치되었습니다.
-
CentOS 7.6에서 Lustre 클라이언트 버전을 2.10.8 로 업그레이드
-
NVIDIA 드라이버를 버전 470.141.03 에서 버전 470.182.03 으로 업그레이드
-
NVIDIA Fabric Manager를 버전 470.141.03 에서 버전 470.182.03 으로 업그레이드
-
NVIDIA CUDA Toolkit을 버전 11.7.1 에서 버전 11.8.0 으로 업그레이드
-
NVIDIA CUDA 샘플을 버전 11.8.0 으로 업그레이드
-
Intel MPI Library를 버전 2021 업데이트 6에서 버전 2021 업데이트 9로 업그레이드 자세한 내용은 Intel® MPI Library 2021 Update 9를 참조하세요.
-
NICE DCV를 버전 2022.2-14521 에서 버전 2023.0-15022 로 업그레이드
-
server: 버전 2022.2-14521-1 에서 2023.0.15022-1 로
-
xdcv: 버전 2022.2.519-1 에서 2023.0.547-1 로
-
gl: 버전 2022.2.1012-1 에서 2023.0.1027-1 로
-
web_viewer: 버전 2022.2.14521-1 에서 2023.0.15022-1 로
-
aws-cfn-bootstrap 을 버전 2.0-24 로 업그레이드
-
AWS 배치 클러스터용 컨테이너 이미지를 빌드할 때 CodeBuild 환경에서 사용하는 이미지 업그레이드:
버그 수정:
-
잘못된 오류가 보고되지 않도록 Amazon EFS 및 Amazon FSx 네트워크 보안 그룹 검증기를 수정
-
build-image 작업 중에 Image Builder에서 생성한 리소스의 태깅이 누락되는 문제를 수정합니다.
-
MaxCount 속성에 대해 수치 비교를 항상 수행하도록 MaxCount 에 대한 업데이트 정책 수정
-
여러 네트워크 카드가 있는 컴퓨팅 노드 인스턴스의 IP 정렬을 수정했습니다.
-
대기열 파라미터 업데이트가 수행되고 Slurm 회계 구성이 업데이트되지 않은 slurm_parallelcluster_slurmdbd.conf 경우 StoragePass 에서의 교체를 수정했습니다.
-
기존 EFS 파일 시스템으로 클러스터를 생성할 때 누락된 보안 그룹이 생성되는 문제를 수정했습니다.
-
cfn-hup 대몬(daemon)을 다시 시작할 때 실패하는 문제를 수정했습니다.
-
INVALID_REG 플래그가 있는 동적 노드를 Slurm 보호 모드의 부트스트랩 실패로 간주합니다. Slurm 등록에 실패한 정적 노드는 이미 이후에 부트스트랩 실패로 처리됩니다node_replacement_timeout .
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2023년 5월 22일
|
AWS ParallelCluster 버전 3.5.1 릴리스
|
AWS ParallelCluster 버전 3.5.1 릴리스.
개선 사항:
변경 사항:
버그 수정:
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2023년 3월 29일
|
AWS ParallelCluster 버전 3.5.0 릴리스
|
AWS ParallelCluster 버전 3.5.0 릴리스.
개선 사항:
-
AWS ParallelCluster UI를 사용하여 클러스터에 액세스하고 관리할 수 있습니다.
-
워크로드에서 참조할 수 있는 버전이 지정된 AWS ParallelCluster 정책을 CloudFormation 템플릿에 추가합니다.
-
자체 코드와 함께 사용할 수 있는 AWS ParallelCluster Python 라이브러리를 추가합니다.
-
컴퓨팅 노드 부트스트랩 장애 시 Amazon CloudWatch에 컴퓨팅 노드 콘솔 출력 로깅 추가
-
클러스터 생성 실패 시 describe-cluster 출력에 실패 코드 및 이유가 포함된 실패 필드 추가
-
하위 프로세스 모듈을 호출하는 동안 악의적인 문자열 삽입을 방지하기 위해 유효성 검사기 추가
-
정적 노드를 프로비저닝하는 동안 클러스터 상태가 PROTECTED 로 변경되면 클러스터 생성이 실패합니다.
변경 사항:
-
Slurm 버전으로 업그레이드22.05.8 ( 버전에서22.05.7 )
-
EFA 설치 프로그램을 1.21.0 으로 업그레이드
-
Efa-driver: efa-2.1 에서 efa-2.1.1-1 로
-
Efa-config: efa-config-1.11-1에서 efa-config-1.12-1 로
-
Efa-profile: efa-profile-1.5-1 (변경 없음)
-
Libfabric-aws: libfabric-aws-1.16.1 에서 libfabric-aws-1.16.1amzn3.0-1 로
-
Rdma-core: rdma-core-43.0-2 에서 rdma-core-43.0-1 로
-
Open MPI: openmpi40-aws-4.1.4-3 (변경 없음)
-
Slurm 컨트롤러 로그를 보다 상세하게 만들고 Slurm 절전 플러그인에 대한 추가 로깅을 활성화합니다.
버그 수정:
-
Slurm 회계가 활성화된 경우 클러스터 이름이 40자를 초과하지 않는지 확인하여 클러스터 데이터베이스 생성을 수정합니다.
-
Amazon EC2 인스턴스 상태 확인이 실패할 경우 Slurm을 통해 재부팅된 컴퓨팅 노드가 교체clustermgtd 되는의 문제를 수정했습니다.
-
헤드 노드의 잘못된 IAM 정책으로 인해 다른 계정과 용량 예약을 공유하는 컴퓨팅 노드가 시작되지 않았던 문제를 수정했습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook, aws-parallelcluster-node, aws-parallelcluster-ui 패키지의 CHANGELOG 파일을 참조하세요.
|
2023년 2월 20일
|
AWS ParallelCluster 버전 3.4.1 릴리스
|
AWS ParallelCluster 버전 3.4.1 릴리스.
버그 수정:
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2023년 1월 13일
|
AWS ParallelCluster 버전 3.4.0 릴리스
|
AWS ParallelCluster 버전 3.4.0 릴리스.
개선 사항:
변경 사항:
-
기존 파일 시스템에 대한 Amazon EFS 탑재 대상 생성 제거
-
amazon-efs-utils 를 사용하여 EFS 파일 시스템 탑재 전송 중 암호화 및 IAM 인증 사용자를 사용하여 EFS 파일 시스템을 탑재할 수 있습니다.
-
CentOS7 및 Ubuntu에 stunnel 5.67를 설치하여 EFS 전송 중 암호화 지원
-
EFA 설치 프로그램을 1.18.0 에서 1.20.0 로 업그레이드
-
Efa-driver: efa-1.16.0-1 에서 efa-2.1 로
-
Efa-config: efa-config-1.11-1 (변경 없음)
-
Efa-profile: efa-profile-1.5-1 (변경 없음)
-
Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1 에서 libfabric-aws-1.16.1 로
-
Rdma-core: rdma-core-41.0-2 에서 rdma-core-43.0-2 로
-
Open MPI: openmpi40-aws-4.1.4-2 에서 openmpi40-aws-4.1.4-3 로
-
Slurm을 22.05.5 에서 버전 22.05.7 로 업그레이드
-
Python을 3.9.15 및 3.7.13 에서 3.9.16 및 3.7.16 로 업그레이드
-
Slurm를 사용하면 IDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING 상태의 22.05.7 동적 노드가 비정상으로 간주되지 않습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 12월 22일
|
AWS ParallelCluster 버전 3.3.1 릴리스
|
AWS ParallelCluster 버전 3.3.1 릴리스.
변경 사항:
버그 수정:
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster 패키지 CHANGELOG 파일을 참조하세요.
|
2022년 12월 2일
|
AWS ParallelCluster 설명서 전용 hpc6id 참고 사항
|
AWS ParallelCluster 설명서 전용 업데이트
|
2022년 12월 2일
|
AWS ParallelCluster 버전 3.1.5 릴리스
|
AWS ParallelCluster 버전 3.1.5 릴리스.
개선 사항:
변경 사항:
-
클러스터 업데이트를 위해 AWS ParallelCluster API 스택에서 ParallelClusterUserRole 사용하는 lambda:UntagResource 에 lambda:ListTags 및를 추가합니다.
-
Intel MPI Library를 버전 2021 Update 4에서 버전 2021 Update 6으로 업그레이드했습니다. 자세한 내용은 Intel® MPI Library 2021 Update 6을 참조하세요.
-
NVIDIA 드라이버를 버전 470.103.01에서 버전 470.141.03으로 업그레이드
-
NVIDIA Fabric Manager를 470.103.01에서 버전 470.141.03으로 업그레이드
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 11월 16일
|
AWS ParallelCluster 버전 3.3.0 릴리스
|
AWS ParallelCluster 버전 3.3.0 릴리스.
개선 사항:
변경 사항:
-
SlurmQueues / 네트워킹 / PlacementGroup /의 동작을 변경합니다Enabled . 이제 모든 컴퓨팅 리소스에 대한 단일 관리형 배치 그룹 대신 각 컴퓨팅 리소스에 대해 고유한 관리형 배치 그룹을 생성합니다.
-
SlurmQueues / Networking / PlacementGroup / Name에 대한 지원을 선호하는 이름 지정 방법으로 추가합니다.
-
태그 업데이트 시 헤드 노드 교체를 방지하기 위해 시작 템플릿에서 인스턴스 정의로 헤드 노드 태그로 이동
-
시작 템플릿에서 설정된 CpuOptions 를 통하지 않고 cloud-init 를 통해 실행되는 멀티스레딩 비활성화
-
API 인프라, API Docker 컨테이너 및 클러스터 Lambda 리소스에서 Python을 버전 3.9로, NodeJS를 버전 16으로 업그레이드
-
aws-parallelcluster-batch-cli 에서 Python 3.6에 대한 지원 제거
-
Slurm을 21.08.8-2 에서 버전 22.05.5 로 업그레이드
-
NVIDIA 드라이버를 버전 470.129.06 에서 470.141.03 로 업그레이드
-
NVIDIA Fabric Manager를 470.129.06 에서 버전 470.141.03 로 업그레이드
-
엔비디아 CUDA Toolkit을 버전 11.7.1(from 11.4.4 )로 업그레이드
-
AWS ParallelCluster virtualenvs에 사용되는 Python을에서 3.7.13 로 업그레이드합니다3.9.15 .
-
EFA 설치 프로그램을 버전 1.18.0으로 업그레이드
-
Efa-driver: efa-1.16.0-1 (변경 없음)
-
Efa-config: from
efa-config-1.10-1 에서 efa-config-1.11-1 로
-
Efa-profile: efa-profile-1.5-1 (변경 없음)
-
Libfabric-aws: libfabric-aws-1.16.0~amzn2.0-1 에서 libfabric-aws-1.16.0~amzn4.0-1 로
-
Rdma-core: rdma-core-37.0 에서 rdma-core-41.0-2 로
-
Open MPI: openmpi40-aws-4.1.1-2 에서 openmpi40-aws-4.1.4-2 로
-
NICE DCV를 2022.0-12760 에서 버전 2022.1-13300 로 업그레이드
-
Queues 을 위해 SingleSubnetValidator 금지 활성화
-
에필로그가 아직 실행 중일 수 있으므로 노드가 COMPLETING 상태일 때는 DRAIN 노드 교체 금지
버그 수정:
-
잘못된 필터가 AWS ParallelCluster 전달될 때 ListClusterLogStreams 명령의 필터 파라미터 검증이 실패하도록 수정했습니다.
-
FileSystemId 가 다른 SharedStorage/EfsSettings 파라미터와 함께 지정된 경우 파라미터 SharedStorage/EfsSettings. 이전에는 FileSystemId 이 포함되지 않았습니다.
-
구성의 다른 변경 사항과 함께 SharedStorage의 순서를 변경할 때 클러스터 업데이트를 수정합니다.
-
APIUpdateParallelClusterLambdaRole 에서 CloudWatch에 로그를 업로드 AWS ParallelCluster 하도록 수정했습니다.
-
쿡북을 실행하기 전에 패키지를 설치할 때 Cinc가 로컬 CA 인증서 번들을 사용하지 않는 문제를 수정했습니다.
-
Build:UpdateOsPackages:Enabled:true 가 설정되었을 때 pcluster build-image 로 ubuntu를 업그레이드할 때 멈추는 문제를 수정했습니다.
-
중복 키에 실패를 일으켜 YAML 클러스터 구성의 파싱 수정
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 11월 2일
|
AWS ParallelCluster 설명서 전용 API 참조가 추가되었습니다.
|
AWS ParallelCluster 설명서 전용 업데이트
|
2022년 10월 27일
|
AWS ParallelCluster 버전 3.2.1 릴리스
|
AWS ParallelCluster 버전 3.2.1 릴리스.
개선 사항:
변경 사항:
-
NVIDIA 드라이버를 버전 470.141.03로 업그레이드
-
NVIDIA Fabric Manager를 버전 470.141.03로 업그레이드
-
노드 성능에 부정적인 영향을 줄 수 있는 cron 작업 태스크 man-db 및 mlocate 를 비활성화
-
Intel MPI Library를 2021.6.0.602로 업그레이드
-
이러한 보안 위험에 대응하여 Python을 3.7.10에서 3.7.13으로 업그레이드하세요.
버그 수정:
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 10월 3일
|
AWS ParallelCluster 버전 3.2.0 릴리스
|
AWS ParallelCluster 버전 3.2.0 릴리스.
개선 사항:
변경 사항:
-
EFA 설치 프로그램을 버전 1.17.2로 업그레이드
-
Efa-driver: efa-1.16.0-1
-
EFA 구성: efa-config-1.10-1
-
EFA 프로필: efa-profile-1.5-1
-
Libfabric: libfabric-aws-1.16.0~amzn2.0-1
-
RDMA 코어: rdma-core-41.0-2
-
Open MPI: openmpi40-aws-4.1.4-2
-
NICE DCV를 버전 2022.0-12760으로 업그레이드
-
NVIDIA 드라이버를 버전 470.129.06로 업그레이드
-
NVIDIA Fabric Manager를 버전 470.129.06으로 업그레이드
-
루트 볼륨과 추가 볼륨 모두에서 기본 EBS 볼륨 유형을 gp2에서 gp3으로 변경
-
다음에 의해 생성된 FSx for Lustre 파일 시스템에 대한 변경 사항 AWS ParallelCluster:
-
기본 배포 유형을 Scratch_2 로 변경
-
Lustre 서버 버전을 2.12 로 변경
-
기존 /를 전달할 true 때 PlacementGroup PlacementGroup / Enabled를 로 설정할 필요가 없습니다Id .
-
PlacementGroup /Enabled 가 명시적으로 false 로 설정된 경우 PlacementGroup /Id 설정을 허용하지 않습니다.
-
AWS ParallelCluster에서 만든 모든 리소스에 parallelcluster:cluster-name 태그 추가
-
클러스터 업데이트를 lambda:UntagResource 위해 AWS ParallelCluster API 스택에서 ParallelClusterUserRole 사용하는 lambda:ListTags 및를 추가합니다.
-
구성 파라미터 HeadNode /Imds /Secured 가 활성화된 경우 IPv6 액세스를 IMDS 에서 루트 및 클러스터 관리자로만 제한합니다.
-
사용자 지정 AMI에서는 ParallelCluster 기본값인 35GiB 대신 AMI 루트 볼륨 크기를 사용합니다. 클러스터 구성 파일에서 값을 변경할 수 있습니다.
-
구성 파라미터 Scheduling /SlurmQueues /ComputeResources /SpotPrice 가 필요한 최소 스팟 요청 이행 가격보다 낮으면 컴퓨팅 플릿이 자동으로 비활성화됩니다.
-
업데이트 중에 섹션을 추가하거나 제거할 때 변경 세트의 requested_value 값과 current_value 값을 표시합니다.
-
여러 네트워크 카드로 인스턴스를 구성할 때 configure_nw_interface.sh 와 충돌을 방지하기 위해 딥 러닝 AMI에서 사용할 수 있는 aws-ubuntu-eni-helper 서비스를 비활성화
-
Python 3.6에 대한 지원 제거
-
여러 네트워크 카드로 인스턴스를 구성할 때 모든 네트워크 인터페이스의 MTU를 9001로 설정
-
컴퓨팅 노드 FQDN을 구성할 때 후행 점을 제거
-
POWERING_DOWN 에서 정적 노드를 관리
-
작업이 아직 실행 중일 수 있으므로 POWER_DOWN 의 동적 노드를 교체하지 않습니다.
-
클러스터 구성에서 Scheduling 파라미터가 업데이트된 경우에만 클러스터 업데이트 시간에 clustermgtd 및 slurmctld 대몬(daemon)을 재시작
-
slurmctld 및 slurmd systemd 서비스 파일 업데이트
-
구성 파라미터 HeadNode /Imds /Secured 가 활성화된 경우 IPv6 액세스를 루트 및 클러스터 관리자로만 제한합니다.
-
노드를 사용할 수 없을 때 작업을 다시 시작하기 전에 대기 중인 작업을 기다려야 하는 시간을 줄이기 위해 Slurm 구성을 AuthInfo=cred_expire=70 로 설정
-
서드 파티 쿡북 종속성 업그레이드:
-
apt-7.4.0에서 apt-7.4.2로
-
라인-4.0.1번에서 라인-4.5.2번으로
-
openssh-2.9.1에서 opensh-2.10.3으로
-
pyenv-3.4.2에서 pyenv-3.5.1로
-
selinux-3.1.1에서 selinux-6.0.4로
-
yum-6.1.1에서 yum-7.4.0으로
-
yum-epel-4.1.2에서 yum-epel-4.5.0으로
버그 수정:
-
사용자 지정 AMI를 빌드할 때 AWS ParallelCluster 검증 및 테스트 단계를 건너뛰도록 기본 동작을 수정합니다.
-
computemgtd 의 파일 핸들 누수 문제를 수정했습니다.
-
시작된 인스턴스를 EC2 DescribeInstances 응답에서 아직 사용할 수 없었기 때문에 간헐적으로 시작된 인스턴스가 즉시 종료되는 경합 상태를 수정했습니다.
-
Arm 프로세서의 인스턴스 유형에서 DisableSimultaneousMultithreading 파라미터에 대한 지원을 수정했습니다.
-
이전 버전에서 업그레이드할 때 AWS ParallelCluster API 스택 업데이트 실패를 수정합니다. EcrImageDeletionLambdaRole 의 ListImagePipelineImages 작업에 사용되는 리소스 패턴 추가
-
FSx for Lustre 파일 시스템을 생성할 때 Amazon S3에서 가져오거나 내보내는 데 필요한 누락된 권한을 추가하는 AWS ParallelCluster API를 수정했습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 7월 27일
|
AWS ParallelCluster 올해 현재까지 설명서 전용 업데이트
|
AWS ParallelCluster 설명서 전용 업데이트.
새로운 섹션:
섹션 업데이트:
|
2022년 7월 6일
|
AWS ParallelCluster 버전 3.1.4 릴리스
|
AWS ParallelCluster 버전 3.1.4 릴리스.
개선 사항:
변경 사항:
-
Slurm을 버전 21.08.8-2로 업그레이드
-
JWT를 사용하는 빌드 Slurm 지원
-
기존 /를 전달할 true 때 PlacementGroup PlacementGroup / Enabled를 로 설정할 필요가 없습니다Id .
-
클러스터 생성 및 이미지 생성을 위해 ParallelCluster API 스택이 사용하는 ParallelClusterUserRole 에 lambda:TagResource 추가
버그 수정:
-
--filters 옵션과 함께 export-cluster-logs 명령을 사용할 때 클러스터의 로그를 내보내는 기능을 수정했습니다.
-
/home 공유 디렉터리를 사용하여 Multi-node-Parallel 작업 실행을 조정하도록 AWS 배치 도커 진입점을 수정했습니다.
-
용량 부족으로 실패한 정적 노드를 부트스트랩 실패 노드로 처리하지 않도록 Slurm 비정상 정적 노드를 다운으로 설정할 때 노드 주소를 재설정합니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 5월 16일
|
AWS ParallelCluster 버전 3.1.3 릴리스
|
AWS ParallelCluster 버전 3.1.3 릴리스.
개선 사항:
-
예를 들어 SSH 로그인 중, 다른 사용자로 전환할 때, 다른 사용자로 명령을 실행할 때 홈 디렉터리 생성과 함께 SSH 키 생성을 실행합니다.
-
구성 파라미터 DirectoryService/DomainName에 FQDN 및 LDAP 고유 이름 모두에 대한 지원을 추가합니다. 이제 새 유효성 검사기가 두 구문을 모두 검사합니다.
-
헤드 노드에 배포된 새 update_directory_service_password.sh 스크립트는 SSSD 구성에서 Active Directory 암호의 수동 업데이트를 지원합니다. 암호는 클러스터 구성에서 AWS Secrets Manager에 의해 검색됩니다.
-
기본 VPC가 없는 환경에서 API 인프라를 배포하기 위한 지원 추가
변경 사항:
버그 수정:
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster의 CHANGELOG 파일 및 aws-parallelcluster-cookbook 패키지를 참조하세요.
|
2022년 4월 20일
|
AWS ParallelCluster 버전 3.1.2 릴리스
|
AWS ParallelCluster 버전 3.1.2 릴리스.
변경 사항:
버그 수정:
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster 패키지 CHANGELOG 파일을 참조하세요.
|
2022년 3월 2일
|
AWS ParallelCluster 버전 3.1.1 릴리스
|
AWS ParallelCluster 버전 3.1.1 릴리스.
-
AWS Directory Service를 통해 관리되는 Active Directory(AD) 도메인과 통합하여 여러 사용자 클러스터 환경에 대한 지원을 추가합니다.
-
클러스터 구성 파일에 UseEc2Hostnames에 대한 지원을 추가합니다. true로 설정하면 컴퓨팅 노드에 Amazon EC2 기본 호스트 이름(예: ip-1-2-3-4)을 사용합니다.
-
인터넷에 접속할 수 없는 서브넷에서의 클러스터 생성 지원
-
대기열당 여러 컴퓨팅 인스턴스 유형에 대한 지원 추가
-
NVIDIA 카드가 있는 Slurmon ARM 인스턴스에서 GPU 스케줄링 지원 추가
-
AWS ParallelCluster CLI에 cluster-name (-n ), (-r ), region (image-id -i ) 및 cluster-configuration / image-configuration (-c )에 대한 약어 플래그를 추가합니다.
-
FSx for Lustre AutoImportPolicy 파라미터 NEW_CHANGED_DELETED 옵션에 대한 지원을 추가합니다.
-
컴퓨팅 노드에서 사용하는 EC2 LaunchTemplates 리소스에 parallelcluster:compute-resource-name 태그 추가
-
일부 헤드 노드 및/또는 대기열에 SecurityGroups 파라미터가 지정된 경우 사용자 지정 보안 그룹으로부터의 인바운드 연결을 허용하도록 클러스터 내에 생성된 보안 그룹을 개선
-
ARM용 NVIDIA 드라이버 및 CUDA 라이브러리 설치
변경 사항:
-
Slurm을 20.11.8 에서 버전 21.08.5 로 업그레이드
-
Slurm 플러그인을 21.08 에서 버전 20.11 로 업그레이드
-
NICE DCV를 2021.1-10851 에서 버전 2021.3-11591 로 업그레이드
-
NVIDIA 드라이버를 버전 470.57.02 에서 470.103.01 로 업그레이드
-
NVIDIA 패브릭 매니저를 버전 470.57.02 에서 470.103.01 로 업그레이드
-
CUDA를 버전 11.4.0 에서 11.4.4 로 업그레이드
-
Intel MPI가 버전 2019 업데이트 8에서 버전 2021 Update 4 버전으로 업데이트되었습니다. 자세한 내용은 Intel® MPI Library 2021 Update 4를 참조하세요.
-
PMIx를 버전 3.1.5 에서 3.2.3 로 업그레이드
-
/home/logs/compute 에 장애가 발생한 컴퓨팅 노드의 덤핑 제거 컴퓨팅 노드 로그 파일은 CloudWatch 및 Amazon EC2 콘솔 로그에서 사용할 수 있습니다.
-
SlurmQueues 및 ComputeResources 길이 검사기를 차단할 수 있게 했습니다.
-
Amazon Linux 2에서 인스턴스 시작 시 패키지 업데이트 비활성화
-
AWS ParallelCluster
사용자 지정 이미지를 구축할 때 Amazon EC2 ImageBuilder의 향상된 이미지 메타데이터를 비활성화합니다.
-
cloud-init 데이터 소스를 EC2로 명시적으로 설정합니다. 이를 통해 Ubuntu 및 CentOS 플랫폼의 부팅 시간이 절약됩니다.
-
컴퓨팅 플릿 시작 템플릿 이름에 인스턴스 유형 대신 컴퓨팅 리소스 이름 사용
-
원하지 않는 텍스트가 발생하지 않도록 stderr 및 stdout을 CLI 로그 파일로 리디렉션
-
구성/설치 레시피를 기본 쿡북과 호출되는 별도의 쿡북으로 이동 기존 진입점은 유지되며 이전 버전과 호환됩니다.
-
클러스터 생성 중에 인터넷에 접속하지 않도록 AMI 빌드 중에 인텔 HPC 플랫폼의 종속성을 다운로드
-
Slurm 노드를 구성할 때 컴퓨팅 리소스 이름에서 - 제거 금지
-
NVIDIA 드라이버가 설치되지 않은 경우 Slurm에서 GPU 구성 금지
-
BatchUserRole 에서 ecs:ListContainerInstances 권한 수정
-
이전에 None 접두사로 내보낸 접두사가 지정되지 않은 경우 클러스터 로그 내보내기를 수정
-
클러스터 업데이트 실패 시 롤백이 수행되지 않는 문제를 수정
-
BatchUserRole 에서 ecs:ListContainerInstances 권한 수정
-
지원되지 않는 KmsKeyId 항목이 지정된 경우 오류를 발생시켜 HeadNode 에 대한 RootVolume 스키마를 수정
-
Amazon FSx 누락된 지표가 CloudWatch 대시보드에 표시되도록 수정
-
EfaSecurityGroupValidator 수정 이전에는 사용자 지정 보안 그룹이 제공되고 EFA가 활성화된 경우 잘못된 오류가 발생할 가능성이 있었습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2022년 2월 10일
|
AWS ParallelCluster 버전 3.0.3 릴리스
|
AWS ParallelCluster 버전 3.0.3 릴리스.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster의 CHANGELOG 파일 및 aws-parallelcluster-cookbook 패키지를 참조하세요.
|
2022년 1월 17일
|
AWS ParallelCluster 버전 3.0.2 릴리스
|
AWS ParallelCluster 버전 3.0.2 릴리스.
Elastic Fabric Adapter 설치 프로그램을 1.14.1로 업그레이드
-
EFA 구성: efa-config-1.9 에서 efa-config-1.9-1 로
-
EFA 프로필: efa-profile-1.5 에서 efa-profile-1.5-1 로
-
EFA 커널 모듈: efa-1.13.0 에서 efa-1.14.2 로
-
RDMA 코어: rdma-core-35 에서 rdma-core-37.0 로
-
Libfabric: libfabric-1.13.0 에서 libfabric-1.13.2 로
-
Open MPI: openmpi40-aws-4.1.1-2 (변경 없음)
인스턴스 유형에서 지원하는 경우 GPUDirect RDMA는 항상 활성화됩니다. GdrSupport 구성 옵션은 효과가 없습니다.
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2021년 11월 5일
|
AWS ParallelCluster 버전 3.0.1 릴리스
|
AWS ParallelCluster 버전 3.0.1 릴리스.
클러스터 구성 마이그레이션 도구
헤드 노드를 중지할 수 있습니다.
~/.aws/config 파일에서 읽은 기본 AWS 리전
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2021년 10월 27일
|
AWS ParallelCluster 버전 3.0.0 릴리스
|
AWS ParallelCluster 버전 3.0.0 릴리스.
Amazon API Gateway를 통한 클러스터 관리 지원
-
이제 고객은 Amazon API Gateway를 사용하여 HTTP 엔드포인트를 통해 클러스터를 관리하고 배포할 수 있습니다. 이를 통해 스크립트 기반 또는 이벤트 기반 워크플로의 새로운 가능성이 열립니다.
AWS ParallelCluster 명령줄 인터페이스(CLI)도이 API와의 호환성을 위해 재설계되었으며 새 JSON 출력 옵션이 포함되어 있습니다. 이 새로운 기능을 통해 고객은 CLI를 사용하여 유사한 빌딩 블록 기능을 구현할 수도 있습니다.
사용자 지정 AMI 생성 개선
변경 사항에 대한 자세한 내용은 GitHub의 aws-parallelcluster, aws-parallelcluster-cookbook 및 aws-parallelcluster-node 패키지의 CHANGELOG 파일을 참조하세요.
|
2021년 9월 10일
|