기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스
다음 릴리스 정보는 Amazon EKS 오케스트레이션을 위한 Amazon SageMaker HyperPod AMI 릴리스의 최신 업데이트를 추적합니다. 각 릴리스 정보에는 Amazon EKS용 SageMaker HyperPod DLAMI 지원에 사전 설치되거나 사전 구성된 패키지의 요약 목록이 나와 있습니다. 각 DLAMI는 AL2023을 기반으로 하며 특정 Kubernetes 버전을 지원합니다. Slurm 오케스트레이션을 위한 HyperPod DLAMI 릴리스는 Slurm용 SageMaker HyperPod AMI 릴리스 섹션을 참조하세요. Amazon SageMaker HyperPod 기능 릴리스에 대한 자세한 내용은 Amazon SageMaker HyperPod 릴리스 정보 섹션을 참조하세요.
Amazon EKS용 SageMaker Hyperpod AMI 릴리스: 2025년 11월 22일
AMI 일반 업데이트
-
Amazon EKS 버전 1.28, 1.29, 1.30, 1.31, 1.32, 1.33용 SageMaker Hyperpod AMI에 대한 업데이트를 릴리스했습니다.
-
기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.
Amazon EKS용 SageMaker Hyperpod DLAMI 지원
다음은 이 릴리스의 업데이트 사항입니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 11월 7일
AMI 일반 업데이트
-
Amazon EKS 버전 1.28, 1.29, 1.30, 1.31, 1.32 및 1.33용 SageMaker HyperPod AMI에 대한 업데이트를 릴리스했습니다.
-
기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.
Amazon EKS용 SageMaker HyperPod DLAMI 지원
다음은 이 릴리스의 업데이트 사항입니다.
참고
runc 버전이 1.3.2 보안 게시판
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 10월 29일
AMI 일반 업데이트
-
Amazon EKS 버전 1.28, 1.29, 1.30, 1.31, 1.32 및 1.33용 SageMaker HyperPod AMI에 대한 업데이트를 릴리스했습니다.
-
기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.
Amazon EKS용 SageMaker HyperPod DLAMI 지원
다음은 이 릴리스의 업데이트 사항입니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 10월 22일
AL2x86
참고
Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.
기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.
-
EKS 버전 1.28 - 1.32
-
이 릴리스에는 Nvidia 10월 보안 공지
에 있는 영향을 받는 NVIDIA 드라이버 패키지에 대한 CVE 패치가 포함되어 있습니다. -
NVIDIA SMI
NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8 -
메이저 버전
패키지 이름 버전 Framework_버전 70 gdr_copy 2.4.1 supported_ec2_instances G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en efa_version 1.43.3 ebs_volume_type gp3 nvidia_driver 570.195.03 python_location /usr/bin/python3.10 nvidia_cuda_stack /usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda-12.4 ssm_agent_version 3.3.3050.0 커널_버전 5.10.244-240.965.amzn2.x86_64 nvidia_container_toolkit_version 1.17.8 ofi_nccl_버전 1.16.3 운영 체제 Amazon Linux 2 default_cuda /usr/local/cuda-12.1/ 컴퓨팅_아키텍처 x86_64 -
패키지 추가됨:이 릴리스에는 패키지가 추가되지 않았습니다.
-
업데이트된 패키지
패키지 이름 이전 버전 새 버전 boto3 1.40.46 1.40.49 botocore 1.40.46 1.40.49 fastapi 0.118.0 0.118.2 파일 잠금 3.19.1 3.20.0 importlib_metadata 8.7.0 8.0.0 jaraco.context 6.0.1 5.3.0 jaraco.functools 4.3.0 4.0.1 matplotlib 3.10.6 3.10.7 패키징 25 24.2 platformdirs 4.4.0 4.5.0 propcache 0.4.0 0.4.1 리치 14.1.0 14.2.0 tomli 2.2.1 2.3.0 types-python-dateutil 2.9.0.20250822 2.9.0.20251008 virtualenv 20.34.0 20.35.1 websocket-클라이언트 1.8.0 1.9.0 -
패키지 제거됨:이 릴리스에서는 패키지가 제거되지 않았습니다.
AL2023x86
기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.
-
EKS 버전 1.28 - 1.32. EKS 버전 1.33에는 릴리스가 없습니다.
-
이 릴리스에는 Nvidia 10월 보안 공지
에 있는 영향을 받는 NVIDIA 드라이버 패키지에 대한 CVE 패치가 포함되어 있습니다. -
NVIDIA SMI
NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0 -
메이저 버전
패키지 이름 버전 gdr_copy 2.5.1 supported_ec2_instances G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200 efa_version 1.43.3 ebs_volume_type gp3 nvidia_gds_version 1.15.0.42 nvidia_driver 580.95.05 python_location /usr/bin/python3.9 nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13.0 ssm_agent_version 3.3.3050.0 커널_버전 6.1.153-175.280.amzn2023.x86_64 nvidia_container_toolkit_version 1.17.8 dcgm_version 4.4.1 ofi_nccl_버전 1.16.3 운영 체제 Amazon Linux 2023.9.20250929 default_cuda /usr/local/cuda-12.9/ 컴퓨팅_아키텍처 x86_64 -
패키지 추가됨:이 릴리스에는 패키지가 추가되지 않았습니다.
-
업데이트된 패키지
패키지 이름 이전 버전 새 버전 boto3 1.40.46 1.40.49 botocore 1.40.46 1.40.49 fastapi 0.118.0 0.118.2 gdrcopy 2.5-1 2.5.1-1 gdrcopy-devel 2.5-1 2.5.1-1 gdrcopy-kmod 2.5~1dkm 2.5.1~1dkm jaraco.context 6.0.1 5.3.0 jaraco.functools 4.3.0 4.0.1 more-itertools 10.8.0 10.3.0 패키징 25 24.2 propcache 0.4.0 0.4.1 pydantic 2.11.10 2.12.0 pydantic_core 2.33.2 2.41.1 리치 14.1.0 14.2.0 types-python-dateutil 2.9.0.20250822 2.9.0.20251008 typing_extensions 4.12.2 4.15.0 virtualenv 20.34.0 20.35.1 websocket-클라이언트 1.8.0 1.9.0 -
패키지 제거됨:이 릴리스에서는 패키지가 제거되지 않았습니다.
AL2023 ARM64
기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.
-
EKS 버전 1.31 - 1.33.
-
이 릴리스에는 Nvidia 10월 보안 공지
에 있는 영향을 받는 NVIDIA 드라이버 패키지에 대한 CVE 패치가 포함되어 있습니다. -
NVIDIA SMI
NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0 -
메이저 버전
패키지 이름 버전 gdr_copy 2.5 supported_ec2_instances G5g, P6e-GB200 efa_version 1.43.3 ebs_volume_type gp3 nvidia_driver 580.95.05 python_location /usr/bin/python3.9 nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13.0 ssm_agent_version 3.3.3050.0 커널_버전 6.12.46-66.121.amzn2023.aarch64 nvidia_container_toolkit_version 1.17.8 dcgm_version 4.4.1 ofi_nccl_버전 1.16.3 운영 체제 Amazon Linux 2023.9.20250929 default_cuda /usr/local/cuda-12.9/ 컴퓨팅_아키텍처 aarch64 -
패키지 추가됨:이 릴리스에는 패키지가 추가되지 않았습니다.
-
업데이트된 패키지
패키지 이름 이전 버전 새 버전 aiohttp 3.12.15 3.13.0 attrs 25.3.0 25.4.0 boto3 1.40.45 1.40.49 botocore 1.40.45 1.40.49 cattrs 25.2.0 25.3.0 certifi 2025.8.3 2025.10.5 efa 2.17.2-1.amzn2023 2.17.3-1.amzn2023 fastapi 0.118.0 0.118.2 동결 목록 1.7.0 1.8.0 importlib_metadata 8.7.0 8.0.0 jaraco.context 5.3.0 6.0.1 멀티텍스트 6.6.4 6.7.0 narwhals 2.6.0 2.7.0 nh3 0.3.0 0.3.1 propcache 0.3.2 0.4.1 pydantic 2.11.9 2.12.0 pydantic_core 2.33.2 2.41.1 스타일린트 3.3.8 3.3.9 python-json-logger 3.3.0 4.0.0 리치 14.1.0 14.2.0 tomli 2.2.1 2.0.1 types-python-dateutil 2.9.0.20250822 2.9.0.20251008 virtualenv 20.34.0 20.35.1 websocket-클라이언트 1.8.0 1.9.0 yarl 1.20.1 1.22.0 zipp 3.19.2 3.23.0 -
패키지 제거됨:이 릴리스에서는 패키지가 제거되지 않았습니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 9월 29일
AMI 일반 업데이트
-
Amazon EKS 1.33용 새 SageMaker HyperPod AMI를 릴리스했습니다. 자세한 내용은 Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 9월 29일을 참조하세요.
중요
동적 리소스 할당 베타 Kubernetes API는이 릴리스에서 기본적으로 활성화됩니다.
-
이 API는 GPUs.
-
이 API는 오픈 소스 Kubernetes 커뮤니티에서 개발되었으며 Kubernetes의 향후 버전에서 변경될 수 있습니다. API를 사용하기 전에 Kubernetes 설명서를
검토하고 워크로드에 미치는 영향을 이해합니다.
-
-
HyperPod는 AL2023으로 마이그레이션하는 Kubernetes 1.33.AWSrecommds용 HyperPod Amazon Linux 2 AMI를 릴리스하지 않습니다. 자세한 내용은 Amazon Linux 2에서 AL2023으로 업그레이드를 참조하세요.
자세한 내용은 Kubernetes v1.33
Amazon EKS용 SageMaker HyperPod DLAMI 지원
다음은 이 릴리스의 업데이트 사항입니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 8월 25일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
다음은 이 릴리스의 업데이트 사항입니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 8월 12일
AMI에는 다음이 포함됩니다.
-
지원되는 AWS서비스: Amazon EC2
-
운영 체제: Amazon Linux 2023
-
컴퓨팅 아키텍처: ARM64
-
다음 패키지에 사용할 수 있는 최신 버전이 설치됩니다.
-
Linux 커널: 6.12
-
FSx Lustre
-
Docker
-
AWS CLI의 v2
/usr/bin/aws -
NVIDIA DCGM
-
Nvidia 컨테이너 툴킷:
-
버전 명령:
nvidia-container-cli -V
-
-
Nvidia-docker2:
-
버전 명령:
nvidia-docker version
-
-
Nvidia-IMEX: v570.172.08-1
-
-
NVIDIA 드라이버: 570.158.01
-
NVIDIA CUDA 12.4, 12.5, 12.6, 12.8 스택:
-
CUDA, NCCL 및 cuDDN 설치 디렉터리:
/usr/local/cuda-xx.x/-
예:
/usr/local/cuda-12.8/,/usr/local/cuda-12.8/
-
-
컴파일된 NCCL 버전:
-
12.4의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.22.3+CUDA12.4
-
12.5의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.22.3+CUDA12.5
-
12.6의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.24.3+CUDA12.6
-
12.8의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.27.5+CUDA12.8
-
-
기본 CUDA: 12.8
-
PATH는 CUDA 12.8을
/usr/local/cuda가리킵니다. -
아래 env vars가 업데이트되었습니다.
-
LD_LIBRARY_PATH를 사용하려면/usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64 -
PATH를 사용하려면/usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/ -
다른 CUDA 버전의 경우
LD_LIBRARY_PATH그에 따라 업데이트하세요.
-
-
-
-
EFA 설치 관리자: 1.42.0
-
Nvidia GDRCopy: 2.5.1
-
AWSOFI NCCL 플러그인은 EFA 설치 프로그램과 함께 제공됩니다.
-
/opt/amazon/ofi-nccl/lib및 경로/opt/amazon/ofi-nccl/efa가에 추가됩니다LD_LIBRARY_PATH.
-
-
AWS CLI의 v2
/usr/local/bin/aws -
EBS 볼륨 유형: gp3
-
Python:
/usr/bin/python3.9
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 8월 6일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음 업데이트가 포함됩니다.
중요
-
Deep Learning Base OSS Nvidia Driver AMI(Amazon Linux 2) 버전 70.3
-
Deep Learning Base Proprietary Nvidia Driver AMI(Amazon Linux 2) 버전 68.4
-
최신 CUDA 12.8 지원
-
Nvidia의 7월 Security Bulletin에 있는 CVE를 수정하기 위해 Nvidia 드라이버를 570.158.01에서 570.172.08로 업그레이드했습니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 7월 31일
Amazon SageMaker HyperPod는 이제 기본 운영 체제를 Amazon Linux 2023으로 업데이트하는 Amazon EKS 클러스터용 새 AMI를 지원합니다. 이 릴리스는 Amazon Linux 2(AL2)의 몇 가지 개선 사항을 제공합니다. HyperPod는 새 AMI를 정기적으로 릴리스하므로 취약성을 해결하고 오래된 소프트웨어 및 라이브러리를 단계적으로 만료하기 위해 가장 안전한 최신 버전의 AMI에서 모든 HyperPod 클러스터를 실행하는 것이 좋습니다.
주요 업그레이드
-
운영 체제: Amazon Linux 2023(Amazon Linux 2, 즉 AL2에서 업데이트됨)
-
패키지 관리자: DNF는 AL2에 사용된 YUM을 대체하는 기본 패키지 관리 도구임
-
네트워킹 서비스:
systemd-networkd가 AL2에서 사용된 ISCdhclient를 대체하여 네트워크 인터페이스를 관리함 -
Linux 커널: 버전 6.1(AL2에 사용된 커널에서 업데이트됨)
-
Glibc: 버전 2.34(AL2의 버전에서 업데이트됨)
-
GCC: 버전 11.5.0(AL2의 버전에서 업데이트됨)
-
NFS: 버전 1:2.6.1(AL2의 버전 1:1.3.4에서 업데이트됨)
-
NVIDIA 드라이버: 버전 570.172.08(최신 드라이버 버전)
-
Python: 버전 3.9(AL2에서 사용된 Python 2.7 대체)
-
NVME: 버전 1.11.1(NVMe 드라이버의 최신 버전)
업그레이드 전에
업그레이드하기 전에 알아야 할 몇 가지 중요한 사항이 있습니다. AL2023은 AL2와 비교하여 여러 패키지가 추가, 업그레이드 또는 제거되었습니다. 클러스터를 업그레이드하기 전에 AL2023으로 애플리케이션을 테스트하는 것이 좋습니다. AL2023 패키지의 모든 변경 사항 목록은 Package changes in Amazon Linux 2023를 참조하세요.
다음은 AL2와 AL2023 간의 몇 가지 중요한 변경 사항입니다.
-
Python 3.10: 운영 체제 외에 가장 중요한 업데이트는 Python 버전 업그레이드입니다. 업그레이드 후 클러스터의 기본값은 Python 3.10입니다. 일부 Python 3.8 분산 훈련 워크로드는 Python 3.10과 호환될 수 있지만 특정 워크로드를 별도로 테스트하는 것이 좋습니다. Python 3.10으로 마이그레이션하는 것이 어렵지만 다른 새로운 기능을 위해 클러스터를 업그레이드하려는 경우 워크로드를 실행하기 전에 수명 주기 스크립트와
yum install python-xx.x함께 명령을 사용하여 이전 Python 버전을 설치할 수 있습니다. 호환성을 위해 기존 수명 주기 스크립트와 애플리케이션 코드를 모두 테스트해야 합니다. -
NVIDIA 런타임 적용: AL2023은 NVIDIA 컨테이너 런타임 요구 사항을 엄격하게 적용하여 하드 코딩된 NVIDIA 환경 변수(예:
NVIDIA_VISIBLE_DEVICES: "all")가 있는 컨테이너가 CPU 전용 노드에서 실패하도록 합니다(AL2는 GPU 드라이버가 없는 경우 이러한 설정을 무시함). 포드 사양에서NVIDIA_VISIBLE_DEVICES: "void"를 설정하거나 CPU 전용 이미지를 사용하여 적용을 재정의할 수 있습니다. -
cgroup v2: AL2023에는 차세대 통합 제어 그룹 계층 구조(cgroup v2)가 있습니다. cgroup v2는 컨테이너 런타임에 사용되며
systemd에서도 사용됩니다. AL2023에 시스템이 cgroup v1을 사용하여 실행하도록 할 수 있는 코드가 여전히 포함되어 있지만 이 구성은 권장되지 않습니다. -
Amazon VPC CNI 및
eksctl버전: AL2023에서는 Amazon VPC CNI 버전이 1.16.2 이상이고eksctl버전이 0.176.0 이상이어야 합니다. -
FSx for Lustre의 EFA: 이제 FSx for Lustre에서 EFA를 사용할 수 있습니다. 이를 통해 클라우드 컴퓨팅의 확장성, 유연성 및 탄력성을 활용하면서 온프레미스 AI/ML 또는 고성능 컴퓨팅(HPC) 클러스터와 비슷한 애플리케이션 성능을 달성할 수 있습니다.
또한 AL2023으로 업그레이드하려면 최소 1.0.643.0_1.0.192.0 버전의 상태 모니터링 에이전트가 필요합니다. 상태 모니터링 에이전트를 업데이트하려면 다음 절차를 완료하세요.
-
GitHub 리포지토리 awsome-distributed-training
에서 HyperPod 수명 주기 스크립트를 사용하는 경우 최신 버전을 가져와야 합니다. 이전 버전은 AL2023과 호환되지 않습니다. 새로운 수명 주기 스크립트는 containerd가 추가 탑재 스토리지를 사용하여 AL2023에서 컨테이너 이미지를 가져올 수 있도록 합니다. -
HyperPod CLI git 리포지토리
의 최신 버전을 가져옵니다. -
helm dependencies update helm_chart/HyperPodHelmChart명령을 사용하여 종속성을 업데이트합니다. -
HyperPodHelmChart의 README
의 4단계에서 언급한 대로 helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system명령을 실행하여 클러스터에서 실행되는 종속성 버전을 업그레이드합니다.
업그레이드된 EKS 클러스터에서 테스트된 워크로드
다음은 업그레이드를 테스트한 몇 가지 사용 사례입니다.
-
이전 버전과의 호환성: PyTorch와 관련된 인기 있는 분산 훈련 작업은 새 AMI에서 이전 버전과 호환됩니다. 그러나 워크로드가 특정 Python 또는 Linux 라이브러리에 의존할 수 있으므로 더 큰 클러스터를 업그레이드하기 전에 먼저 더 작은 규모의 노드 또는 하위 집합으로 테스트하는 것이 좋습니다.
-
액셀러레이터 테스트: NVIDIA 액셀러레이터(P 및 G 인스턴스 패밀리용)와 AWSNeuron 액셀러레이터(Trn 인스턴스용)를 모두 활용하는 다양한 인스턴스 유형의 작업이 테스트되었습니다.
AMI 및 관련 워크로드를 업그레이드하는 방법
다음 방법 중 하나를 사용하여 새로운 AMI로 업그레이드할 수 있습니다.
-
create-cluster API를 사용하여 최신 AMI로 새 클러스터를 생성합니다.
-
update-cluster-software API를 사용하여 기존 클러스터를 업그레이드합니다. 이 옵션은 모든 수명 주기 스크립트를 다시 실행합니다.
업데이트 프로세스 중에는 클러스터를 사용할 수 없습니다. 업그레이드가 완료된 후 이 가동 중지 시간을 계획하고 기존 체크포인트에서 훈련 워크로드를 다시 시작하는 것이 좋습니다. 모범 사례는 더 큰 클러스터를 업그레이드하기 전에 더 작은 클러스터에서 테스트를 수행하는 것입니다.
업데이트 명령이 실패하면 먼저 실패 원인을 식별합니다. 수명 주기 스크립트 실패의 경우 스크립트를 필요한 대로 수정하고 다시 시도합니다. 해결할 수 없는 다른 문제는 AWS Support
문제 해결
다음 섹션을 사용하면 AL2023으로 업그레이드할 때 발생하는 문제를 해결하는 데 도움이 됩니다.
CPU 전용 클러스터 노드의 "nvml error: driver
not loaded: unknown"과 같은 오류를 해결하려면 어떻게 해야 하나요?
CPU AL2 Amazon EKS 노드에서 작동한 컨테이너가 이제 AL2023에서 실패하는 경우 컨테이너 이미지에 하드 코딩된 NVIDIA 환경 변수가 있을 수 있습니다. 다음 명령을 사용하여 하드 코딩된 환경 변수를 확인할 수 있습니다.
docker inspect image:tag | grep -i nvidia
AL2023은 이러한 요구 사항을 엄격하게 적용하는 반면 AL2는 CPU 전용 노드에서 더 관대했습니다. 한 가지 해결 방법은 다음 예시와 같이 Amazon EKS 포드 사양에서 특정 NVIDIA 환경 변수를 설정하여 AL2023 적용을 재정의하는 것입니다.
yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""
또 다른 대안은 CPU 전용 컨테이너 이미지(예: pytorch/pytorch:latest-cpu)를 사용하거나 NVIDIA 종속성 없이 사용자 지정 이미지를 구축하는 것입니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 7월 15일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음 업데이트가 포함됩니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 6월 9일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 5월 22일
AMI 일반 업데이트
Amazon EKS용 SageMaker HyperPod DLAMI 지원
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 5월 7일
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 4월 28일
K8s 개선 사항
-
NVIDIA 드라이버를 버전 550.144.03에서 버전 550.163.01로 업그레이드했습니다. 이 업그레이드는 2025년 4월 NVIDIA GPU Display Security Bulletin
에 있는 일반적인 취약성 및 노출(CVE)을 해결하기 위한 것입니다.
Amazon EKS용 SageMaker HyperPod DLAMI 지원
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 4월 18일
AMI 일반 업데이트
-
Amazon EKS 1.32.1용 새로운 SageMaker HyperPod AMI
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음이 포함됩니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 2월 18일
K8s 개선 사항
-
Nvidia 컨테이너 도구 키트를 버전 1.17.3에서 버전 1.17.4로 업그레이드했습니다.
-
재부팅 후 고객이 노드에 연결할 수 없는 문제를 수정했습니다.
-
Elastic Fabric Adapter(EFA) 버전을 1.37.0에서 1.38.0으로 업그레이드했습니다.
-
이제 EFA에 원본
/opt/aws-ofi-nccl/경로 대신/opt/amazon/ofi-nccl디렉터리에 있는 AWSOFI NCCL 플러그인이 포함됩니다.LD_LIBRARY_PATH환경 변수를 업데이트해야 하는 경우 OFI NCCL 플러그인의 새/opt/amazon/ofi-nccl위치를 가리키도록 경로를 수정해야 합니다. -
이러한 DLAMI에서 emacs 패키지를 제거했습니다. GNU emac에서 emacs을 설치할 수 있습니다.
Amazon EKS용 SageMaker HyperPod DLAMI 지원
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 1월 22일
AMI 일반 업데이트
-
Amazon EKS 1.31.2용 새로운 SageMaker HyperPod AMI
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음이 포함됩니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 12월 21일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음이 포함됩니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 12월 13일
Amazon EKS용 SageMaker HyperPod DLAMI 업그레이드
-
SSM Agent를 버전
3.3.1311.0으로 업데이트했습니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 11월 24일
AMI 일반 업데이트
-
MEL(멜버른) 리전에서 릴리스했습니다. -
SageMaker HyperPod 기본 DLAMI를 다음 버전으로 업데이트했습니다.
-
Kubernetes: 2024-11-01
-
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 11월 15일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음이 포함됩니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 11월 11일
AMI 일반 업데이트
-
Amazon EKS 버전 1.28.13, 1.29.8, 1.30.4로 SageMaker HyperPod DLAMI를 업데이트했습니다.
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 10월 21일
AMI 일반 업데이트
-
SageMaker HyperPod 기본 DLAMI를 다음 버전으로 업데이트했습니다.
-
Amazon EKS: 1.28.11, 1.29.6, 1.30.2
-
Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 9월 10일
Amazon EKS용 SageMaker HyperPod DLAMI 지원
AMI에는 다음이 포함됩니다.