기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS Deep Learning AMI GPU TensorFlow 2.16(Amazon Linux 2)
시작하는 데 도움이 필요하면 섹션을 참조하세요DLAMI 시작하기.
AMI 이름 형식
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) ${YYYY-MM-DD}
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) ${YYYY-MM-DD}
지원되는 EC2 인스턴스
DLAMI에 대한 중요 변경 사항을 참조하세요.
OSS Nvidia 드라이버를 사용한 딥 러닝은 G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en을 지원합니다.
독점 Nvidia 드라이버를 사용한 딥 러닝에서 G3(G3.16x 지원되지 않음), P3, P3dn 지원
AMI에는 다음이 포함됩니다.
지원되는 AWS 서비스: EC2
운영 체제: Amazon Linux 2
컴퓨팅 아키텍처: x86
Python: /opt/tensorflow/bin/python3.10
TensorFlow 버전: 2.16
NVIDIA 드라이버:
OSS Nvidia 드라이버: 550.144.03
독점 Nvidia 드라이버: 550.144.03
NVIDIA CUDA12 스택:
CUDA, NCCL 및 cuDDN 설치 경로: /usr/local/cuda-12.2/
EFA 설치 관리자: 1.34.0
AWS CLI v2를 aws2로, AWS CLI v1을 aws로
EBS 볼륨 유형: gp3
SSM 파라미터를 사용하여 AMI-ID 쿼리(예제 리전은 us-east-1)
OSS Nvidia 드라이버:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text독점 Nvidia 드라이버:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
AWSCLI를 사용하여 AMI-ID 쿼리(예제 리전은 us-east-1)
OSS Nvidia 드라이버:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text독점 Nvidia 드라이버:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
알림
NVIDIA 컨테이너 툴킷 1.17.4
Container Toolkit 버전 1.17.4에서는 이제 CUDA compat 라이브러리 탑재가 비활성화되었습니다. 컨테이너 워크플로에서 여러 CUDA 버전과의 호환성을 보장하려면 여기 - https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat 'CUDA 호환성 계층을 사용하는 경우' 자습서에 나와 있는 대로 CUDA 호환성 라이브러리를 포함하도록 LD_LIBRARY_PATH를 업데이트해야 합니다.
향후 TensorFlow 운영 체제 업데이트
TensorFlow 2.16은 Ubuntu 20.04 운영 체제를 활용하는 마지막 DLAMI입니다. TensorFlow 2.17 이상부터 DLAMIs Ubuntu 22.04를 기본 운영 체제로 사용하기 시작합니다. 이러한 새 버전으로 업그레이드하려는 고객의 경우 워크플로가이 업그레이드할 준비가 되었는지 확인하세요.
Keras 버전이 3.0 대신 2.0으로 고정됨
최신 TF2.16 릴리스에서는 Keras가 메이저 버전 2에서 메이저 버전 3.0으로 업그레이드되었습니다. 이 Keras 버전은 Keras 패키지를 완전히 재작성한 것입니다(자세한 내용은 Keras 3 설명서
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS
릴리스 날짜: 2025-02-17
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20250215
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20250215
Updated
NVIDIA Container Toolkit을 버전 1.17.3에서 버전 1.17.4로 업데이트했습니다.
자세한 내용은 https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
릴리스 정보 페이지를 참조하세요. Container Toolkit 버전 1.17.4에서는 이제 CUDA compat 라이브러리 탑재가 비활성화되었습니다. 컨테이너 워크플로에서 여러 CUDA 버전과의 호환성을 보장하려면 여기 - https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat 'CUDA 호환성 계층을 사용하는 경우' 자습서에 나와 있는 대로 CUDA 호환성 라이브러리를 포함하도록 LD_LIBRARY_PATH를 업데이트해야 합니다.
제거됨
2025년 2월 18일
NVIDIA CUDA 도구 키트 보안 공지에 있는 CVE를 해결하기 위해 NVIDIA CUDA 도구 키트 에서 제공하는 사용자 공간 라이브러리 cuobj 및 nvdisasm 제거
릴리스 날짜: 2025-01-20
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20250120
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20250118
Updated
2025년 1월 NVIDIA GPU 디스플레이 드라이버 보안 공지에 있는 CVE를 해결하기 위해 Nvidia 드라이버를 버전 550.127.05에서 550.144.03로 업그레이드했습니다. https://nvidia.custhelp.com/app/answers/detail/a_id/5614
릴리스 날짜: 2024-10-23
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20241022
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20241023
Updated
2024년 550.90.070월 NVIDIA GPU 디스플레이 보안 공지에 있는 CVE를 해결하기 위해 Nvidia 드라이버를 버전에서 550.127.05로 업그레이드했습니다. https://nvidia.custhelp.com/app/answers/detail/a_id/5586
릴리스 날짜: 2024-09-28
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240928
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240928
Updated
보안 취약성 CVE-2024-0133
을 해결하여 Nvidia 컨테이너 툴킷을 버전 1.16.1에서 1.16.2로 업그레이드했습니다.
릴리스 날짜: 2024-09-21
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240921
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240921
Updated
버전 535.183.01에서 550.90.07로 Nvidia 드라이버 및 Fabric Manager 업그레이드
EFA 버전을 1.32.0에서 1.34.0으로 업그레이드
PyTorch 버전을 버전 2.3.0에서 2.3.1로 업데이트했습니다.
추가됨
OSS Nvidia 드라이버 이미지의 P5e EC2 인스턴스에 대한 지원이 추가되었습니다.
릴리스 날짜: 2024-08-19
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240817
추가됨
G6e EC2 인스턴스
에 대한 지원이 추가되었습니다.
버전 2.16.2 - 릴리스 날짜: 2024-07-26
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240725
Updated
TensorFlow 패치 버전을 버전 2.16.1에서 2.16.2로 업데이트했습니다.
2024-07-17에 릴리스된 DLAMI의 잘못된 TensorFlow 마이너 버전 해결
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240717 릴리스에는 2.16이 아닌 TensorFlow 마이너 버전 2.17이 실수로 포함되어 있습니다. TensorFlow 2.16에 의존하는 워크플로가 최신 DLAMI로 업그레이드되고 있는지 확인하세요.
버전 2.16.1 - 릴리스 날짜: 2024-06-10
AMI 이름:
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240607
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240610
Updated
Nvidia 드라이버 버전을 535.183.01에서 535.161.08로 업데이트했습니다.
릴리스 날짜: 2024-05-10
DLAMI에 대한 중요 변경 사항을 참조하세요.
AMI 이름:
Deep Learning 독점 Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240510
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 20240510
추가됨
의 최초 릴리스:
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16(Amazon Linux 2) 시리즈.
Deep Learning OSS Nvidia 드라이버 AMI GPU TensorFlow 2.16(Amazon Linux 2) 시리즈.
소프트웨어에는 다음이 포함됩니다.
"nvidia-driver=535.161.08"
"fabric-manager=535.161.08"
"cuda=12.3"
"cudnn=8.9.7"
"efa=1.32.0"
"nccl=2.21.5"
"aws-nccl-ofi-plugin=v1.9.1-aws"
tensorflow 가상 환경(활성화 명령 소스 /opt/tensorflow/bin/activate)이 추가되었습니다. 이 환경에는 다음이 포함됩니다.
"tensorflow=2.16.1"
참고
TF2.16부터 tf.estimator API가 제거됩니다.
tf.estimator를 계속 사용하려면 TF 2.15 또는 이전 버전을 사용해야 합니다. 자세한 내용은 TensorFlow 2.16.1 릴리스 정보를
참조하세요.
고객 워크플로와의 호환성을 보장하기 위해 환경 변수 TF_USE_LEGACY_KERAS=1을 사용하여 Keras 버전을 2.0에 고정했습니다. 워크플로에서 Keras 3.0을 사용해야 하는 경우 다음 스크립트를 사용하여 TensorFlow 가상 환경 /opt/tensorflow에서이 환경 변수를 제거하십시오.
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS