本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
深度學習 AMI GPU TensorFlow 2.17 (Ubuntu 22.04)
如需入門說明,請參閱 DLAMI 入門。
AMI 名稱格式
深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.17 (Ubuntu 22.04) ${YYYY-MM-DD}
支援的 EC2 執行個體
使用 OSS Nvidia Driver 的深度學習支援 G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e。P5en。
AMI 包含下列項目:
支援服務 AWS :Amazon EC2
作業系統:Ubuntu 22.04
運算架構:x86
Python:/opt/tensorflow/bin/python3.12
TensorFlow 版本:2.17
NVIDIA 驅動程式:
OSS Nvidia 驅動程式:570.172.08
NVIDIA CUDA12 堆疊:
CUDA、NCCL 和 cuDDN 安裝路徑:/usr/local/cuda-12.3/
EFA 安裝程式:1.34.0
AWS CLI v2as aws2 和AWS CLI v1as aws
EBS 磁碟區類型:gp3
使用 SSM 參數查詢 AMI-ID (範例區域為 us-east-1):
OSS Nvidia 驅動程式:
aws ssm get-parameter --region
us-east-1
\ --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.17-ubuntu-22.04/latest/ami-id \ --query "Parameter.Value" \ --output text
使用 AWSCLI 查詢 AMI-ID (範例區域為 us-east-1):
OSS Nvidia 驅動程式:
aws ec2 describe-images --region
us-east-1
\ --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) ????????' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \ --output text
發行日期:2025-02-17
AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20250215
Updated
將 NVIDIA Container Toolkit 從 1.17.3 版更新至 1.17.4 版
如需詳細資訊,請參閱此處的版本備註頁面:https://https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
在 Container Toolkit 1.17.4 版中,CUDA Compat 程式庫的掛載現已停用。為了確保與容器工作流程上的多個 CUDA 版本相容,請確保您更新 LD_LIBRARY_PATH 以包含 CUDA 相容性程式庫,如如果您使用 CUDA 相容性層教學中所示。
已移除
已移除 NVIDIA CUDA 工具組
提供的使用者空間程式庫 cuobj 和 nvdisasm,以解決 2025 年 2 月 18 日 NVIDIA CUDA 工具組安全公告 中存在的 CVEs
版本日期:2025-01-20
AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20250118
Updated
已將 Nvidia 驅動程式從 550.127.05 版升級至 550.144.03,以解決 2025 年 1 月 NVIDIA GPU 顯示驅動程式安全公告
中存在的 CVEs
2.17.1 版
發行日期:2024-11-18
AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20241115
Fixed
由於 Ubuntu 核心變更以解決核心位址空間配置隨機化 (KASLR) 功能中的瑕疵,G4Dn/G5 執行個體無法在 OSS Nvidia 驅動程式上正確初始化 CUDA。為了緩解此問題,此 DLAMI 包含可動態載入 G4Dn 和 G5 執行個體專屬驅動程式的功能。請允許此載入的短暫初始化期間,以確保您的執行個體能夠正常運作。
若要檢查此服務的狀態和運作狀態,您可以使用下列命令:
sudo systemctl is-active dynamic_driver_load.service
active
2.17.0 版
發行日期:2024-09-25
AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20240924
已新增
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 系列的初始版本。
軟體 包括下列項目:
「nvidia-driver=550.90.07」
"fabric-manager=550.90.07"
「cuda=12.3」
「cudnn=8.9.7」
"efa=1.34.0"
"nccl=2.22.3"
「aws-nccl-ofi-plugin=v1.11.0-aws」
Tensorflow 虛擬環境 (啟用命令來源 /opt/tensorflow/bin/activate) 包含下列項目:
「tensorflow=2.17.0」