Deep Learning AMI GPU TensorFlow 2.18 (Ubuntu 22.04) - AWS 深度學習 AMIs

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Deep Learning AMI GPU TensorFlow 2.18 (Ubuntu 22.04)

如需入門說明,請參閱 DLAMI 入門

AMI 名稱格式

  • 深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.18 (Ubuntu 22.04) ${YYYY-MM-DD}

支援的 EC2 執行個體

  • 深度學習搭配 OSS Nvidia 驅動程式支援 G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en。

AMI 包含下列項目:

  • 支援服務 AWS :Amazon EC2

  • 作業系統:Ubuntu 22.04

  • 運算架構:x86

  • Python:/opt/tensorflow/bin/python3.12

  • TensorFlow 版本:2.18

  • NVIDIA 驅動程式

    • OSS Nvidia 驅動程式:570.172.08

  • NVIDIA CUDA12 堆疊

    • CUDA、NCCL 和 cuDDN 安裝路徑:/usr/local/cuda-12.5/

  • EFA 安裝程式:1.43.1

  • AWS CLI v2 作為 aws2 和 AWS CLI v1 作為 aws

  • EBS 磁碟區類型:gp3

  • 使用 SSM 參數查詢 AMI-ID (範例區域為 us-east-1):

    • OSS Nvidia 驅動程式:

      aws ssm get-parameter --region us-east-1 \ --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.18-ubuntu-22.04/latest/ami-id \ --query "Parameter.Value" \ --output text
  • 使用 AWSCLI 查詢 AMI-ID (範例區域為 us-east-1):

    • OSS Nvidia 驅動程式:

      aws ec2 describe-images --region us-east-1 \ --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) ????????' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \ --output text

發行日期:2025-02-17

AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20250215

Updated

已移除

發行日期:2025-01-20

AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20250118

Updated

發行日期:2024-12-09

AMI 名稱:深度學習 OSS Nvidia 驅動程式 AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20241206

已新增

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 系列的初始版本。

    • 軟體 包括下列項目:

      • "nvidia-driver=550.127.05"

      • "fabric-manager=550.127.05"

      • "cuda=12.5"

      • 「cudnn=9.5.1」

      • "efa=1.37.0"

      • "nccl=2.23.4"

      • 「aws-nccl-ofi-plugin=v1.13.0-aws」

  • Tensorflow 虛擬環境 (啟用命令來源 /opt/tensorflow/bin/activate) 包含下列項目:

    • 「tensorflow=2.18.0」

Fixed

  • 由於 Ubuntu 核心變更以解決核心位址空間配置隨機化 (KASLR) 功能中的瑕疵,G4Dn/G5 執行個體無法在 OSS Nvidia 驅動程式上正確初始化 CUDA。為了緩解此問題,此 DLAMI 包含可動態載入 G4Dn 和 G5 執行個體專屬驅動程式的功能。請允許此載入的短暫初始化期間,以確保您的執行個體能夠正常運作。

    • 若要檢查此服務的狀態和運作狀態,您可以使用下列命令:

sudo systemctl is-active dynamic_driver_load.service active