AWS Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) - AWS Deep Learning AMIs

AWS Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2)

開始方法については、「DLAMI の使用開始」を参照してください。

AMI 名の形式

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}

サポートされる EC2 インスタンス

  • DLAMI に関する重要な変更」を参照してください。

  • Deep Learning with OSS Nvidia Driver は、G4dn、G5、G6、Gr6、G6e、P4d、P4de、P5、P5e、P5en をサポートしています。

  • Deep Learning with Proprietary Nvidia Driver は G3 (G3.16x はサポートしていません)、P3、P3dn をサポートしています。

AMI には、以下が含まれます。

  • サポートされている AWS のサービス: EC2

  • オペレーティングシステム: Amazon Linux 2

  • コンピューティングアーキテクチャ: x86

  • Python: /opt/tensorflow/bin/python3.10

  • TensorFlow バージョン: 2.16

  • Nvidia Driver:

    • OSS Nvidia Driver: 550.144.03

    • Proprietary Nvidia Driver: 550.144.03

  • NVIDIA CUDA12 スタック:

    • CUDA、NCCL、および cuDDN インストールパス: /usr/local/cuda-12.2/

  • EFA インストーラ: 1.34.0

  • AWS CLI v2 は aws2、AWS CLI v1 は aws です

  • EBS ボリュームタイプ: gp3

  • SSM パラメータで AMI-ID をクエリ (例: リージョンは us-east-1):

    • OSS Nvidia Driver:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Proprietary Nvidia Driver:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • AWSCLI で AMI-ID をクエリ (例: リージョンは us-east-1):

    • OSS Nvidia Driver:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Proprietary Nvidia Driver:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

注意

NVIDIA Container Toolkit: 1.17.4

Container Toolkit バージョン 1.17.4 では、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するには、チュートリアル「CUDA 互換性レイヤーを使用する場合」(https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat) に示されているように、CUDA 互換性ライブラリを含むよう LD_LIBRARY_PATH を更新してください。

今後の TensorFlow オペレーティングシステムの更新

TensorFlow 2.16 は、Ubuntu 20.04 オペレーティングシステムを使用する最後の DLAMI となります。TensorFlow 2.17 以降、DLAMI は Ubuntu 22.04 を基本オペレーティングシステムとして使用を介します。これらの新しいバージョンへのアップグレードを検討予定の場合は、お客様のワークフローがアップグレードに対応できる状態であることをご確認ください。

Keras バージョンは 3.0 ではなく 2.0 に固定されました

最新の TF2.16 のリリースに伴い、Keras はメジャーバージョン 2 からメジャーバージョン 3.0 へアップグレードされました。この Keras バージョンは、Keras パッケージの完全な書き換えです (詳細については、Keras 3 のドキュメントを参照してください)。お客様のワークフローとの互換性を確保するために、環境変数 TF_USE_LEGACY_KERAS=1 を使用して Keras のバージョンを 2.0 に固定しました。ワークフローで Keras 3.0 を使用する必要がある場合は、次のスクリプトを使用して、TensorFlow 仮想環境 /opt/tensorflow からこの環境変数を削除してください。

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

リリース日: 2025 年 2 月 17 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

更新
削除済み

リリース日: 2025 年 1 月 20 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118

更新

リリース日: 2024 年 10 月 23 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023

更新

リリース日: 2024 年 9 月 28 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

更新
  • Nvidia Container Toolkit がバージョン 1.16.1 から 1.16.2 にアップグレードされ、セキュリティの脆弱性 CVE-2024-0133 に対応しました。

リリース日: 2024 年 9 月 21 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

更新
  • Nvidia ドライバーと Fabric Manager がバージョン 535.183.01 から 550.90.07 にアップグレードされました

  • EFA のバージョンが 1.32.0 から 1.34.0 にアップグレードされました

  • PyTorch のバージョンがバージョン 2.3.0 から 2.3.1 に更新されました

追加
  • OSS Nvidia Driver Images で P5e EC2 インスタンスのサポートが追加されました。

リリース日: 2024 年 8 月 19 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817

追加

バージョン 2.16.2 - リリース日: 2024 年 7 月 26 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725

更新
  • TensorFlow パッチバージョンがバージョン 2.16.1 から 2.16.2 に更新されました

  • 2024 年 7 月 17 日にリリースされた DLAMI の TensorFlow マイナーバージョンの誤りを修正しました。

    • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 のリリースでは、誤って 2.16 ではなく TensorFlow マイナーバージョン 2.17 が含まれていました。TensorFlow 2.16 に依存するワークフローが最新の DLAMI にアップグレードされていることを確認してください。

バージョン 2.16.1 - リリース日: 2024 年 6 月 10 日

AMI 名:

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610

更新
  • Nvidia ドライバーのバージョンが 535.183.01 から 535.161.08 に更新されました

リリース日: 2024 年 5 月 10 日

DLAMI に関する重要な変更」を参照してください

AMI 名:

  • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

追加
  • 初回リリース:

    • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。

    • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。

    • ソフトウェアには、次のものが含まれます。

      • 「nvidia-driver=535.161.08」

      • 「fabric-manager=535.161.08」

      • 「cuda=12.3」

      • 「cudnn=8.9.7」

      • 「efa=1.32.0」

      • 「nccl=2.21.5」

      • 「aws-nccl-ofi-plugin=v1.9.1-aws」

  • tensorflow 仮想環境が追加されました (アクティベートコマンドのソース /opt/tensorflow/bin/activate)。この環境には、次のものが含まれます。

    • 「tensorflow=2.16.1」

    • 注意

      • TF2.16 以降、tf.estimator API は削除されます。

        • tf.estimator を引き続き使用するには、TF 2.15 以前のバージョンを使用する必要があります。詳細については、「TensorFlow 2.16.1 リリースノート」を参照してください。

      • お客様のワークフローとの互換性を確保するために、環境変数 TF_USE_LEGACY_KERAS=1 を使用して Keras のバージョンを 2.0 に固定しました。ワークフローで Keras 3.0 を使用する必要がある場合は、次のスクリプトを使用して、TensorFlow 仮想環境 /opt/tensorflow からこの環境変数を削除してください。

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS