AWS Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) - AWS Deep Learning AMIs

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2)

開始方法については、「」を参照してくださいDLAMI の使用開始

AMI 名形式

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}

サポートされる EC2 インスタンス

  • DLAMI の重要な変更点を参照してください。

  • OSS Nvidia ドライバーによる深層学習はG4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en をサポートしています。

  • 独自の Nvidia ドライバーを使用した Deep Learning が G3 (G3.16x はサポートされていません)、P3, P3dn をサポート

AMI には以下が含まれます。

  • サポートされている AWS サービス: EC2

  • オペレーティングシステム: Amazon Linux 2

  • コンピューティングアーキテクチャ: x86

  • Python: /opt/tensorflow/bin/python3.10

  • TensorFlow バージョン: 2.16

  • NVIDIA ドライバー:

    • OSS Nvidia ドライバー: 550.144.03

    • 独自の Nvidia ドライバー: 550.144.03

  • NVIDIA CUDA12 スタック:

    • CUDA、NCCL、および cuDDN インストールパス: /usr/local/cuda-12.2/

  • EFA インストーラ: 1.34.0

  • AWS CLI v2 as aws2 および AWS CLI v1 as aws

  • EBS ボリュームタイプ: gp3

  • SSM パラメータを使用して AMI-ID をクエリする (リージョンの例は us-east-1)

    • OSS Nvidia ドライバー:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • 独自の Nvidia ドライバー:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • AWSCLI で AMI-ID をクエリする (リージョンの例は us-east-1)

    • OSS Nvidia ドライバー:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • 独自の Nvidia ドライバー:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

注意

NVIDIA Container Toolkit 1.17.4

Container Toolkit バージョン 1.17.4 では、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するには、「CUDA 互換レイヤーを使用する場合」チュートリアルの「」に示すように、LD_LIBRARY_PATH を更新して CUDA 互換ライブラリを含めるようにしてください。 https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat

今後の TensorFlow オペレーティングシステムの更新

TensorFlow 2.16 は Ubuntu 20.04 オペレーティングシステムを利用する最後の DLAMI になります。TensorFlow 2.17 以降、DLAMIsは Ubuntu 22.04 を基本オペレーティングシステムとして使用し始めます。これらの新しいバージョンにアップグレードする場合は、ワークフローがこのアップグレードの準備が整っていることを確認してください。

Keras バージョンが 3.0 ではなく 2.0 に固定されました

最新の TF2.16 リリースでは、Keras がメジャーバージョン 2 からメジャーバージョン 3.0 にアップグレードされました。この Keras バージョンは、Keras パッケージの完全な書き換えです (詳細については、Keras 3 ドキュメントを参照してください)。お客様のワークフローとの互換性を確保するために、環境変数 TF_USE_LEGACY_KERAS=1 を使用して Keras バージョンを 2.0 に固定しました。ワークフローで Keras 3.0 を使用する必要がある場合は、次のスクリプトを使用して TensorFlow 仮想環境 /opt/tensorflow からこの環境変数を削除してください。

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

リリース日: 2025-02-17

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

更新
削除済み

リリース日: 2025-01-20

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118

更新
  • 2025 年 1 月の NVIDIA GPU ディスプレイドライバーのセキュリティ情報に記載されている CVE に対応するために、Nvidia ドライバーをバージョン 550.127.05 から 550.144.03 にアップグレードしました。 https://nvidia.custhelp.com/app/answers/detail/a_id/5614

リリース日: 2024-10-23

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023

更新

リリース日: 2024-09-28

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

更新
  • Nvidia Container Toolkit をバージョン 1.16.1 から 1.16.2 にアップグレードし、セキュリティ脆弱性 CVE-2024-0133 に対応しました。

リリース日: 2024-09-21

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

更新
  • Nvidia ドライバーと Fabric Manager をバージョン 535.183.01 から 550.90.07 にアップグレードしました

  • EFA バージョンを 1.32.0 から 1.34.0 にアップグレード

  • PyTorch バージョンをバージョン 2.3.0 から 2.3.1 に更新

を追加
  • OSS Nvidia ドライバーイメージでの P5e EC2 インスタンスのサポートが追加されました。

リリース日: 2024-08-19

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817

を追加

バージョン 2.16.2 - リリース日: 2024-07-26

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725

更新
  • TensorFlow パッチバージョンをバージョン 2.16.1 から 2.16.2 に更新

  • 2024-07-17 にリリースされた DLAMI の誤った TensorFlow マイナーバージョンを解決しました

    • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 リリースには、2.16 ではなく TensorFlow マイナーバージョン 2.17 が誤って含まれていました。TensorFlow 2.16 に依存するワークフローが最新の DLAMI にアップグレードされていることを確認してください。

バージョン 2.16.1 - リリース日: 2024-06-10

AMI 名:

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610

更新
  • Nvidia ドライバーのバージョンを 535.183.01 から 535.161.08 に更新

リリース日: 2024-05-10

DLAMI の重要な変更点を参照してください。

AMI 名:

  • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

  • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

を追加
  • の初回リリース:

    • Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。

    • Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。

    • ソフトウェアには以下が含まれます。

      • 「nvidia-driver=535.161.08」

      • 「ファブリックマネージャー=535.161.08」

      • 「cuda=12.3」

      • 「cudnn=8.9.7」

      • 「efa=1.32.0」

      • 「nccl=2.21.5」

      • 「aws-nccl-ofi-plugin=v1.9.1-aws」

  • tensorflow 仮想環境 (アクティベーションコマンドソース /opt/tensorflow/bin/activate) を追加しました。この環境には以下が含まれます。

    • 「テンソルフロー = 2.16.1」

      • TF2.16 以降、tf.estimator API は削除されます。

      • お客様のワークフローとの互換性を確保するために、環境変数 TF_USE_LEGACY_KERAS=1 を使用して Keras バージョンを 2.0 に固定しました。ワークフローで Keras 3.0 を使用する必要がある場合は、次のスクリプトを使用して TensorFlow 仮想環境 /opt/tensorflow からこの環境変数を削除してください。

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS