AWS Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2)
開始方法については、「DLAMI の使用開始」を参照してください。
AMI 名の形式
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}
サポートされる EC2 インスタンス
「DLAMI に関する重要な変更」を参照してください。
Deep Learning with OSS Nvidia Driver は、G4dn、G5、G6、Gr6、G6e、P4d、P4de、P5、P5e、P5en をサポートしています。
Deep Learning with Proprietary Nvidia Driver は G3 (G3.16x はサポートしていません)、P3、P3dn をサポートしています。
AMI には、以下が含まれます。
サポートされている AWS のサービス: EC2
オペレーティングシステム: Amazon Linux 2
コンピューティングアーキテクチャ: x86
Python: /opt/tensorflow/bin/python3.10
TensorFlow バージョン: 2.16
Nvidia Driver:
OSS Nvidia Driver: 550.144.03
Proprietary Nvidia Driver: 550.144.03
NVIDIA CUDA12 スタック:
CUDA、NCCL、および cuDDN インストールパス: /usr/local/cuda-12.2/
EFA インストーラ: 1.34.0
AWS CLI v2 は aws2、AWS CLI v1 は aws です
EBS ボリュームタイプ: gp3
SSM パラメータで AMI-ID をクエリ (例: リージョンは us-east-1):
OSS Nvidia Driver:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output textProprietary Nvidia Driver:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
AWSCLI で AMI-ID をクエリ (例: リージョンは us-east-1):
OSS Nvidia Driver:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output textProprietary Nvidia Driver:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
注意
NVIDIA Container Toolkit: 1.17.4
Container Toolkit バージョン 1.17.4 では、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するには、チュートリアル「CUDA 互換性レイヤーを使用する場合」(https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat) に示されているように、CUDA 互換性ライブラリを含むよう LD_LIBRARY_PATH を更新してください。
今後の TensorFlow オペレーティングシステムの更新
TensorFlow 2.16 は、Ubuntu 20.04 オペレーティングシステムを使用する最後の DLAMI となります。TensorFlow 2.17 以降、DLAMI は Ubuntu 22.04 を基本オペレーティングシステムとして使用を介します。これらの新しいバージョンへのアップグレードを検討予定の場合は、お客様のワークフローがアップグレードに対応できる状態であることをご確認ください。
Keras バージョンは 3.0 ではなく 2.0 に固定されました
最新の TF2.16 のリリースに伴い、Keras はメジャーバージョン 2 からメジャーバージョン 3.0 へアップグレードされました。この Keras バージョンは、Keras パッケージの完全な書き換えです (詳細については、Keras 3 のドキュメント
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS
リリース日: 2025 年 2 月 17 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215
更新
NVIDIA Container Toolkit がバージョン 1.17.3 からバージョン 1.17.4 に更新されました
詳細については、こちら https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
のリリースノートページを参照してください。 Container Toolkit バージョン 1.17.4 では、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するには、チュートリアル「CUDA 互換性レイヤーを使用する場合」(https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat) に示されているように、CUDA 互換性ライブラリを含むよう LD_LIBRARY_PATH を更新してください。
削除済み
2025 年 2 月 18 日の NVIDIA CUDA ツールキットのセキュリティ情報
に記載されている脆弱性に対処するため、NVIDIA CUDA ツールキット が提供するユーザースペースライブラリの cuobj および nvdisasm を削除しました
リリース日: 2025 年 1 月 20 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118
更新
2025 年 1 月の NVIDIA GPU ディスプレイドライバーのセキュリティ情報
に記載されている CVE に対処するため、NVIDIA ドライバーがバージョン 550.127.05 から 550.144.03 にアップグレードされました
リリース日: 2024 年 10 月 23 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023
更新
2024 年 10 月の NVIDIA GPU ディスプレイのセキュリティ情報
に記載されている CVE に対処するため、NVIDIA ドライバーがバージョン 550.90.07 から 550.127.05 にアップグレードされました
リリース日: 2024 年 9 月 28 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928
更新
Nvidia Container Toolkit がバージョン 1.16.1 から 1.16.2 にアップグレードされ、セキュリティの脆弱性 CVE-2024-0133
に対応しました。
リリース日: 2024 年 9 月 21 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921
更新
Nvidia ドライバーと Fabric Manager がバージョン 535.183.01 から 550.90.07 にアップグレードされました
EFA のバージョンが 1.32.0 から 1.34.0 にアップグレードされました
PyTorch のバージョンがバージョン 2.3.0 から 2.3.1 に更新されました
追加
OSS Nvidia Driver Images で P5e EC2 インスタンスのサポートが追加されました。
リリース日: 2024 年 8 月 19 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817
追加
G6e EC2 インスタンス
のサポートが追加されました。
バージョン 2.16.2 - リリース日: 2024 年 7 月 26 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725
更新
TensorFlow パッチバージョンがバージョン 2.16.1 から 2.16.2 に更新されました
2024 年 7 月 17 日にリリースされた DLAMI の TensorFlow マイナーバージョンの誤りを修正しました。
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 のリリースでは、誤って 2.16 ではなく TensorFlow マイナーバージョン 2.17 が含まれていました。TensorFlow 2.16 に依存するワークフローが最新の DLAMI にアップグレードされていることを確認してください。
バージョン 2.16.1 - リリース日: 2024 年 6 月 10 日
AMI 名:
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610
更新
Nvidia ドライバーのバージョンが 535.183.01 から 535.161.08 に更新されました
リリース日: 2024 年 5 月 10 日
「DLAMI に関する重要な変更」を参照してください
AMI 名:
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510
追加
初回リリース:
Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。
ソフトウェアには、次のものが含まれます。
「nvidia-driver=535.161.08」
「fabric-manager=535.161.08」
「cuda=12.3」
「cudnn=8.9.7」
「efa=1.32.0」
「nccl=2.21.5」
「aws-nccl-ofi-plugin=v1.9.1-aws」
tensorflow 仮想環境が追加されました (アクティベートコマンドのソース /opt/tensorflow/bin/activate)。この環境には、次のものが含まれます。
「tensorflow=2.16.1」
注意
TF2.16 以降、tf.estimator API は削除されます。
tf.estimator を引き続き使用するには、TF 2.15 以前のバージョンを使用する必要があります。詳細については、「TensorFlow 2.16.1 リリースノート
」を参照してください。
お客様のワークフローとの互換性を確保するために、環境変数 TF_USE_LEGACY_KERAS=1 を使用して Keras のバージョンを 2.0 に固定しました。ワークフローで Keras 3.0 を使用する必要がある場合は、次のスクリプトを使用して、TensorFlow 仮想環境 /opt/tensorflow からこの環境変数を削除してください。
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS