翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2)
開始方法については、「」を参照してくださいDLAMI の使用開始。
AMI 名形式
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) ${YYYY-MM-DD}
サポートされる EC2 インスタンス
DLAMI の重要な変更点を参照してください。
OSS Nvidia ドライバーによる深層学習はG4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en をサポートしています。
独自の Nvidia ドライバーを使用した Deep Learning が G3 (G3.16x はサポートされていません)、P3, P3dn をサポート
AMI には以下が含まれます。
サポートされている AWS サービス: EC2
オペレーティングシステム: Amazon Linux 2
コンピューティングアーキテクチャ: x86
Python: /opt/tensorflow/bin/python3.10
TensorFlow バージョン: 2.16
NVIDIA ドライバー:
OSS Nvidia ドライバー: 550.144.03
独自の Nvidia ドライバー: 550.144.03
NVIDIA CUDA12 スタック:
CUDA、NCCL、および cuDDN インストールパス: /usr/local/cuda-12.2/
EFA インストーラ: 1.34.0
AWS CLI v2 as aws2 および AWS CLI v1 as aws
EBS ボリュームタイプ: gp3
SSM パラメータを使用して AMI-ID をクエリする (リージョンの例は us-east-1)。
OSS Nvidia ドライバー:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text独自の Nvidia ドライバー:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
AWSCLI で AMI-ID をクエリする (リージョンの例は us-east-1)。
OSS Nvidia ドライバー:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text独自の Nvidia ドライバー:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
注意
NVIDIA Container Toolkit 1.17.4
Container Toolkit バージョン 1.17.4 では、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するには、「CUDA 互換レイヤーを使用する場合」チュートリアルの「」に示すように、LD_LIBRARY_PATH を更新して CUDA 互換ライブラリを含めるようにしてください。 https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat
今後の TensorFlow オペレーティングシステムの更新
TensorFlow 2.16 は Ubuntu 20.04 オペレーティングシステムを利用する最後の DLAMI になります。TensorFlow 2.17 以降、DLAMIsは Ubuntu 22.04 を基本オペレーティングシステムとして使用し始めます。これらの新しいバージョンにアップグレードする場合は、ワークフローがこのアップグレードの準備が整っていることを確認してください。
Keras バージョンが 3.0 ではなく 2.0 に固定されました
最新の TF2.16 リリースでは、Keras がメジャーバージョン 2 からメジャーバージョン 3.0 にアップグレードされました。この Keras バージョンは、Keras パッケージの完全な書き換えです (詳細については、Keras 3 ドキュメント
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS
リリース日: 2025-02-17
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215
更新
NVIDIA Container Toolkit をバージョン 1.17.3 からバージョン 1.17.4 に更新しました
詳細については、「https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
」のリリースノートページを参照してください。 Container Toolkit バージョン 1.17.4 では、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するために、「CUDA 互換レイヤーを使用する場合」チュートリアルの「」に示すように、LD_LIBRARY_PATH を更新して CUDA 互換ライブラリを含めるようにしてください。 https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat
削除済み
2025 年 2 月 18 日の NVIDIA CUDA Toolkit Security Bulletin にある CVE の問題に対処
するために、NVIDIA CUDA ツールキットが提供するユーザースペースライブラリ cuobj と nvdisasm を削除しました。 https://nvidia.custhelp.com/app/answers/detail/a_id/5594
リリース日: 2025-01-20
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118
更新
2025 年 1 月の NVIDIA GPU ディスプレイドライバーのセキュリティ情報に記載されている CVE に対応するために、Nvidia ドライバーをバージョン 550.127.05 から 550.144.03 にアップグレードしました。 https://nvidia.custhelp.com/app/answers/detail/a_id/5614
リリース日: 2024-10-23
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023
更新
Nvidia ドライバーをバージョン 550.90.07 から 550.127.05 にアップグレードし、2024 年 10 月の NVIDIA GPU ディスプレイセキュリティ情報
に記載されている CVE の に対応しました。
リリース日: 2024-09-28
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928
更新
Nvidia Container Toolkit をバージョン 1.16.1 から 1.16.2 にアップグレードし、セキュリティ脆弱性 CVE-2024-0133
に対応しました。
リリース日: 2024-09-21
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921
更新
Nvidia ドライバーと Fabric Manager をバージョン 535.183.01 から 550.90.07 にアップグレードしました
EFA バージョンを 1.32.0 から 1.34.0 にアップグレード
PyTorch バージョンをバージョン 2.3.0 から 2.3.1 に更新
を追加
OSS Nvidia ドライバーイメージでの P5e EC2 インスタンスのサポートが追加されました。
リリース日: 2024-08-19
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817
を追加
G6e EC2 インスタンス
のサポートが追加されました。
バージョン 2.16.2 - リリース日: 2024-07-26
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725
更新
TensorFlow パッチバージョンをバージョン 2.16.1 から 2.16.2 に更新
2024-07-17 にリリースされた DLAMI の誤った TensorFlow マイナーバージョンを解決しました
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 リリースには、2.16 ではなく TensorFlow マイナーバージョン 2.17 が誤って含まれていました。TensorFlow 2.16 に依存するワークフローが最新の DLAMI にアップグレードされていることを確認してください。
バージョン 2.16.1 - リリース日: 2024-06-10
AMI 名:
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610
更新
Nvidia ドライバーのバージョンを 535.183.01 から 535.161.08 に更新
リリース日: 2024-05-10
AMI 名:
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510
を追加
の初回リリース:
Deep Learning 独自の Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。
Deep Learning OSS Nvidia ドライバー AMI GPU TensorFlow 2.16 (Amazon Linux 2) シリーズ。
ソフトウェアには以下が含まれます。
「nvidia-driver=535.161.08」
「ファブリックマネージャー=535.161.08」
「cuda=12.3」
「cudnn=8.9.7」
「efa=1.32.0」
「nccl=2.21.5」
「aws-nccl-ofi-plugin=v1.9.1-aws」
tensorflow 仮想環境 (アクティベーションコマンドソース /opt/tensorflow/bin/activate) を追加しました。この環境には以下が含まれます。
「テンソルフロー = 2.16.1」
注
TF2.16 以降、tf.estimator API は削除されます。
tf.estimator を引き続き使用するには、TF 2.15 以前のバージョンを使用する必要があります。詳細については、TensorFlow 2.16.1 リリースノートを参照してください。
お客様のワークフローとの互換性を確保するために、環境変数 TF_USE_LEGACY_KERAS=1 を使用して Keras バージョンを 2.0 に固定しました。ワークフローで Keras 3.0 を使用する必要がある場合は、次のスクリプトを使用して TensorFlow 仮想環境 /opt/tensorflow からこの環境変数を削除してください。
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS