AWS 深度学习 ARM64 基础 GPU AMI (Ubuntu 24.04) - AWS Deep Learning AMIs

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS 深度学习 ARM64 基础 GPU AMI (Ubuntu 24.04)

如需入门帮助,请参阅DLAMI 入门

AMI 名称格式

  • 深度学习 ARM64 基础 OSS Nvidia Driver GPU AMI (Ubuntu 24.04) $ {YYYY-MM-DD}

支持的 EC2 实例

  • G5g

AMI 包括以下内容:

  • 支持的 AWS 服务:Amazon EC2

  • 操作系统:Ubuntu 24.04

  • 计算架构: ARM64

  • Linux 内核:6.14

  • NVIDIA 驱动程序:570.172.08

  • NVIDIA CUDA 12.5、12.6、12.8 堆栈:

    • C@@ UDA、NCCL 和 cudDN 安装目录:/-12.8/ usr/local/cuda

    • 默认 CUDA:12.8

      • 路径/ usr/local/cuda 指向 CU DA

      • 在环境变量下方更新:

        • LD_LIBRARY_PATH 要有 /64 usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib

        • 拥有路径/usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

  • AWS CLI v2 位于/usr/local/bin/aws

  • EBS 卷类型:gp3

  • Nvidia 容器工具包:1.17.8

    • 版本命令: nvidia-container-cli-V

  • Docker:28.3.3

  • Python:/usr/bin/python3.12

  • 使用 SSM 参数查询 AMI-ID(示例区域为 us-east-1):

    export SSM_PARAMETER=base-oss-nvidia-driver-gpu-ubuntu-24.04/latest/ami-id \ aws ssm get-parameter --region us-east-1 \ --name /aws/service/deeplearning/ami/arm64/$SSM_PARAMETER \ --query "Parameter.Value" \ --output text
  • 使用以下方式查询 AMI-ID AWSCLI (示例区域为 us-east-1):

    aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning ARM64 Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

版权声明

发布日期:2025-08-08

AMI 名称:深度学习 ARM64 基础 OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20250806

新增了

  • 深度学习 ARM64 基础 OSS Nvidia Driver GPU AMI(Ubuntu 24.04)系列的首次发布。配有 NVIDIA 驱动程序 R570、CUDA=12.8、NCCL=2.27.5 和 EFA=1.43.1。

已知问题

  • 由于与最新 FSx 的 Ubuntu 24.04 内核版本不兼容,本版本中删除了对 Amazon for Lustre 的支持。最新的 Ubuntu 24.04 内核版本目前不支持 NVIDIA GDS 和 FS。支持 FSx最新内核版本后,将恢复对、GDS 和 FS 的支持。