

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 什么是 AWS Deep Learning AMIs？
<a name="what-is-dlami"></a>

AWS Deep Learning AMIs（DLAMI）提供自定义的机器映像，可用于云中的深度学习。DLAMI 在大多数 AWS 区域中可用于各种 Amazon Elastic Compute Cloud（Amazon EC2）实例类型，从仅使用 CPU 的小型实例到最新的高性能多 GPU 实例。DLAMI 预配置了 [NVIDIA CUDA](https://developer.nvidia.com/cuda-zone) 和 [NVIDIA cuDNN](https://developer.nvidia.com/cudnn) 以及最常用的深度学习框架的最新版本。

## 关于本指南
<a name="guide-contents"></a>

其中的内容有助于您启动并使用 DLAMI。该指南涵盖了几个可同时用于训练和推理的常见深度学习使用案例。还介绍了如何针对您的用途选择合适的 AMI 以及您可能喜欢的实例类型。

此外，DLAMI 还包括它们支持的框架所提供的几个教程。本指南可以向您展示如何激活每个框架，并找到相应的入门教程。它还提供有关分布式训练、调试、使用 AWS Inferentia 和 AWS Trainium 以及其它关键概念的教程。有关如何设置 Jupyter Notebook 服务器以在浏览器中运行教程的说明，请参阅[在 DLAMI 实例上设置 Jupyter Notebook 服务器](setup-jupyter.md)。

## 先决条件
<a name="prerequisites"></a>

要成功运行 DLAMI，建议您熟悉命令行工具和基本 Python。

# DLAMI 使用案例示例
<a name="use-cases"></a>

以下是 AWS Deep Learning AMIs（DLAMI）的一些常见使用案例示例。

**了解深度学习**：DLAMI 是学习或教授机器学习和深度学习框架的理想选择。DLAMI 消除了一些麻烦，不要求对每个框架的安装进行故障排除和让它们在同一台计算机上运行。DLAMI 包括 Jupyter Notebook，可以轻松地为不熟悉机器学习和深度学习的人运行框架所提供的教程。

**应用程序开发**：如果您是应用程序开发人员，有兴趣使用深度学习来使应用程序利用 AI 领域的最新进展，则 DLAMI 是理想的测试平台。每个框架都附带了关于如何开始使用深度学习的教程，其中许多教程都有模型动物园，可以让您轻松试用深度学习，您不需要自己创建神经网络或进行模型训练。一些示例向您展示如何在几分钟内构建映像检测应用程序，或如何为您自己的聊天自动程序构建语音识别应用程序。

**机器学习和数据分析**：如果您是数据科学家，或者您有兴趣通过深度学习处理数据，则您会发现许多框架都支持 R 和 Spark。您将找到关于进行简单回归的教程，以及为个性化和预测系统构建可扩展的数据处理系统的教程。

**研究**：如果您是研究人员，希望试用新框架、测试新模型或训练新模型，则 DLAMI 和 AWS 的扩展功能可以减少安装和管理多个训练节点的繁琐工作。

**注意**  
虽然您的最初选择可能是将实例类型升级到具有多个 GPU（最多 8 个）的更大实例，但您也可以通过创建 DLAMI 实例集群来进行水平扩展。有关集群构建的更多信息，请参阅 [有关 DLAMI 的相关信息](resources.md)。

# DLAMI 的功能
<a name="features"></a>

AWS Deep Learning AMIs（DLAMI）的功能包括预装的深度学习框架、GPU 软件、模型服务器和模型可视化工具。

## 预装的框架
<a name="features-frameworks"></a>

目前有两种主要的 DLAMI 版本，均包含与操作系统（OS）和软件版本相关的其它变体：
+ [带 Conda 的深度学习 AMI](overview-conda.md)：在单独的 Python 环境中使用 `conda` 程序包单独安装的框架。
+ [深度学习基础 AMI](overview-base.md)：不安装任何框架；只有 [NVIDIA CUDA](https://developer.nvidia.com/cuda-zone) 和其它依赖项。

带 Conda 的深度学习 AMI 使用 `conda` 环境来隔离每个框架，以便您可以随意切换框架，而不用担心其依赖项发生冲突。带 Conda 的 Deep Learning AMI 支持以下框架：
+ PyTorch
+ TensorFlow 2

**注意**  
DLAMI 不再支持以下深度学习框架：Apache MXNet、微软认知工具包（CNTK）、Caffe、Caffe2、Theano、Chainer 和 Keras。

## 预装的 GPU 软件
<a name="features-gpu"></a>

即使您使用仅包含 CPU 的实例，DLAMI 也将具有 [NVIDIA CUDA](https://developer.nvidia.com/cuda-zone) 和 [NVIDIA cuDNN](https://developer.nvidia.com/cudnn)。无论实例类型是什么，安装的软件都是相同的。请记住，GPU 特定的工具只适用于至少具有一个 GPU 的实例。有关实例类型的更多信息，请参阅[选择 DLAMI 实例类型](instance-select.md)。

有关 CUDA 的更多信息，请参阅 [CUDA 安装和框架绑定](overview-cuda.md)。

## 模型处理和可视化
<a name="features-gpu"></a>

带 Conda 的 Deep Learning AMI 预装了用于 TensorFlow 的模型服务器，以及用于 TensorBoard（旨在实现模型可视化）的模型服务器。有关更多信息，请参阅 [TensorFlow 上菜](tutorial-tfserving.md)。