

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建 Amazon SageMaker 笔记本实例
<a name="howitworks-create-ws"></a>

**重要**  
允许 Amazon SageMaker Studio 或 Amazon SageMaker Studio Classic 创建亚马逊 SageMaker资源的自定义 IAM 策略还必须授予向这些资源添加标签的权限。之所以需要为资源添加标签的权限，是因为 Studio 和 Studio Classic 会自动为创建的任何资源添加标签。如果 IAM 策略允许 Studio 和 Studio Classic 创建资源但不允许标记，则在尝试创建资源时可能会出现 AccessDenied “” 错误。有关更多信息，请参阅 [提供标记 A SageMaker I 资源的权限](security_iam_id-based-policy-examples.md#grant-tagging-permissions)。  
[AWS 亚马逊 A SageMaker I 的托管策略](security-iam-awsmanpol.md)授予创建 SageMaker 资源的权限已经包括在创建这些资源时添加标签的权限。

Amazon SageMaker 笔记本实例是运行 Jupyter Notebook 应用程序的 ML 计算实例。 SageMaker AI 管理创建实例和相关资源。在您的笔记本实例中使用 Jupyter Notebook 可以：
+ 准备和处理数据
+ 编写代码训练模型
+ 将模型部署到 SageMaker AI 托管
+ 测试或验证模型

要创建笔记本实例，请使用 A SageMaker I 控制台或 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateNotebookInstance.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateNotebookInstance.html)API。

您选择的笔记本实例类型取决于您使用笔记本实例的方式。确保笔记本实例不受内存、CPU 或 IO 的约束。要计划将数据集加载到笔记本实例上的内存中以进行探索或预处理，为数据集选择具有足够 RAM 内存的实例类型。这需要具有至少 16 GB 内存的实例（超大型或大型）。如果您计划使用笔记本进行计算密集型预处理，我们建议您选择计算优化型实例，例如 c4 或 c5。

使用 SageMaker 笔记本时，最佳做法是使用笔记本实例来编排其他 AWS 服务。例如，您可以使用笔记本实例来管理大型数据集处理。为此，请调用 AWS Glue for ETL（提取、转换和加载）服务，或者调用 Amazon EMR，使用 Hadoop 进行映射和数据缩减。您可以使用 AWS 服务作为数据的临时计算或存储形式。

您可以使用 Amazon Simple Storage Service 存储桶存储和检索您的训练和测试数据。然后，您可以使用 SageMaker AI 来训练和构建模型。这样，笔记本的实例类型不会影响模型训练和测试的速度。

收到请求后， SageMaker AI 会执行以下操作：
+ **创建网络接口**-如果您选择可选的 VPC 配置， SageMaker AI 将在您的 VPC 中创建网络接口。它使用您在请求中提供的子网 ID 来确定要在哪个可用区中创建子网。 SageMaker AI 会将您在请求中提供的安全组与子网关联。有关更多信息，请参阅 [将 VPC 中的笔记本实例连接到外部资源](appendix-notebook-and-internet-access.md)。
+ **启动 ML 计算实例** — SageMaker AI 在 A SageMaker I VPC 中启动机器学习计算实例。 SageMaker AI 执行的配置任务使其能够管理您的笔记本实例。如果您指定了 VPC， SageMaker AI 会启用您的 VPC 和笔记本实例之间的流量。
+ **为常见的深度学习平台安装 Anaconda 软件包和库** — SageMaker AI 会安装安装程序中包含的所有 Anaconda 软件包。有关更多信息，请参阅 [Anaconda 软件包清单](https://docs.anaconda.com/free/anaconda/pkg-docs/)。 SageMaker 人工智能还会安装 TensorFlow 和 Apache MXNet 深度学习库。
+ **连接 ML 存储卷** — SageMaker AI 将 ML 存储卷附加到 ML 计算实例。您可以将卷用作工作区来清理训练数据集或临时存储验证、测试或其他数据。以 1 GB 为增量，为卷选择 5 GB 到 16384 GB 之间的任意大小。默认值为 5 GB。机器学习存储卷是加密的，因此 SageMaker AI 无法确定卷上的可用空间量。因此，您可以在更新笔记本实例时增加卷大小，但无法减小卷大小。如果要减小正在使用的 ML 存储卷的大小，请创建一个具有所需大小的新笔记本实例。

  只有保存在 `/home/ec2-user/SageMaker` 文件夹中的文件和数据才会在笔记本实例会话之间持续存在。当笔记本实例停止或重新启动时，保存在此目录之外的文件和数据将被覆盖。每个笔记本实例的`/tmp`目录在实例存储中至少提供 10 GB 的存储空间。实例存储是非持久的临时性块级存储。当实例停止或重新启动时， SageMaker AI 会删除目录的内容和任何操作系统自定义设置。该临时存储是笔记本实例根卷的一部分。

  如果笔记本实例未更新且正在运行不安全的软件， SageMaker AI 可能会定期更新该实例，作为定期维护的一部分。在这些更新期间，不会保留文件夹`/home/ec2-user/SageMaker`之外的数据。有关维护和安全补丁的更多信息，请参阅[Maintenance](nbi.md#nbi-maintenance)。

  如果笔记本实例使用的实例类型有 NVMe 支持，则客户可以使用适用于该 NVMe 实例类型的实例存储卷。对于具有 NVMe 存储卷的实例，所有实例存储卷将在启动时自动连接到该实例。有关实例类型及其关联 NVMe 存储量的更多信息，请参阅 [Amazon Elastic Compute 云实例类型详情](https://aws.amazon.com/ec2/instance-types/)。

  要使附加的 NVMe 存储卷可用于您的笔记本实例，请完成[使实例存储卷在您的实例上可用](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/add-instance-store-volumes.html#making-instance-stores-available-on-your-instances)中的步骤。使用 root 访问权限或使用生命周期配置脚本完成这些步骤。
**注意**  
NVMe 实例存储卷不是永久存储。此存储空间在实例中的使用时间很短，每次启动带有此存储空间的实例时都必须重新配置。

**要创建 A SageMaker I 笔记本实例，请执行以下操作：**

1. 打开 SageMaker AI 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 选择**笔记本实例**，然后选择**创建笔记本实例**。

1. 在**创建笔记本实例**页面上提供以下信息：

   1. 对于**笔记本实例名称**，请键入您的笔记本实例的名称。

   1. 对于**笔记本实例类型**，请选择适合您的使用案例的实例大小。有关支持的实例类型和配额的列表，请参阅 [Amazon A SageMaker I Service Quotas](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html#limits_sagemaker)。

   1. 对于**平台标识符**，选择要在其上创建笔记本实例的平台类型。此平台类型决定了创建笔记本实例的操作系统和 JupyterLab 版本。最新和推荐的版本是`notebook-al2023-v1`，适用于亚马逊 Linux 2023 笔记本实例。截至 2025 年 6 月 30 日，新实例仅支持 JupyterLab 4 个。有关平台标识符类型的信息，请参阅[AL2023 笔记本实例](nbi-al2023.md)和[Amazon Linux 2 笔记本实例](nbi-al2.md)。有关 JupyterLab 版本的信息，请参见[JupyterLab 版本控制](nbi-jl.md)。
**重要**  
JupyterLab 自 2025 年 6 月 30 日起，不再支持 1 和 JupyterLab 3。您无法再使用这些版本创建新的笔记本实例或重启用已停止的笔记本实例。现有运行中的实例可继续使用，但不再获得安全更新或错误修复。迁移到 JupyterLab 4 个笔记本实例以获得持续支持。有关更多信息，请参阅 [JupyterLab 版本维护](nbi-jl.md#nbi-jl-version-maintenance)。

   1. （可选）**其他配置**允许高级用户创建可在您创建或启动实例时运行的 Shell 脚本。此脚本称为生命周期配置脚本，可用于设置笔记本的环境或执行其他功能。有关信息，请参阅[使用 LCC 脚本自定义 SageMaker 笔记本实例](notebook-lifecycle-config.md)。

   1. （可选）**其他配置**还允许您指定附加到笔记本实例的 ML 存储卷的大小，以 GB 为单位。您可以选择介于 5 GB 到 16384 GB 之间的大小，以 1 GB 为增量。您可以使用该卷来清理训练数据集，或临时存储验证或其他数据。

   1. （可选）对于 **IMDS 最低版本**，请从下拉列表中选择一个版本。如果该值设置为 v1，则两个版本都可用于笔记本实例。如果选择了 v2，则 IMDSv2 只能与笔记本实例一起使用。有关的信息 IMDSv2，请参见[使用 IMDSv2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/configuring-instance-metadata-service.html)。
**注意**  
从 2022 年 10 月 31 日起， SageMaker 笔记本实例的默认最低 IMDS 版本从变为 IMDSv1 。 IMDSv2  
从 2023 年 2 月 1 日起， IMDSv1 不再可用于创建新的笔记本实例。在此日期之后，您可以创建最低 IMDS 版本为 2 的笔记本实例。

   1. 对于 **IAM 角色**，请选择账户中具有访问 A SageMaker I 资源的必要权限的现有 IAM 角色或**创建新角色**。如果您选择**创建新角色**，A SageMaker I 会创建一个名为的 IAM 角色`AmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS`。 AWS 托管策略`AmazonSageMakerFullAccess`已附加到该角色。该角色提供的权限允许笔记本实例调用 SageMaker AI 和 Amazon S3。

   1. 对于**根访问**，要为所有笔记本实例用户提供 root 访问权限，请选择**启用**。要删除用户的 root 访问权限，请选择**禁用**。如果授予 root 访问权限，则所有笔记本实例用户都具有管理员权限，并且可以访问和编辑实例上的所有文件。

   1. （可选）**加密密钥**允许您使用 AWS Key Management Service (AWS KMS) 密钥，对连接到笔记本实例的 ML 存储卷上的数据进行加密。如果您计划在 ML 存储卷上存储敏感信息，请考虑加密信息。

   1. （可选）**网络**允许您将笔记本实例放在虚拟私有云 (VPC) 中。VPC 提供额外的安全性，限制从 VPC 外部的源访问 VPC 中的资源。有关更多信息 VPCs，请参阅 [Amazon VPC 用户指南](https://docs.aws.amazon.com/vpc/latest/userguide/)。

      **要将笔记本实例添加到 VPC，请执行以下操作：**

      1. 选择 **VPC** 和**SubnetId**。

      1. 对于**安全组**，请选择您的 VPC 的默认安全组。

      1. 如果您希望笔记本实例能够访问 Internet，请启用直接 Internet 访问。对于**直接 Internet 访问**，请选择**启用**。Internet 访问可能会降低笔记本实例的安全性。有关更多信息，请参阅 [将 VPC 中的笔记本实例连接到外部资源](appendix-notebook-and-internet-access.md)。

   1. （可选）要将 Git 存储库与笔记本实例相关联，请选择一个默认存储库以及最多 3 个额外的存储库。有关更多信息，请参阅 [带有 SageMaker AI 笔记本实例的 Git 存储库](nbi-git-repo.md)。

   1. 选择**创建笔记本实例**。

      几分钟后，Amazon A SageMaker I 会启动一个 ML 计算实例（在本例中为笔记本实例），并向其连接一个 ML 存储卷。笔记本实例有一个预配置的 Jupyter 笔记本服务器和一组 Anaconda 库。有关更多信息，请参阅 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateNotebookInstance.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateNotebookInstance.html) API。

1. 在控制台中，当笔记本实例的状态为 `InService` 时，笔记本实例即可使用。选择笔记本名称旁边的**打开 Jupyter** 以打开经典 Jupyter 控制面板。
**注意**  
为了增强您的 Amazon SageMaker 笔记本实例的安全性，所有区域`notebook.region.sagemaker.aws`域名都已在互联网[公共后缀列表 (PS](https://publicsuffix.org/) L) 中注册。为了进一步提高安全性，我们建议您使用带`__Host-`前缀的 Cookie 来为 SageMaker 笔记本实例的域名设置敏感 Cookie。这将有助于保护您的域，防范跨站点请求伪造（CSRF）攻击。有关更多信息，请参阅 [mozilla.org](https://www.mozilla.org/en-GB/?v=1) 开发人员文档网站中的 [Set-Cookie](https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/Set-Cookie#cookie_prefixes) 页面。

    您可以选择 “**打开**” JupyterLab 来打开 JupyterLab控制面板。该控制面板提供对笔记本实例的访问权限。

   有关 Jupyter 笔记本的更多信息，请参阅 [Jupyter 笔记本](https://jupyter-notebook.readthedocs.io/en/stable/)。