

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 什么是 Amazon SageMaker AI？
<a name="whatis"></a>

Amazon SageMaker AI 是一项完全托管的机器学习 (ML) 服务。借助 SageMaker AI，数据科学家和开发人员可以快速、自信地构建、训练机器学习模型，并将其部署到生产就绪的托管环境中。它为运行机器学习工作流程提供了用户界面体验，使 SageMaker AI ML 工具可在多个集成开发环境中使用（IDEs）。

借 SageMaker 助 AI，您无需构建和管理自己的服务器即可存储和共享数据。这使您或您的组织有更多时间协作构建和开发您的机器学习工作流程，并且可以更快地完成。 SageMaker AI 提供托管机器学习算法，可在分布式环境中针对极其庞大的数据高效运行。借助对 bring-your-own-algorithms框架的内置支持， SageMaker AI 提供了灵活的分布式训练选项，可根据您的特定工作流程进行调整。只需几个步骤，您就可以从 SageMaker AI 控制台将模型部署到安全且可扩展的环境中。

**Topics**
+ [

## 亚马逊 A SageMaker I 重命名
](#whatis-rename)
+ [

## 亚马逊 SageMaker 和亚马逊 A SageMaker I
](#whatis-rename-unified)
+ [

## 亚马逊 A SageMaker I 的定价
](#whatis-pricing)
+ [

# 给首次使用 Amazon A SageMaker I 的用户的建议
](first-time-user.md)
+ [

# 使用 Amazon SageMaker AI 进行机器学习的概述
](how-it-works-mlconcepts.md)
+ [

# Amazon SageMaker AI 功能
](whatis-features.md)

## 亚马逊 A SageMaker I 重命名
<a name="whatis-rename"></a>

2024 年 12 月 3 日，亚马逊更名 SageMaker 为 Amazon A SageMaker I。此名称更改不适用于任何现有的 Amazon SageMaker 功能。

### 旧命名空间保持不变
<a name="whatis-rename-legacy"></a>

出于向后兼容目的，`sagemaker` API 命名空间以及以下相关命名空间保持不变。
+ AWS CLI 命令
+ 包含 `AmazonSageMaker` 前缀的[托管式策略](https://docs.aws.amazon.com/sagemaker/latest/dg/security-iam-awsmanpol.html)
+ 包含 `sagemaker` 的[服务端点](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)
+ 包含 `AWS::SageMaker` 前缀的 [AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/AWS_SageMaker.html) 资源
+ 包含 `AWSServiceRoleForSageMaker` 的服务相关角色
+ 控制台 URLs 包含 `sagemaker`
+  URLs 包含以下内容的文档 `sagemaker`

## 亚马逊 SageMaker 和亚马逊 A SageMaker I
<a name="whatis-rename-unified"></a>

2024年12月3日，亚马逊发布了下一代亚马逊 SageMaker。

Amazon SageMaker 是一个用于数据、分析和人工智能的统一平台。下一代将 AWS 机器学习和分析功能结合在一起， SageMaker 可提供分析和人工智能的集成体验，并可统一访问您的所有数据。

Amazon SageMaker 包括以下功能：
+ Amazon SageMaker AI（前身为 Amazon SageMaker）-使用完全托管的基础架构、工具和工作流程构建、训练和部署机器学习和基础模型
+ Amazon SageMaker Lakehouse — 统一跨亚马逊 S3 数据湖、亚马逊 Redshift 和其他数据源的数据访问
+ 亚马逊 SageMaker 数据和人工智能治理 — 使用基于亚马逊的亚马逊 SageMaker 目录，安全地发现、管理数据和人工智能，并就数据和人工智能开展协作 DataZone
+ SQL 分析：借助 Amazon Redshift，通过性价比最高的 SQL 引擎获得见解 
+ 亚马逊 SageMaker 数据处理-使用亚马逊 Athena、Amazon EMR 和 AWS Glue
+ Amazon SageMaker Unified Studio — 在单一开发环境中使用所有用于分析和人工智能的数据和工具进行构建
+ Amazon Bedrock：构建和扩展生成式人工智能应用程序

有关更多信息，请参阅 [Amazon SageMaker](https://aws.amazon.com/sagemaker)。

## 亚马逊 A SageMaker I 的定价
<a name="whatis-pricing"></a>

有关[AWS 免费套餐](https://aws.amazon.com/free)限制和使用 SageMaker AI 的费用的信息，请参阅 A [mazon A SageMaker I 定价](https://aws.amazon.com/sagemaker/pricing/)。

# 给首次使用 Amazon A SageMaker I 的用户的建议
<a name="first-time-user"></a>

如果您是首次使用 SageMaker AI，我们建议您完成以下操作：

1. **[使用 Amazon SageMaker AI 进行机器学习的概述](how-it-works-mlconcepts.md)**：全面了解机器学习（ML）的生命周期，并了解所提供的解决方案。本页解释了关键概念，并描述了使用 AI 构建 AI 解决方案所涉及的 SageMaker 核心组件。

1. **[Amazon A SageMaker I 入门指南](gs.md)**— 了解如何根据需要设置和使用 SageMaker AI。

1. **[自动机器学习、无代码或低代码](use-auto-ml.md)**：了解低代码和无代码 ML 选项，这些选项可通过自动化机器学习任务来简化 ML 工作流程。这些选项是非常有用的 ML 学习工具，因为它们通过为每个自动化 ML 任务生成笔记本，提供了代码的可视性。

1. **[Amazon A SageMaker I 提供的机器学习环境](machine-learning-environments.md)**— 熟悉可用于开发机器学习工作流程的机器学习环境，例如有关 ready-to-use和自定义模型的信息和示例。

1. **探索其他主题**-使用 SageMaker AI 开发者指南的目录探索更多主题。例如，您可以在中找到有关机器学习生命周期阶段的信息[使用 Amazon SageMaker AI 进行机器学习的概述](how-it-works-mlconcepts.md)，以及 SageMaker 人工智能提供的各种解决方案。

1. **[Amazon SageMaker AI 资源](https://aws.amazon.com/sagemaker/resources)** — 请参阅 SageMaker AI 提供的各种开发者资源。

# 使用 Amazon SageMaker AI 进行机器学习的概述
<a name="how-it-works-mlconcepts"></a>

本节介绍了典型的机器学习（ML）工作流程并描述了如何使用 Amazon SageMaker AI 完成这些任务。

在机器学习中，您*指导*计算机进行预测或推理。首先，您使用一种算法和示例数据来训练模型。然后，您将模型集成到应用程序中，以实时且大规模地生成推理。

下图显示了创建 ML 模型的典型工作流程。它包括循环流中的三个阶段，我们将在下图中详细介绍：
+ 生成示例数据
+ 训练模型
+ 部署模型

![\[ML 模型创建的三个阶段。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/ml-concepts-10.png)


 下图显示了如何在大多数典型场景中执行以下任务：

1. **生成示例数据**：要训练模型，您需要示例数据。所需数据的类型取决于您希望模型解决的业务问题。这与您希望模型生成的推理有关。例如，如果您要创建一个模型从输入的手写数字映像中预测一个数字。要训练此类模型，您需要手写体数字的示例映像。

   数据科学家在使用示例数据进行模型训练之前，通常会花时间探索和预处理这些数据。要对数据进行预处理，您通常执行以下操作：

   1. **获取数据**：您可能拥有内部示例数据存储库，或者您可能使用公开可用的数据集。通常，您将一个或多个数据集提取到单个存储库中。

   1. **清理数据**：要改进模型训练，请检查数据并根据需要进行清理。例如，如果您的数据具有值为 `United States` 和 `US` 的 `country name` 属性，您可以编辑数据以保持一致。

   1. **准备或转换数据**：要提高性能，您可以执行额外的数据转换。例如，您可能会为一个预测飞机除冰条件的模型选择组合属性。您可以将温度和湿度属性合并为一种新的属性以获得更好的模型，而不是单独使用这些属性。

   在 SageMaker AI 中，您可以在集成式开发环境（IDE）中使用 [SageMaker API](https://docs.aws.amazon.com/sagemaker/latest/APIReference/Welcome.html) 和 [SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/) 对示例数据进行预处理。使用 Python 的 SDK (Boto3)，您可以获取、浏览和准备用于模型训练的数据。有关数据准备、处理和转换数据的信息，请参阅 [在 SageMaker AI 中选择正确的数据准备工具的建议](data-prep.md)、[带 SageMaker 处理功能的数据转换工作负载](processing-job.md)、和 [使用特征存放区创建、存储和共享功能](feature-store.md)。

1. **训练模型**：模型训练包括训练和评测模型，如下所示：
   + **训练模型**：要训练模型，您需要一种算法或预训练的基本模型。您选择的算法取决于许多因素。要想获得内置解决方案，您可以使用 SageMaker 提供的算法之一。有关 SageMaker 提供的算法列表以及相关注意事项，请参阅 [Amazon 中的内置算法和预训练模型 SageMaker](algos.md)。有关提供算法和模型的基于 UI 的训练解决方案，请参阅 [SageMaker JumpStart 预训练模型](studio-jumpstart.md)。

     您还需要适用于训练的计算资源。您的资源使用情况取决于训练数据集的大小和需要结果的速度。您可以使用从单个通用实例到分布式 GPU 实例集群等各种资源。有关更多信息，请参阅 [使用 Amazon 训练模型 SageMaker](how-it-works-training.md)。
   + **评测模型**：训练模型之后，您对其进行评测，以确定推理的准确性是否可接受。要训练和评测模型，可使用 [SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/) 通过可用的 IDE 之一向模型发送推理请求。有关评测模型的更多信息，请参阅 [使用 Amazon 模型监视器监控数据和 SageMaker 模型质量](model-monitor.md)。

     

1. **部署模型**：通常，您会对模型进行一些重新设计，以将其与应用程序集成并部署。借助 SageMaker AI 托管服务，您可以独立部署模型，使其与您的应用程序代码解耦。有关更多信息，请参阅 [部署模型用于推理](deploy-model.md)。

   

机器学习是连续的周期。部署模型后，您监控推理，收集更多高质量的数据并评测模型以识别偏差。然后，您可以更新训练数据以包含新收集的高质量的数据，从而提高推理准确性。随着更多的示例数据变得可用，您继续重新训练模型以提高准确性。

# Amazon SageMaker AI 功能
<a name="whatis-features"></a>

Amazon SageMaker AI 包含以下功能。

**Topics**
+ [

## re:Invent 2024 上推出的新功能
](#whatis-features-alpha-new)
+ [

## 机器学习环境
](#whatis-features-alpha-mle)
+ [

## 主要特征
](#whatis-features-alpha-major)

## re:Invent 2024 上推出的新功能
<a name="whatis-features-alpha-new"></a>

SageMaker AI 包含 re:Invent 2024 发布的以下新功能。

**[HyperPod 配方](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-recipes.html) **  
您可以在 Amazon SageMaker HyperPod 中运行配方，也可以将配方作为 SageMaker 训练作业运行。您可以将 HyperPod 训练适配器用作框架来协助您运行端到端训练工作流程。训练适配器基于 NVIDIA NeMo 框架和 Neuronx 分布式训练包构建。

**[Studio 中的 HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-studio.html) **  
在 Amazon SageMaker Studio 中，您可以在 HyperPod 集群上启动机器学习工作负载并查看 HyperPod 集群信息。对集群详细信息和硬件指标的更高可见性，有助于团队为预训练或微调工作负载确定合适的候选项。

**[HyperPod 任务治理](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-eks-operate-console-ui-governance.html) **  
Amazon SageMaker HyperPod 任务治理是一个强大的管理系统，旨在简化资源分配，并确保跨团队和项目高效利用 Amazon EKS 集群的计算资源。HyperPod 任务治理还提供 Amazon EKS 集群可观测性功能，从而实现对集群容量、计算可用性和使用情况、团队分配和利用率以及任务运行和等待时间信息的实时可见性。

**[Amazon SageMaker 合作伙伴 AI 应用程序](https://docs.aws.amazon.com/sagemaker/latest/dg/partner-apps.html) **  
借助 Amazon SageMaker 合作伙伴 AI 应用程序，用户可以访问由行业领先的应用程序提供商构建、发布和分发的生成式人工智能（AI）和机器学习（ML）开发应用程序。合作伙伴 AI 应用程序已通过认证，可在 SageMaker AI 上运行。借助合作伙伴 AI 应用程序，用户可以加快其构建基于基础模型（FM）和传统机器学习模型的解决方案的速度和改进构建此类解决方案的方式，同时不会损害其敏感数据的安全性，这些数据完全保持在可信的安全配置内，并且从不会与第三方共享。

**[Q 开发者版在 Canvas 中可用](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-q.html) **  
您可以在 Amazon SageMaker Canvas 中使用自然语言与 Amazon Q 开发者版进行聊天，来获取生成式人工智能辅助，从而解决机器学习问题。您可以与 Q 开发者版交谈来讨论机器学习工作流程的步骤，并利用 Canvas 功能，例如数据转换、模型构建和部署。

**[SageMaker 训练计划](https://docs.aws.amazon.com/sagemaker/latest/dg/reserve-capacity-with-training-plans.html) **  
Amazon SageMaker 训练计划是一种计算预留功能，专为在 SageMaker 训练作业和 HyperPod 集群上运行的大规模 AI 模型训练工作负载而设计。它们提供在指定时间表内对高需求 GPU 加速计算资源的可预测访问。您可以指定所需的时间表、持续时间和最大计算资源，而 SageMaker 训练计划会自动管理基础设施设置、工作负载执行和故障恢复。这样，就可以使用可预测的成本模型高效地规划和执行任务关键型 AI 项目。

## 机器学习环境
<a name="whatis-features-alpha-mle"></a>

SageMaker AI 包括以下机器学习环境。

**[SageMaker Canvas](canvas.md)**  
一项自动机器学习服务，使没有编码经验的人能够构建模型并使用这些模型进行预测。

**[代码编辑器](https://docs.aws.amazon.com/sagemaker/latest/dg/code-editor.html) **  
Code Editor 扩展了 Studio，使您可以在基于 Visual Studio Code - Open Source（“Code-OSS”）的环境中编写、测试、调试和运行分析和机器学习代码。

**[SageMaker 地理空间功能](geospatial.md)**  
使用地理空间数据构建、训练和部署机器学习模型。

**[SageMaker HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod.html) **  
Amazon SageMaker HyperPod 是 SageMaker AI 的一项功能，可在弹性集群上提供始终在线的机器学习环境，您可以运行任何机器学习工作负载来开发大型机器学习模型，例如大语言模型（LLM）和扩散模型。

**[JupyterLab in Studio](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-updated-jl.html) **  
JupyterLab in Studio 提高了 Studio Notebook 的延迟和可靠性

**[ Studio](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-updated.html) **  
Studio 是一种运行 ML 工作流的最新网络体验。Studio 提供一套 IDE，包括 Code Editor、新的 Jupyterlab 应用程序、RStudio 和 Studio Classic。

**[Amazon SageMaker Studio Classic](studio.md)**  
一体式机器学习环境，您可以在同一应用程序中构建、训练、部署和分析模型。

**[SageMaker Studio Lab](studio-lab.md)**  
一项免费服务，让客户能够在基于开源 JupyterLab 的环境中访问 AWS 计算资源。

**[RStudio on Amazon SageMaker AI](rstudio.md)**  
RStudio on Amazon SageMaker 是 R 的集成开发环境，具有控制体、支持直接代码执行的语法突出显示编辑器以及用于绘制、历史记录、调试和工作区管理的工具。

## 主要特征
<a name="whatis-features-alpha-major"></a>

SageMaker AI 按字母顺序包含以下主要功能，但不包括任何 SageMaker AI 前缀。

**[Amazon Augmented AI](a2i-use-augmented-ai-a2i-human-review-loops.md)**  
构建人工审核机器学习预测所需的工作流。Amazon A2I 使所有开发人员都能使用人工审核，消除了与构建人工审核系统或管理大量人工审核人员相关的千篇一律的繁重工作。

**[AutoML 步骤](build-and-manage-steps.md)**  
创建 AutoML 作业以在 Pipelines 中自动训练模型。

**[SageMaker Autopilot](autopilot-automate-model-development.md)**  
不了解机器学习的用户可以快速构建分类和回归模型。

**[批量转换](batch-transform.md)**  
预处理数据集，在不需要持久终端节点时运行推理，并将输入记录与推理相关联，以帮助解释结果。

**[SageMaker Clarify](clarify-configure-processing-jobs.md#clarify-fairness-and-explainability)**  
通过检测潜在的偏见来改进机器学习模型，并协助解释模型所做的预测。

**[使用共享空间进行协作](domain-space.md)**  
共享空间由共享的 JupyterServer 应用程序和共享目录组成。Amazon SageMaker AI 域中的所有用户配置文件都可以访问此域中的所有共享空间。

**[SageMaker Data Wrangler](data-wrangler.md)**  
在 SageMaker Studio 中导入、分析、准备和特征化数据。您可以将 Data Wrangler 集成到机器学习工作流中，以简化数据预处理和特征工程，只需少量甚至不需要编写代码。您还可以添加自己的 Python 脚本和转换来自定义数据准备工作流。

**[Data Wrangler 数据准备小部件](data-wrangler-interactively-prepare-data-notebook.md)**  
与您的数据进行交互、探索切实可行的见解并修复数据质量问题。

**[SageMaker Debugger](train-debugger.md)**  
在整个训练过程中检查训练参数和数据。自动检测常见错误并向用户发出警报，例如参数值变得太大或太小。

**[SageMaker Edge Manager](edge.md)**  
优化边缘设备的自定义模型，创建和管理队列，并在有效的运行时系统中运行模型。

**[SageMaker Experiments](experiments.md)**  
实验管理和跟踪。您可以使用跟踪的数据重新构建实验，在对等方进行的实验基础上逐步构建，并跟踪模型谱系以进行合规性和审核验证。

**[SageMaker Feature Store](feature-store.md)**  
特征和关联元数据的集中化存储，以便轻松发现和重用特征。您可以创建两种类型的存储，即在线存储和离线存储。在线存储可用于低延迟、实时推理使用案例，离线存储可用于训练和批量推断。

**[SageMaker Ground Truth](sms.md)**  
高质量的训练数据集，通过安排工作人员和使用机器学习来创建标注数据集。

**[SageMaker Ground Truth Plus](gtp.md)**  
一个功能齐全的数据标注功能，可创建高质量的训练数据集，而无需自行构建标注应用程序和管理标签人力。

**[SageMaker Inference Recommender](inference-recommender.md)**  
获取有关推理实例类型和配置的建议（例如实例计数、容器参数和模型优化），以便使用机器学习模型和工作负载。

**[推理影子测试](shadow-tests.md)**  
通过将模型服务基础设施的性能与当前部署的基础设施进行比较，评估对模型服务基础设施进行的任何更改。

**[SageMaker JumpStart](studio-jumpstart.md)**  
通过精心策划的一键式解决方案、示例笔记本和可部署的预训练模型来了解 SageMaker AI 的特性和功能。您还可以微调模型并进行部署。

**[SageMaker ML 任务流水线追踪功能](lineage-tracking.md)**  
跟踪机器学习工作流的流水线。

**[SageMaker 建模管线](pipelines.md)**  
创建和管理直接与 SageMaker AI 作业集成的机器学习管线。

**[SageMaker 模型卡](model-cards.md)**  
在一个位置记录有关机器学习模型的信息，以便在整个机器学习生命周期中简化管理和报告。

**[SageMaker 模型控制面板](model-dashboard.md)**  
账户中所有模型的预构建的可视化概览。模型控制面板集成了来自 SageMaker Model Monitor、转换作业、端点、谱系跟踪和 CloudWatch 的信息，以便您能够在一个统一的视图中访问高级模型信息并跟踪模型性能。

**[SageMaker Model Monitor](model-monitor.md)**  
监控和分析生产中的模型（端点），以检测数据偏差和模型质量偏差。

**[SageMaker 模型注册表](model-registry.md)**  
用于部署机器学习模型的版本控制、构件和任务流水线追踪功能、审批工作流和跨账户支持。

**[SageMaker Neo](neo.md)**  
训练机器学习模型一次，然后在云端和边缘的任何位置运行。

**[基于笔记本的工作流](notebook-auto-run.md)**  
将您的 SageMaker Studio 笔记本作为非交互式的计划作业运行。

**[预处理](processing-job.md)**  
分析和预处理数据，处理特征工程问题，并评估模型。

**[SageMaker 项目](sagemaker-projects.md)**  
使用 SageMaker 项目通过 CI/CD 创建端到端机器学习解决方案。

**[强化学习](reinforcement-learning.md)**  
代理通过其操作获得最大化的长期奖励。

**[SageMaker 角色管理器](role-manager.md)**  
管理员可以使用基于自定义和预配置的角色的 IAM 角色，为常见机器学习活动定义最低权限。

**[SageMaker 无服务器端点](serverless-endpoints.md)**  
用于托管机器学习模型的无服务器端点选项。自动横向缩减容量以提供端点流量。无需在端点上选择实例类型或管理扩展策略。

**[Studio Classic Git 扩展](studio-git-attach.md)**  
一个 Git 扩展，供您输入 Git 存储库的 URL、将其克隆到您的环境中、推送更改以及查看提交历史记录。

**[SageMaker Studio 笔记本](notebooks.md)**  
下一代 SageMaker 笔记本，包括 AWS IAM Identity Center (IAM Identity Center) 集成、快速启动时间和单击共享。

**[SageMaker Studio 笔记本和 Amazon EMR](studio-notebooks-emr-cluster.md)**  
直接从 SageMaker Studio 中轻松发现、连接、创建、终止和管理单个账户和跨账户配置的 Amazon EMR 集群。

**[SageMaker Training Compiler](training-compiler.md)**  
在 SageMaker AI 管理的可扩展的 GPU 实例上更快地训练深度学习模型。