本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# SageMaker JumpStart 预训练模型
<a name="studio-jumpstart"></a>

Amazon SageMaker JumpStart 为各种问题类型提供预训练的开源模型，以帮助您开始使用机器学习。在部署之前，您可以逐步训练和调整这些模型。 JumpStart 还提供了用于为常见用例设置基础架构的解决方案模板，以及用于通过 SageMaker AI 进行机器学习的可执行示例笔记本。

在更新后的 Studio 体验中，您可以通过模型登录页面部署、微调和评估来自热门模型中心的预训练模型。

您还可以通过 Amazon SageMaker Studio Classic 中的模型登录页面访问预训练模型、解决方案模板和示例。

以下步骤展示了如何使用亚马逊 SageMaker Studio 和 Amazon Studio Class SageMaker ic 访问 JumpStart 模型。

您也可以使用 SageMaker Python 软件开发工具包访问 JumpStart 模型。有关如何以编程方式使用 JumpStart 模型的信息，请参阅在[预训练模型中使用 SageMaker JumpStart 算法](https://sagemaker.readthedocs.io/en/stable/overview.html#use-sagemaker-jumpstart-algorithms-with-pretrained-models)。

## JumpStart 在工作室中打开
<a name="jumpstart-open-studio"></a>

在 Amazon SageMaker Studio 中，通过**主页**或左侧面板中的**演员**项目打开演员登录页面。这将打开**SageMaker 模型**登录页面，您可以在其中浏览中的模型 SageMakerPublicHub、Private Hubs 或 Curated Hubs 中的模型以及自定义模型。
+ 在**主页**上，在**启动**模型自定义工作流程窗格中选择浏览**模型**。
+ 从左侧面板的菜单中导航到**模型**节点。

有关开始使用 Amazon SageMaker Studio 的更多信息，请参阅[亚马逊 SageMaker Studio](studio-updated.md)。

![\[Amazon SageMaker Studio 界面可以访问 JumpStart。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-studio-nav.png)


## JumpStart 在工作室中使用
<a name="jumpstart-use-studio"></a>

**重要**  
在下载或使用第三方内容之前：您有责任查看和遵守任何适用的许可证条款，并确保您的使用案例可以接受这些条款。  
2026 年 3 月 13 日，我们从不同地区的 JumpStart 目录中删除了几款车型，以提高可发现性，并专注于高质量、支持良好的选项。除名模型的现有端点将保持正常运行。有关已除名的开放式车型的许可信息，请参阅相应型号的 Hugging Face 清单。

在 Studio 的**SageMaker 模型**登录页面上，您可以浏览专有和公开模型提供商提供的 JumpStart 基础模型。您可以直接搜索模型，按特定模型提供商进行筛选，或者根据提供的用例和操作列表进行筛选。

![\[亚马逊 SageMaker Studio Models 登录页面。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-studio-landing.png)


选择一个模型，查看其模型详情卡。在模型详细信息卡的右上角，选择**微调**、**自定义**、**部署**或**评估**，分别开始微调、部署或评估工作流程。请注意，并非所有型号都可用于定制、微调或评估。有关这些选项的更多信息，请参阅 [在 Studio 中使用基础模型](jumpstart-foundation-models-use-studio-updated.md)。

您还可以通过**专用选项卡访问 “专用” 或 “策划中心**” 模型。它们的工作原理与 JumpStart 基础模型完全一样，单击模型卡片将带您进入详细信息页面，那里有可用的操作。

此外，选择 “**我的模型**” 以访问经过微调和注册的模型。自定义作业的输出可以在此处的 “**已记录**的模型” 选项卡下找到。也可以在这里找到@@ **可部署**的模型。

## JumpStart 在 Studio 经典版中打开并使用
<a name="jumpstart-open-use"></a>

以下各节提供了有关如何通过 Amazon SageMaker Studio Classic 用户界面打开、使用和管理 JumpStart 的信息。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

### JumpStart 在经典工作室中打开
<a name="jumpstart-open"></a>

**在 Amazon SageMaker Studio Classic 中，通过左侧面板上的**主页或主页**菜单打开 JumpStart 登录页面。**
+ 在**主页**上，您可以：
  + **JumpStart**在 “**预构建和自动解决方案**” 窗格中进行选择。这将打开**SageMaker JumpStart**登录页面。
  + 直接在**SageMaker JumpStart**登录页面中选择一个模型，或者选择 “**全部浏览**” 选项以查看可用的解决方案或特定类型的模型。
+ 在左侧面板的**主页**菜单中，您可以：
  + 导航到**SageMaker JumpStart**节点，然后选择 “**模型”、“笔记本”、“解决方案**”。这将打开**SageMaker JumpStart**登录页面。
  + 导航到该**JumpStart**节点，然后选择**已启动的 JumpStart 资源**。

    **已启动的 JumpStart 资产**页面列出了您当前启动的解决方案、已部署的模型端点以及使用创建的训练作业 JumpStart。您可以通过单击该选项卡右上角的 “**浏览 JumpStart**” 按钮从该选项卡访问 JumpStart 登录页面。

 JumpStart 登录页面列出了可用的 end-to-end机器学习解决方案、预训练模型和示例笔记本。在任何单独的解决方案或模型页面中，您可以选择选项卡右上角的 “**浏览**” JumpStart 按钮 (![\[Button labeled "Browse JumpStart" with an icon indicating a browsing action.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-browse-button.png)) 返回该**SageMaker JumpStart**页面。

![\[SageMaker Studio Classic 界面可 JumpStart访问\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-assets.png)


**重要**  
在下载或使用第三方内容之前：您有责任查看和遵守任何适用的许可证条款，并确保您的使用案例可以接受这些条款。  
2026 年 3 月 13 日，我们从不同地区的 JumpStart 目录中删除了几款车型，以提高可发现性，并专注于高质量、支持良好的选项。除名模型的现有端点将保持正常运行。有关已除名的开放式车型的许可信息，请参阅相应型号的 Hugging Face 清单。

### JumpStart 在经典工作室中使用
<a name="jumpstart-using"></a>

在**SageMaker JumpStart**登录页面上，您可以浏览解决方案、型号、笔记本和其他资源。

![\[SageMaker Studio 经典版 JumpStart 登录页面。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-use.png)


您可以使用搜索栏或浏览每个类别来查找 JumpStart 资源。使用选项卡按类别筛选可用的解决方案：
+  **解决方案** — 只需一个步骤，即可启动将 SageMaker AI 与其他解决方案联系起来的全面机器学习解决方案 AWS 服务。选择**浏览所有解决方案**以查看所有可用的解决方案。
+  **资源** – 使用示例笔记本、博客和视频教程来了解和开始处理您的问题类型。
  +  **博客** – 阅读机器学习专家提供的详细信息和解决方案。
  +  **视频教程** — 观看来自机器学习专家的 SageMaker AI 功能和机器学习用例的视频教程。
  +  **示例笔记本** — 运行使用 SageMaker AI 功能（例如 Spot Instance 训练和实验）的示例笔记本，对各种模型类型和用例进行实验。
+  **数据类型** – 按数据类型（例如，视觉、文本、表格、音频、文本生成）查找模型。选择**浏览所有模型**以查看所有可用的模型。
+  **ML 任务** – 按问题类型（例如，图像分类、图像嵌入、对象检测、文本生成）查找模型。选择**浏览所有模型**以查看所有可用的模型。
+  **笔记本电脑** — 查找在多种型号类型和用例中使用 SageMaker AI 功能的示例笔记本电脑。选择**浏览所有笔记本**以查看所有可用的示例笔记本。
+  **框架** — 按框架查找模型（例如，， PyTorch TensorFlow，Hugging Face）。

### 使用 Stud JumpStart io 经典版管理
<a name="jumpstart-managing"></a>

在左侧面板**的主**页菜单中，导航到 **SageMaker JumpStart**，然后选择已**启动的 JumpStart 资源**，以列出您当前启动的解决方案、部署的模型端点以及使用创建的训练作业 JumpStart。

**Topics**
+ [JumpStart 在工作室中打开](#jumpstart-open-studio)
+ [JumpStart 在工作室中使用](#jumpstart-use-studio)
+ [JumpStart 在 Studio 经典版中打开并使用](#jumpstart-open-use)
+ [亚马逊 SageMaker JumpStart 基金会模型](jumpstart-foundation-models.md)
+ [用于基础模型访问控制的私人策划中心 JumpStart](jumpstart-curated-hubs.md)
+ [Studio 经典版 SageMaker JumpStart 中的亚马逊](jumpstart-studio-classic.md)

# 亚马逊 SageMaker JumpStart 基金会模型
<a name="jumpstart-foundation-models"></a>

Amaz state-of-the-art on SageMaker JumpStart 为内容编写、代码生成、问题解答、文案撰写、摘要、分类、信息检索等用例提供基础模型。使用 JumpStart 基础模型构建自己的生成式 AI 解决方案，并将自定义解决方案与其他 SageMaker AI 功能集成。有关更多信息，请参阅 [Amazon 入门 SageMaker JumpStart](https://aws.amazon.com/sagemaker/jumpstart/getting-started/)。

基础模型是一种大型的预训练模型，可进行调整以用于许多下游任务，通常用作开发更专业化模型的起点。基础模型的示例包括 ma LLa -3-70b、BLOOM 176B、FLAN-T5 XL 或 GPT-J 6B，它们已针对大量文本数据进行了预训练，可以针对特定的语言任务进行微调。

Amaz SageMaker JumpStart on 载入并维护公开可用的基础模型，供您访问、自定义和集成到您的机器学习生命周期中。有关更多信息，请参阅 [公开可用的基础模型](jumpstart-foundation-models-latest.md#jumpstart-foundation-models-latest-publicly-available)。Amazon SageMaker JumpStart 还包括来自第三方提供商的专有基础模型。有关更多信息，请参阅 [专有基础模型](jumpstart-foundation-models-latest.md#jumpstart-foundation-models-latest-proprietary)。

要开始探索和尝试可用模型，请参阅[JumpStart 基础模型用法](jumpstart-foundation-models-use.md)。所有基础模型均可通过编程方式与 SageMaker Python SDK 一起使用。有关更多信息，请参阅 [在 SageMaker Python SDK 中使用基础模型](jumpstart-foundation-models-use-python-sdk.md)。

有关选择模型时注意事项的更多信息，请参阅[示范源和许可协议](jumpstart-foundation-models-choose.md)。

有关自定义和微调基础模型的具体信息，请参阅[基础模型自定义](jumpstart-foundation-models-customize.md)。

有关基础模型的更多一般信息，请参阅白皮书[关于基础模型的机遇和风险](https://arxiv.org/abs/2108.07258)。

**Topics**
+ [可用的基础模型](jumpstart-foundation-models-latest.md)
+ [JumpStart 基础模型用法](jumpstart-foundation-models-use.md)
+ [示范源和许可协议](jumpstart-foundation-models-choose.md)
+ [基础模型自定义](jumpstart-foundation-models-customize.md)
+ [评估 Studio 中的文本生成基础模型](jumpstart-foundation-models-evaluate.md)
+ [示例笔记本](jumpstart-foundation-models-example-notebooks.md)

# 可用的基础模型
<a name="jumpstart-foundation-models-latest"></a>

Amazon SageMaker JumpStart 提供 state-of-the-art内置的公开可用和专有基础模型，用于自定义并集成到您的生成式 AI 工作流程中。

## 公开可用的基础模型
<a name="jumpstart-foundation-models-latest-publicly-available"></a>

Amaz SageMaker JumpStart on 载入并维护来自第三方来源的开源基础模型。要开始使用其中一种公开可用的模型，请查看[JumpStart 基础模型用法](jumpstart-foundation-models-use.md)或浏览可用的[示例笔记本](jumpstart-foundation-models-example-notebooks.md)之一。在公开可用模型的给定示例笔记本中，尝试切换模型 ID，以实验同一模型系列中的不同模型。

有关使用软件开发 SageMaker Python工具包部署公开 JumpStart 基础模型的模型 IDs 和资源的更多信息，请参阅[在 SageMaker Python SDK 中使用基础模型](jumpstart-foundation-models-use-python-sdk.md)。

按照定义，基础模型可以根据多种下游任务进行调整。基础模型在大量的通用领域数据上进行训练，可以针对多种使用案例实施相同的模型或进行自定义。选择基础模型时，首先要定义一项特定任务，例如文本生成或映像生成。

### 公开可用的时间序列预测模型
<a name="jumpstart-foundation-models-choose-task-time-series-forecasting"></a>

时间序列预测模型旨在分析和预测一段时间内的序列数据。这些模型可应用于金融、天气预报或能源需求预测等多个领域。Chronos 模型专为时间序列预测任务定制，可根据历史数据规律进行准确预测。


| 模型名称 | 模型 ID | 模型来源 | 可微调 | 
| --- | --- | --- | --- | 
| Chronos T5 Small | autogluon-forecasting-chronos-t5-small | Amazon | 否 | 
| Chronos T5 Base | autogluon-forecasting-chronos-t5-base | Amazon | 否 | 
| Chronos T5 Large | autogluon-forecasting-chronos-t5-large | Amazon | 否 | 
| Chronos-Bolt Small | autogluon-forecasting-chronos-bolt-small | Amazon |  否  | 
| Chronos-Bolt Base | autogluon-forecasting-chronos-bolt-base | Amazon |  否  | 

### 公开可用的文本生成模型
<a name="jumpstart-foundation-models-choose-task-text-generation"></a>

文本生成基础模型可用于多种下游任务，包括文本摘要、文本分类、问题回答、长篇内容生成、简短文案写作、信息提取等。

要探索最新的文本生成 JumpStart 基础模型，请使用 [Amazon 入门 SageMaker JumpStart](https://aws.amazon.com/sagemaker/jumpstart/getting-started/?sagemaker-jumpstart-cards.sort-by=item.additionalFields.priority&sagemaker-jumpstart-cards.sort-order=asc&awsf.sagemaker-jumpstart-filter-product-type=product-type%23foundation-model&awsf.sagemaker-jumpstart-filter-text=ml-task-type%23text-generation&awsf.sagemaker-jumpstart-filter-vision=*all&awsf.sagemaker-jumpstart-filter-tabular=*all&awsf.sagemaker-jumpstart-filter-audio-tasks=*all&awsf.sagemaker-jumpstart-filter-multimodal=*all&awsf.sagemaker-jumpstart-filter-RL=*all&awsm.page-sagemaker-jumpstart-cards=1)产品描述页面上的 “**文本生成**” 筛选器。您也可以直接在 Amazon SageMaker Studio 用户界面或 SageMaker Studio Classic 用户界面中根据任务探索基础模型。只有一部分公开可用的文本生成模型可供微调。 JumpStart有关更多信息，请参阅 [在 Amazon SageMaker Studio 经典版中使用基础模型](jumpstart-foundation-models-use-studio.md)。

### 公开可用的映像生成模型
<a name="jumpstart-foundation-models-choose-task-image-generation"></a>

JumpStart 提供了各种各样的 Stable Diffusion 图像生成基础模型，包括来自 Stability AI 的基础模型以及用于特定 text-to-image任务的预训练模型。Hugging Face如果你需要微调 text-to-image基础模型，你可以使用 Stability AI 中的 Stable Diffusion 2.1 基础版。如果您想探索已经接受过特定美术风格训练的模型，可以Hugging Face直接在 Amazon SageMaker Studio 用户界面或 SageMaker Studio Classic 用户界面中探索众多第三方模型中的一个。

要探索最新的图片生成 JumpStart 基础模型，请使用 [Amazon 入门 SageMaker JumpStart](https://aws.amazon.com/sagemaker/jumpstart/getting-started/?sagemaker-jumpstart-cards.sort-by=item.additionalFields.priority&sagemaker-jumpstart-cards.sort-order=asc&awsf.sagemaker-jumpstart-filter-product-type=product-type%23foundation-model&awsf.sagemaker-jumpstart-filter-text=*all&awsf.sagemaker-jumpstart-filter-vision=*all&awsf.sagemaker-jumpstart-filter-tabular=*all&awsf.sagemaker-jumpstart-filter-audio-tasks=*all&awsf.sagemaker-jumpstart-filter-multimodal=ml-task-type%23txt2img&awsf.sagemaker-jumpstart-filter-RL=*all&awsm.page-sagemaker-jumpstart-cards=1)产品描述页面上的 “**文字转图片**” 筛选器。要开始使用您选择 text-to-image的基础模型，请参阅[JumpStart 基础模型用法](jumpstart-foundation-models-use.md)。

## 专有基础模型
<a name="jumpstart-foundation-models-latest-proprietary"></a>

亚马逊允许访问第三方 SageMaker JumpStart 提供商提供的专有基础模型，例如[AI21 实验室](https://www.ai21.com/)、[Coher](https://cohere.com/) e 和。[LightOn](https://www.lighton.ai/)

要开始使用这些专有模型之一，请参阅[JumpStart 基础模型用法](jumpstart-foundation-models-use.md)。要使用专有基础模型，您必须先在 AWS Marketplace中订阅该模型。订阅模型后，在 Studio 或 SageMaker Studio Classic 中找到基础模型。有关更多信息，请参阅 [SageMaker JumpStart 预训练模型](studio-jumpstart.md)。

要探索适用于各种用例的最新专有基础模型，请参阅 [Amazon 入门 SageMaker JumpStart](https://aws.amazon.com/sagemaker/jumpstart/getting-started/?sagemaker-jumpstart-cards.sort-by=item.additionalFields.priority&sagemaker-jumpstart-cards.sort-order=asc&awsf.sagemaker-jumpstart-filter-product-type=product-type%23foundation-model&awsf.sagemaker-jumpstart-filter-text=*all&awsf.sagemaker-jumpstart-filter-vision=*all&awsf.sagemaker-jumpstart-filter-tabular=*all&awsf.sagemaker-jumpstart-filter-audio-tasks=*all&awsf.sagemaker-jumpstart-filter-multimodal=*all&awsf.sagemaker-jumpstart-filter-RL=*all&sagemaker-jumpstart-cards.q=proprietary&sagemaker-jumpstart-cards.q_operator=AND)。

# JumpStart 基础模型用法
<a name="jumpstart-foundation-models-use"></a>

通过 Amazon Studio 或 Amazon SageMaker Studio Class SageMaker ic 选择、训练或部署 JumpStart 基础模型，通过 SageMaker Python软件开发工具包以编程方式使用 JumpStart 基础模型，或者直接通过 SageMaker AI 控制台发现基础模型。

**Topics**
+ [在 Studio 中使用基础模型](jumpstart-foundation-models-use-studio-updated.md)
+ [在 Amazon SageMaker Studio 经典版中使用基础模型](jumpstart-foundation-models-use-studio.md)
+ [在 SageMaker Python SDK 中使用基础模型](jumpstart-foundation-models-use-python-sdk.md)
+ [在 SageMaker AI 控制台中探索基础模型](jumpstart-foundation-models-use-console.md)

# 在 Studio 中使用基础模型
<a name="jumpstart-foundation-models-use-studio-updated"></a>

Amazon SageMaker Studio 允许您直接通过 Studio 用户界面微调、部署和评估公开和专有 JumpStart 基础模型。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用更新后的 Studio 体验。有关使用 Studio Classic 应用程序的信息，请参阅 [亚马逊 SageMaker Studio 经典版](studio.md)。

要开始使用，请导航至 Amazon SageMaker Studio 的 JumpStart 登录页面。您可以从**主页**页面或左侧面板菜单访问它。在**JumpStart**登录页面上，您可以浏览公开和专有模型提供商提供的模型中心，并搜索模型。

在每个模型中心中，您可以按**最喜欢次数**、**下载次数最多**、**最近更新次数**对模型进行排序，也可以按任务对模型进行筛选。选择一个模型，查看其详情卡。在模型详情卡上，您可以根据可用选项选择**微调**、**部署**或**评估**模型。请注意，并非所有模型都可用于微调或评估。

有关开始使用 Amazon SageMaker Studio 的更多信息，请参阅[亚马逊 SageMaker Studio](studio-updated.md)。

**Topics**
+ [在 Studio 中微调模型](jumpstart-foundation-models-use-studio-updated-fine-tune.md)
+ [在 Studio 中部署模型](jumpstart-foundation-models-use-studio-updated-deploy.md)
+ [在 Studio 中评估模型](jumpstart-foundation-models-use-studio-updated-evaluate.md)
+ [在 Amazon Bedrock 中使用你的 SageMaker JumpStart 模型](jumpstart-foundation-models-use-studio-updated-register-bedrock.md)

# 在 Studio 中微调模型
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune"></a>

微调过程在新数据集上训练已经预训练的模型，而无需从头开始训练。这个过程也称为转移学习，可以使用较小数据集和较短的训练时间生成准确模型。要微调 JumpStart基础模型，请导航到 Studio 用户界面中的模型详细信息卡。有关如何在 Studio JumpStart 中打开的更多信息，请参阅[JumpStart 在工作室中打开](studio-jumpstart.md#jumpstart-open-studio)。导航到您选择的模型详情卡后，选择右上角的**训练**。请注意，并非所有模型都有微调功能。

**重要**  
有些基础模型要求在微调前明确接受最终用户许可协议 (EULA)。有关更多信息，请参阅 [亚马逊 SageMaker Studio 接受最终用户许可协议](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula-studio)。

## 模型设置
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune-model"></a>

在 Amazon SageMaker Studio 中使用预训练 JumpStart 的基础模型时，默认情况下会填充**模型构件位置（Amazon S3 URI）**。要编辑默认的 Amazon S3 URI，请选择**输入模型构件位置**。并非所有模型都支持更改模型构件的位置。

## 数据设置
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune-data"></a>

在**数据**字段中，提供指向您的训练数据集位置的 Amazon S3 URI。默认的 Amazon S3 URI 指向一个示例训练数据集。要编辑默认的 Amazon S3 URI，请选择**输入训练数据集**并更改 URI。请务必查看 Amazon SageMaker Studio 中的模型详情卡，了解有关格式化训练数据的信息。

## 超参数
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune-hyperparameters"></a>

您可以自定义用于微调模型的训练作业的超参数。每个可微调模型的可用超参数因模型而异。

以下超参数在模型中很常见：
+ **纪元** – 一个纪元是遍历整个数据集的一个周期。通过多个时间间隔完成一个批次，通过多个批次最终完成一个纪元。系统运行多个纪元，直到模型的准确性达到可接受的水平，或者说当错误率降至可接受的水平以下时。
+ **学习率** – 各个纪元之间应该变化的值的数量。随着模型的优化，其内部权重将被调整，并检查错误率以确定模型是否有所改善。典型的学习率为 0.1 或 0.01，其中 0.01 是一个小得多的调整，可能会导致训练需要很长时间才能收敛，而 0.1 则要大得多，可能会导致训练过度。这是在训练模型时可能会调整的主要超参数之一。请注意，对于文本模型，小得多的学习率（BERT 为 5e-5）可以生成更准确的模型。
+ **Batch siz** e — 要从数据集中为每个间隔选择的记录数量，然后发送到 GPUs 进行训练。

查看 Studio 用户界面中模型详情卡的工具提示和其他信息，了解所选模型特定超参数的更多信息。

有关可用超参数的更多信息，请参阅 [通常支持的微调超参数](jumpstart-foundation-models-fine-tuning.md#jumpstart-foundation-models-fine-tuning-hyperparameters)。

## 部署
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune-instance"></a>

为训练作业指定训练实例类型和输出构件位置。在微调 Studio 用户界面中，您只能选择与所选模型兼容的实例。默认输出项目位置是 SageMaker AI 默认存储桶。要更改输出构件位置，请选择**输入输出构件位置**，然后更改 Amazon S3 URI。

## 安全性
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune-security"></a>

指定用于训练任务的安全设置，包括 A SageMaker I 用于训练模型的 IAM 角色、您的训练作业是否应连接到虚拟私有云 (VPC)，以及用于保护数据的任何加密密钥。

## 附加信息
<a name="jumpstart-foundation-models-use-studio-updated-fine-tune-additional-info"></a>

在**其他信息**字段中，您可以编辑训练作业名称。您还可以添加和删除键值对形式的标签，以帮助组织和分类您的微调训练作业。

提供微调配置信息后，选择**提交**。如果您选择微调的预训练基础模型要求在训练前明确同意最终用户许可协议 (EULA)，则会在弹出窗口中提供 EULA。要接受 EULA 的条款，请选择**接受**。在下载或使用模型之前，您有责任查看和遵守任何适用的许可证条款，并确保您的使用场景可以接受这些条款。

# 在 Studio 中部署模型
<a name="jumpstart-foundation-models-use-studio-updated-deploy"></a>

要部署 JumpStart 基础模型，请导航到 Studio 用户界面中的模型详细信息卡。有关如何在 Studio JumpStart 中打开的更多信息，请参阅[JumpStart 在工作室中打开](studio-jumpstart.md#jumpstart-open-studio)。导航到所选模型的详情页面后，在 Studio 用户界面的右上角选择**部署**。然后，按照[使用 SageMaker Studio 部署模型中的步骤进行](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints-deploy-models.html#deploy-models-studio)操作。

**重要**  
一些基础模型在部署之前，要求明确接受最终用户许可协议 (EULA)。有关更多信息，请参阅 [亚马逊 SageMaker Studio 接受最终用户许可协议](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula-studio)。

# 在 Studio 中评估模型
<a name="jumpstart-foundation-models-use-studio-updated-evaluate"></a>

亚马逊 SageMaker JumpStart 已与 Studio 中的 Cl SageMaker arify 基础模型评估 (FME) 集成。如果 JumpStart 模型具有内置评估功能，则可以在 JumpStart Studio 用户界面中模型详情页面的右上角选择**评估**。有关更多信息，请参阅[评估基础模型](https://docs.aws.amazon.com/sagemaker/latest/dg/jumpstart-foundation-models-evaluate.html)。

# 在 Amazon Bedrock 中使用你的 SageMaker JumpStart 模型
<a name="jumpstart-foundation-models-use-studio-updated-register-bedrock"></a>

您可以将已从亚马逊部署的模型注册 SageMaker JumpStart 到 Amazon Bedrock。您可通过 Amazon Bedrock，在多个端点后面托管模型。您还可以使用 Amazon Bedrock 特征，例如座席和知识库。有关使用 Amazon Bedrock 模型的更多信息，请参阅 [https://docs.aws.amazon.com/bedrock/latest/userguide/amazon-bedrock-marketplace.html](https://docs.aws.amazon.com/bedrock/latest/userguide/amazon-bedrock-marketplace.html)。

**重要**  
要将您的模型迁移到 Amazon Bedrock，我们建议将[AmazonBedrockFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonBedrockFullAccess.html)策略附加到您的 IAM 角色。如果无法附加托管策略，请确保您的 IAM 角色拥有下列权限：  

****  

```
{
    	"Version":"2012-10-17",		 	 	 
    	"Statement": [
    		{
    			"Sid": "BedrockAll",
    			"Effect": "Allow",
    			"Action": [
    				"bedrock:*"
    			],
    			"Resource": "*"
    		},
    		{
    			"Sid": "DescribeKey",
    			"Effect": "Allow",
    			"Action": [
    				"kms:DescribeKey"
    			],
    			"Resource": "arn:*:kms:*:::*"
    		},
    		{
    			"Sid": "APIsWithAllResourceAccess",
    			"Effect": "Allow",
    			"Action": [
    				"iam:ListRoles",
    				"ec2:DescribeVpcs",
    				"ec2:DescribeSubnets",
    				"ec2:DescribeSecurityGroups"
    			],
    			"Resource": "*"
    		},
    		{
    			"Sid": "MarketplaceModelEndpointMutatingAPIs",
    			"Effect": "Allow",
    			"Action": [
    				"sagemaker:CreateEndpoint",
    				"sagemaker:CreateEndpointConfig",
    				"sagemaker:CreateModel",
    				"sagemaker:CreateInferenceComponent",
    				"sagemaker:DeleteInferenceComponent",
    				"sagemaker:DeleteEndpoint",
    				"sagemaker:UpdateEndpoint"
    			],
    			"Resource": [
    				"arn:aws:sagemaker:*:*:endpoint/*",
    				"arn:aws:sagemaker:*:*:endpoint-config/*",
    				"arn:aws:sagemaker:*:*:model/*"
    			],
    			"Condition": {
    				"StringEquals": {
    					"aws:CalledViaLast": "bedrock.amazonaws.com"
    				}
    			}
    		},
    		{
    			"Sid": "BedrockEndpointTaggingOperations",
    			"Effect": "Allow",
    			"Action": [
    				"sagemaker:AddTags",
    				"sagemaker:DeleteTags"
    			],
    			"Resource": [
    				"arn:aws:sagemaker:*:*:endpoint/*",
    				"arn:aws:sagemaker:*:*:endpoint-config/*",
    				"arn:aws:sagemaker:*:*:model/*"
    			]
    		},
    		{
    			"Sid": "MarketplaceModelEndpointNonMutatingAPIs",
    			"Effect": "Allow",
    			"Action": [
    				"sagemaker:DescribeEndpoint",
    				"sagemaker:DescribeEndpointConfig",
    				"sagemaker:DescribeModel",
    				"sagemaker:DescribeInferenceComponent",
    				"sagemaker:ListEndpoints",
    				"sagemaker:ListTags"
    			],
    			"Resource": [
    				"arn:aws:sagemaker:*:*:endpoint/*",
    				"arn:aws:sagemaker:*:*:endpoint-config/*",
    				"arn:aws:sagemaker:*:*:model/*"
    			],
    			"Condition": {
    				"StringEquals": {
    					"aws:CalledViaLast": "bedrock.amazonaws.com"
    				}
    			}
    		},
    		{
    			"Sid": "BedrockEndpointInvokingOperations",
    			"Effect": "Allow",
    			"Action": [
    				"sagemaker:InvokeEndpoint",
    				"sagemaker:InvokeEndpointWithResponseStream"
    			],
    			"Resource": [
    				"arn:aws:sagemaker:*:*:endpoint/*"
    			],
    			"Condition": {
    				"StringEquals": {
    					"aws:CalledViaLast": "bedrock.amazonaws.com"
    				}
    			}
    		},
    		{
    			"Sid": "DiscoveringMarketplaceModel",
    			"Effect": "Allow",
    			"Action": [
    				"sagemaker:DescribeHubContent"
    			],
    			"Resource": [
    				"arn:aws:sagemaker:*:aws:hub-content/SageMakerPublicHub/Model/*",
    				"arn:aws:sagemaker:*:aws:hub/SageMakerPublicHub"
    			]
    		},
    		{
    			"Sid": "AllowMarketplaceModelsListing",
    			"Effect": "Allow",
    			"Action": [
    				"sagemaker:ListHubContents"
    			],
    			"Resource": "arn:aws:sagemaker:*:aws:hub/SageMakerPublicHub"
    		},
    		{
    			"Sid": "RetrieveSubscribedMarketplaceLicenses",
    			"Effect": "Allow",
    			"Action": [
    				"license-manager:ListReceivedLicenses"
    			],
    			"Resource": [
    				"*"
    			]
    		},
    		{
    			"Sid": "PassRoleToSageMaker",
    			"Effect": "Allow",
    			"Action": [
    				"iam:PassRole"
    			],
    			"Resource": [
    				"arn:aws:iam::*:role/*Sagemaker*ForBedrock*"
    			],
    			"Condition": {
    				"StringEquals": {
    					"iam:PassedToService": [
    						"sagemaker.amazonaws.com",
    						"bedrock.amazonaws.com"
    					]
    				}
    			}
    		},
    		{
    			"Sid": "PassRoleToBedrock",
    			"Effect": "Allow",
    			"Action": [
    				"iam:PassRole"
    			],
    			"Resource": "arn:aws:iam::*:role/*AmazonBedrock*",
    			"Condition": {
    				"StringEquals": {
    					"iam:PassedToService": [
    						"bedrock.amazonaws.com"
    					]
    				}
    			}
    		}
    	]
    }
```
Amazon Bedrock Full Access 策略仅提供对 Amazon Bedrock API 的权限。要在中使用 Amazon Bedrock AWS 管理控制台，您的 IAM 角色还必须具有以下权限：  

```
{
        "Sid": "AllowConsoleS3AccessForBedrockMarketplace",
        "Effect": "Allow",
        "Action": [
          "s3:GetObject",
          "s3:GetBucketCORS",
          "s3:ListBucket",
          "s3:ListBucketVersions",
          "s3:GetBucketLocation"
        ],
        "Resource": "*"
    }
```
如果您要自行编写策略，则必须附上支持对资源执行 Amazon Bedrock Marketplace 操作的策略声明。例如，以下策略支持 Amazon Bedrock 对已部署到端点的模型使用 `InvokeModel` 操作。  

****  

```
{
    
        "Version":"2012-10-17",		 	 	 
        "Statement": [
            {
                "Sid": "BedrockAll",
                "Effect": "Allow",
                "Action": [
                    "bedrock:InvokeModel"
                ],
                "Resource": [
                "arn:aws:bedrock:us-east-1:111122223333:marketplace/model-endpoint/all-access"
                ]
            },
            {
                "Sid": "VisualEditor1",
                "Effect": "Allow",
                "Action": ["sagemaker:InvokeEndpoint"],
                "Resource": "arn:aws:sagemaker:us-east-1:111122223333:endpoint/*",
                "Condition": {
                    "StringEquals": {
                        "aws:ResourceTag/project": "example-project-id",
                        "aws:CalledViaLast": "bedrock.amazonaws.com"
                    }
                }
            }
        ]
    
}
```

部署模型后，您可能就能够在 Amazon Bedrock 中使用该模型了。要查看是否可以在 Amazon Bedrock 中使用该模型，请导航至 Studio 用户界面中的模型详情卡。如果模型卡片上写着 **Bedrock 就绪**，则可以在 Amazon Bedrock 中注册该模型。

**重要**  
默认情况下，Amazon SageMaker JumpStart 会禁用您部署的模型的网络访问权限。如果您启用了网络访问权限，则将无法在 Amazon Bedrock 中使用该模型。如果您想在 Amazon Bedrock 中使用该模型，则必须在禁用网络访问权限的情况下重新部署该模型。

要在 Amazon Bedrock 中使用该模型，请导航至**端点详细信息**页面，然后在 Studio 用户界面右上角选择**配合 Bedrock 使用**。看到弹出窗口后，选择**注册到 Bedrock**。

# 在 Amazon SageMaker Studio 经典版中使用基础模型
<a name="jumpstart-foundation-models-use-studio"></a>

您可以通过 Studio Classic 用户界面微调和部署公开和专有 JumpStart基础模型。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

要通过 Studio Classic 开始使用，请参阅 [推出亚马逊 SageMaker Studio 经典版](studio-launch.md)。

 ![\[JumpStart foundation models available in Amazon SageMaker Studio Classic.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-fm-studio.png) 

打开 Amazon SageMaker Studio Classic 后**，在导航窗格的 SageMaker JumpStart 部分选择型号、笔记本电脑、解决方案**。然后，根据您的使用案例，向下滚动以找到**基础模型：文本生成**或**基础模型：图像生成**部分。

您可以在建议的基础模型卡片上选择**查看模型**，也可以选择**浏览所有模型**以查看所有可用于文本生成或图像生成的基础模型。如果您选择查看所有可用模型，则可以按任务、数据类型、内容类型或框架进一步筛选可用模型。您还可以直接在**搜索栏**中搜索模型名称。如果您需要有关选择模型的指导，请参阅[可用的基础模型](jumpstart-foundation-models-latest.md)。

**重要**  
某些基础模型要求明确接受最终用户许可协议 (EULA)。有关更多信息，请参阅 [亚马逊 SageMaker Studio 接受最终用户许可协议](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula-studio)。

当您在 Studio Classic 中为所选基础模型选择了**查看模型**后，可以部署该模型。有关更多信息，请参阅 [部署模型](jumpstart-deploy.md)。

您也可以选择**在笔记本中运行**部分中的**打开笔记本**，直接在 Studio Classic 中运行基础模型的示例笔记本。

**注意**  
要在 Studio Classic 中部署专有基础模型，您必须先在 AWS Marketplace中订阅该模型。该 AWS Marketplace 链接在 Studio Classic 中的相关示例笔记本中提供。

如果模型可以微调，您也可以对模型进行微调。有关更多信息，请参阅 [微调模型](jumpstart-fine-tune.md)。有关哪些 JumpStart 基础模型可以微调的列表，请参阅。[用于微调的基础模型和超参数](jumpstart-foundation-models-fine-tuning.md)

# 在 SageMaker Python SDK 中使用基础模型
<a name="jumpstart-foundation-models-use-python-sdk"></a>

所有 JumpStart 基础模型均可用于使用 SageMaker Python SDK 进行编程部署。

要部署公开可用的基础模型，您可以使用其模型 ID。您可以在[带有预训练模型表 IDs 的内置算法中找到所有公开基础模型的模型](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html)。在**搜索**栏中搜索基础模型名称。使用**显示条目**下拉列表或分页控件浏览可用的模型。

在 AWS Marketplace中订阅模型后，必须使用模型软件包信息部署专有模型。

您可以在中找到 JumpStart 可用型号的列表[可用的基础模型](jumpstart-foundation-models-latest.md)。

**重要**  
某些基础模型要求明确接受最终用户许可协议 (EULA)。有关更多信息，请参阅 [使用 SDK 接受最终用户许可协议 SageMaker Python](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula-python-sdk)。

下面几节将介绍如何使用 `JumpStartEstimator` 类微调公开可用的基础模型，使用 `JumpStartModel` 类部署公开可用的基础模型，以及使用 `ModelPackage` 类部署专有基础模型。

**Topics**
+ [使用 `JumpStartEstimator` 类微调公开可用的基础模型](jumpstart-foundation-models-use-python-sdk-estimator-class.md)
+ [使用 `JumpStartModel` 类部署公开可用的基础模型](jumpstart-foundation-models-use-python-sdk-model-class.md)
+ [使用 `ModelPackage` 类部署专有基础模型](jumpstart-foundation-models-use-python-sdk-proprietary.md)

# 使用 `JumpStartEstimator` 类微调公开可用的基础模型
<a name="jumpstart-foundation-models-use-python-sdk-estimator-class"></a>

**注意**  
有关在私有策管中心微调基础模型的说明，请参阅 [微调策管中心模型](jumpstart-curated-hubs-fine-tune.md)。

使用 SDK，您只需几行代码即可对内置算法或预训练模型进行微调。 SageMaker Python

1. 首先，在[内置算法与预训练模型表](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html)中找到所选模型的模型 ID。

1. 使用模型 ID 将您的训练作业定义为 JumpStart估算器。

   ```
   from sagemaker.jumpstart.estimator import JumpStartEstimator
   
   model_id = "huggingface-textgeneration1-gpt-j-6b"
   estimator = JumpStartEstimator(model_id=model_id)
   ```

1. 在模型上运行 `estimator.fit()`，指向用于微调的训练数据。

   ```
   estimator.fit(
       {"train": training_dataset_s3_path, "validation": validation_dataset_s3_path}
   )
   ```

1. 然后，使用 `deploy` 方法自动部署模型进行推理。在此示例中，我们使用 Hugging Face 的 GPT-J 6B 模型。

   ```
   predictor = estimator.deploy()
   ```

1. 然后，您就可以使用 `predict` 方法对已部署的模型进行推理。

   ```
   question = "What is Southern California often abbreviated as?"
   response = predictor.predict(question)
   print(response)
   ```

**注意**  
此示例使用基础模型 GPT-J 6B，该模型适用于各种文本生成使用场景，包括问题解答、命名实体识别、摘要等。有关模型使用场景的更多信息，请参阅 [可用的基础模型](jumpstart-foundation-models-latest.md)。

创建 `JumpStartEstimator` 时，您可以选择指定模型版本或实例类型。有关该`JumpStartEstimator `类及其参数的更多信息，请参见[JumpStartEstimator](https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.jumpstart.estimator.JumpStartEstimator)。

## 检查默认实例类型
<a name="jumpstart-foundation-models-use-python-sdk-estimator-class-instance-types"></a>

在使用 `JumpStartEstimator` 类对预训练模型进行微调时，您可以选择包含特定的模型版本或实例类型。所有 JumpStart 模型都有默认的实例类型。使用以下代码读取默认训练实例类型：

```
from sagemaker import instance_types

instance_type = instance_types.retrieve_default(
    model_id=model_id,
    model_version=model_version,
    scope="training")
print(instance_type)
```

您可以使用`instance_types.retrieve()`方法查看给定 JumpStart 模型的所有支持的实例类型。

## 检查默认超参数
<a name="jumpstart-foundation-models-use-python-sdk-estimator-class-hyperparameters"></a>

要检查用于训练的默认超参数，可以使用 `hyperparameters` 类中的 `retrieve_default()` 方法。

```
from sagemaker import hyperparameters

my_hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version)
print(my_hyperparameters)

# Optionally override default hyperparameters for fine-tuning
my_hyperparameters["epoch"] = "3"
my_hyperparameters["per_device_train_batch_size"] = "4"

# Optionally validate hyperparameters for the model
hyperparameters.validate(model_id=model_id, model_version=model_version, hyperparameters=my_hyperparameters)
```

有关可用超参数的更多信息，请参阅 [通常支持的微调超参数](jumpstart-foundation-models-fine-tuning.md#jumpstart-foundation-models-fine-tuning-hyperparameters)。

## 检查默认指标定义
<a name="jumpstart-foundation-models-use-python-sdk-estimator-class-metric-definitions"></a>

您还可以检查默认指标定义：

```
print(metric_definitions.retrieve_default(model_id=model_id, model_version=model_version))
```

# 使用 `JumpStartModel` 类部署公开可用的基础模型
<a name="jumpstart-foundation-models-use-python-sdk-model-class"></a>

使用 SageMaker Python SDK，只需几行代码即可将内置算法或预训练模型部署到 SageMaker AI 终端节点。

1. 首先，在[内置算法与预训练模型表](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html)中找到所选模型的模型 ID。

1. 使用模型 ID 将您的模型定义为 JumpStart 模型。

   ```
   from sagemaker.jumpstart.model import JumpStartModel
   
   model_id = "huggingface-text2text-flan-t5-xl"
   my_model = JumpStartModel(model_id=model_id)
   ```

1. 使用 `deploy` 方法自动部署模型进行推理。在本例中，我们使用了来自 Hugging Face 的 FLAN-T5 XL 模型。

   ```
   predictor = my_model.deploy()
   ```

1. 然后，您就可以使用 `predict` 方法对已部署的模型进行推理。

   ```
   question = "What is Southern California often abbreviated as?"
   response = predictor.predict(question)
   print(response)
   ```

**注意**  
此示例使用的基础模型 FLAN-T5 XL 适用于各种文本生成使用场景，包括问题解答、摘要、聊天机器人创建等。有关模型使用场景的更多信息，请参阅 [可用的基础模型](jumpstart-foundation-models-latest.md)。

有关该`JumpStartModel `类及其参数的更多信息，请参见[JumpStartModel](https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.jumpstart.model.JumpStartModel)。

## 检查默认实例类型
<a name="jumpstart-foundation-models-use-python-sdk-model-class-instance-types"></a>

在使用 `JumpStartModel` 类对预训练模型进行部署时，您可以选择包含特定的模型版本或实例类型。所有 JumpStart 模型都有默认的实例类型。使用以下代码读取默认部署实例类型：

```
from sagemaker import instance_types

instance_type = instance_types.retrieve_default(
    model_id=model_id,
    model_version=model_version,
    scope="inference")
print(instance_type)
```

使用`instance_types.retrieve()`方法查看给定 JumpStart 模型的所有支持的实例类型。

## 使用推理组件将多个模型部署到共享端点
<a name="jumpstart-foundation-models-use-python-sdk-model-class-endpoint-types"></a>

推理组件是一个 SageMaker AI 托管对象，可用于将一个或多个模型部署到终端节点，以提高灵活性和可扩展性。您必须将 JumpStart 模型更改`endpoint_type`为， inference-component-based而不是默认的基于模型的端点。

```
predictor = my_model.deploy(
    endpoint_name = 'jumpstart-model-id-123456789012', 
    endpoint_type = EndpointType.INFERENCE_COMPONENT_BASED
)
```

有关使用推理组件创建端点和部署 SageMaker AI 模型的更多信息，请参阅[多种模式的资源共享利用](realtime-endpoints-deploy-models.md#deployed-shared-utilization)。

## 检查有效的输入和输出推理格式
<a name="jumpstart-foundation-models-use-python-sdk-model-class-input-output"></a>

要检查有效的数据输入和输出格式以进行推理，您可以使用 `Serializers` 和 `Deserializers` 类中的 `retrieve_options()` 方法。

```
print(sagemaker.serializers.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.deserializers.retrieve_options(model_id=model_id, model_version=model_version))
```

## 检查支持的内容和接受类型
<a name="jumpstart-foundation-models-use-python-sdk-model-class-content-types"></a>

同样，您也可以使用 `retrieve_options()` 方法来检查模型支持的内容和接受类型。

```
print(sagemaker.content_types.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.accept_types.retrieve_options(model_id=model_id, model_version=model_version))
```

有关实用程序的更多信息，请参阅[实用工具 APIs](https://sagemaker.readthedocs.io/en/stable/api/utility/index.html)。

# 使用 `ModelPackage` 类部署专有基础模型
<a name="jumpstart-foundation-models-use-python-sdk-proprietary"></a>

在 AWS Marketplace中订阅模型后，必须使用模型软件包信息部署专有模型。有关 SageMaker 人工智能和的更多信息 AWS Marketplace，请参阅[中的买入和出售 Amazon SageMaker AI 算法和模型 AWS Marketplace](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-marketplace.html)。要查找最新专有机型的 AWS Marketplace 链接，请参阅 [Amazon 入门 SageMaker JumpStart](https://aws.amazon.com/sagemaker/jumpstart/getting-started/?sagemaker-jumpstart-cards.sort-by=item.additionalFields.priority&sagemaker-jumpstart-cards.sort-order=asc&awsf.sagemaker-jumpstart-filter-product-type=product-type%23foundation-model&awsf.sagemaker-jumpstart-filter-text=*all&awsf.sagemaker-jumpstart-filter-vision=*all&awsf.sagemaker-jumpstart-filter-tabular=*all&awsf.sagemaker-jumpstart-filter-audio-tasks=*all&awsf.sagemaker-jumpstart-filter-multimodal=*all&awsf.sagemaker-jumpstart-filter-RL=*all&sagemaker-jumpstart-cards.q=proprietary&sagemaker-jumpstart-cards.q_operator=AND)。

在中订阅您选择的模型后 AWS Marketplace，您可以使用与模型提供者关联的 SageMaker Python SDK 和软件开发工具包来部署基础模型。例如， AI21 Labs、Cohere 和 Cohere 分别 LightOn 使用`"ai21[SM]"``cohere-sagemaker`、和`lightonsage`软件包。

例如，要使用 AI21实验室中的 Jurassic-2 Jumbo Instruct 定义 JumpStart 模型，请使用以下代码：

```
import sagemaker
import ai21

role = get_execution_role()
sagemaker_session = sagemaker.Session()
model_package_arn = "arn:aws:sagemaker:us-east-1:865070037744:model-package/j2-jumbo-instruct-v1-1-43-4e47c49e61743066b9d95efed6882f35"

my_model = ModelPackage(
    role=role, model_package_arn=model_package_arn, sagemaker_session=sagemaker_session
)
```

 step-by-step例如，在 SageMaker Studio Classic 中查找并运行与您选择的专有基础型号相关的笔记本电脑。请参阅[在 Amazon SageMaker Studio 经典版中使用基础模型](jumpstart-foundation-models-use-studio.md)了解更多信息。有关 SageMaker Python SDK 的更多信息，请参阅[https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.model.ModelPackage](https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.model.ModelPackage)。

# 在 SageMaker AI 控制台中探索基础模型
<a name="jumpstart-foundation-models-use-console"></a>

您可以直接通过 Amazon A SageMaker I 控制台探索 JumpStart 基础模型。

1. 打开 Amazon A SageMaker I 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧导航面板**JumpStart**上查找，然后选择**基础模型**。

1. 浏览模型或搜索特定模型。如果您需要有关选择模型的指导，请参阅[可用的基础模型](jumpstart-foundation-models-latest.md)。选择**查看模型**可查看所选基础模型的模型详情页面。

1. 如果模型是专有模型，请在模型详细信息页面右上角选择**订阅**以在 AWS Marketplace中订阅该模型。您应该会收到一封确认您订阅了所选模型的电子邮件。有关 SageMaker 人工智能和的更多信息 AWS Marketplace，请参阅[中的买入和出售 Amazon SageMaker AI 算法和模型 AWS Marketplace](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-marketplace.html)。公开可用的基础模型不需要订阅。

1. 要在中查看示例笔记本 GitHub，请选择模型详情页面右上角的**查看代码**。

1. 要直接在 Amazon SageMaker Studio Classic 中查看和运行示例**笔记本，请选择模型详情页面右上角的 “在 Studio 中打开笔记本**”。

# 示范源和许可协议
<a name="jumpstart-foundation-models-choose"></a>

Amaz SageMaker JumpStart on 允许访问来自第三方来源和合作伙伴的数百种公开和专有的基础模型。你可以直接在 SageMaker AI 控制台、Studio 或 Studio Classic 中浏览 JumpStart 基础模型的选择。

## 许可证和模型来源
<a name="jumpstart-foundation-models-choose-source"></a>

Amazon SageMaker JumpStart 提供对公开和专有基础模型的访问权限。基础模型由第三方开源和专有提供商载入和维护。因此，它们在根据模型来源指定的不同许可证下发布。请确保检查您使用的任何基础模型的许可证。在下载或使用内容之前，您有责任查看和遵守任何适用的许可证条款，并确保您的使用案例可以接受这些条款。常见基础模型许可证的一些示例包括：
+ Alexa Teacher Model
+ Apache 2.0
+ BigScience 负责任的人工智能许可证 v1.0
+ CreativeML Open RAIL\$1\$1-M 许可证

同样，对于任何专有基础模型，请确保查看并遵守模型提供商的任何使用条款和使用指南。如果您对特定专有模型的许可证信息有疑问，请直接联系模型提供商。在 AWS Marketplace中，您可以在每个模型的**支持**选项卡中找到模型提供商的联系信息。

## 最终用户许可协议
<a name="jumpstart-foundation-models-choose-eula"></a>

某些 JumpStart 基础模型要求在使用前明确接受最终用户许可协议 (EULA)。

### 亚马逊 SageMaker Studio 接受最终用户许可协议
<a name="jumpstart-foundation-models-choose-eula-studio"></a>

在 Studio 中微调、部署或评估 JumpStart 基础模型之前，系统可能会提示您接受最终用户许可协议。要开始使用 Studio 中的 JumpStart 基础模型，请参阅[在 Studio 中使用基础模型](jumpstart-foundation-models-use-studio-updated.md)。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用更新后的 Studio 体验。有关使用 Studio Classic 应用程序的信息，请参阅 [亚马逊 SageMaker Studio 经典版](studio.md)。

某些 JumpStart 基础模型要求在部署之前接受最终用户许可协议。如果这适用于您选择使用的基础模型，Studio 会提示您一个包含 EULA 内容的窗口。在下载或使用模型之前，您有责任查看和遵守任何适用的许可证条款，并确保您的使用场景可以接受这些条款。

#### 亚马逊 SageMaker Studio 经典版接受最终用户许可协议
<a name="jumpstart-foundation-models-choose-eula-studio-classic"></a>

在 Studio Classic 中部署 JumpStart 基础模型或打开基础型号笔记本电脑之前， JumpStart 系统可能会提示您接受最终用户许可协议。要开始使用 Studio Classic 中的 JumpStart 基础模型，请参阅[在 Amazon SageMaker Studio 经典版中使用基础模型](jumpstart-foundation-models-use-studio.md)。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

某些 JumpStart 基础模型要求在部署之前接受最终用户许可协议。如果您选择使用的基础模型也有此要求，则在您选择**部署**或**打开笔记本**之后，Studio Classic 会显示一个标题为**查看以下最终用户许可协议 (EULA) 和可接受使用政策 (AUP)** 的窗口。在下载或使用模型之前，您有责任查看和遵守任何适用的许可证条款，并确保您的使用场景可以接受这些条款。

### 使用 SDK 接受最终用户许可协议 SageMaker Python
<a name="jumpstart-foundation-models-choose-eula-python-sdk"></a>

以下各节介绍如何在使用 SDK 部署或微调 JumpStart 模型时明确声明接受 EULA。 SageMaker Python有关使用 SageMaker Python SDK 开始使用 JumpStart 基础模型的更多信息，请参阅[在 SageMaker Python SDK 中使用基础模型](jumpstart-foundation-models-use-python-sdk.md)。

在开始之前，请确保完成了以下操作：
+ 升级到您使用的模型的最新版本。
+ 安装最新版本的 SageMaker Python SDK。

**重要**  
要使用以下工作流程，必须安装版本为 [2.198.0](https://github.com/aws/sagemaker-python-sdk/releases/tag/v2.198.0) 或更高版本的 SDK。 SageMaker Python

#### 部署模型时接受最终用户许可协议 JumpStart
<a name="jumpstart-foundation-models-choose-eula-python-sdk-deploy"></a>

对于需要接受最终用户许可协议的型号，您必须在部署 JumpStart模型时明确声明接受最终用户许可协议。

```
from sagemaker.jumpstart.model import JumpStartModel
model_id = "meta-textgeneration-llama-2-13b"
my_model = JumpStartModel(model_id=model_id)

# Declare EULA acceptance when deploying your JumpStart model
predictor = my_model.deploy(accept_eula=True)
```

默认情况下 `accept_eula` 的值为 `None`，并且必须明确重新定义为 `True` 以接受最终用户许可协议。有关更多信息，请参阅 [JumpStartModel](https://sagemaker.readthedocs.io/en/stable/api/inference/model.html#sagemaker.jumpstart.model.JumpStartModel)。

#### 微调模型时接受 EULA JumpStart
<a name="jumpstart-foundation-models-choose-eula-python-sdk-fine-tune"></a>

对于需要接受最终用户许可协议的微调模型，在为估算器运行该`fit()`方法时，必须明确声明接受 EULA。 JumpStart 对预训练模型进行微调后，原始模型的权重会发生变化。因此，以后部署微调的模型时，无需接受 EULA。

**注意**  
以下示例设置 `accept_eula=False`。要接受 EULA，您应该手动将该值更改为 `True`。

```
from sagemaker.jumpstart.estimator import JumpStartEstimator
model_id = "meta-textgeneration-llama-2-13b"

# Declare EULA acceptance when defining your JumpStart estimator
estimator = JumpStartEstimator(model_id=model_id)
estimator.fit(accept_eula=False,
{"train": training_dataset_s3_path, "validation": validation_dataset_s3_path}
)
```

默认情况下 `accept_eula` 的值为 `None`，并且必须明确在 `fit()` 方法中重新定义为 `"true"` 以接受最终用户许可协议。有关更多信息，请参阅 [JumpStartEstimator](https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html#sagemaker.jumpstart.estimator.JumpStartEstimator)。

#### EULA 接受 SageMaker Python SDK 版本低于 2.198.0
<a name="jumpstart-foundation-models-choose-eula-python-sdk-previous-version"></a>

**重要**  
使用低于 [2.198.0](https://github.com/aws/sagemaker-python-sdk/releases/tag/v2.198.0) 的 SageMaker Python SDK 版本时，必须使用 SageMaker `Predictor`类来接受模型最终用户许可协议。

使用 SageMaker Python SDK 以编程方式部署 JumpStart 基础模型后，您可以使用类对已部署的终端节点进行推理。 SageMaker `[Predictor](https://sagemaker.readthedocs.io/en/stable/api/inference/predictors.html)`对于需要接受最终用户许可协议的模型，您必须在调用 `Predictor` 类时明确声明接受 EULA：

```
predictor.predict(payload, custom_attributes="accept_eula=true")
```

默认情况下 `accept_eula` 的值为 `false`，并且必须明确重新定义为 `true` 以接受最终用户许可协议。如果在 `accept_eula` 设置为 `false` 时尝试运行推理，则预测器会返回错误信息。有关使用 SageMaker Python SDK 开始使用 JumpStart 基础模型的更多信息，请参阅[在 SageMaker Python SDK 中使用基础模型](jumpstart-foundation-models-use-python-sdk.md)。

**重要**  
`custom_attributes` 参数接受 `"key1=value1;key2=value2"` 格式的键值对。如果您多次使用同一个键，则推理服务器将使用与该键关联的最后一个值。例如，如果您将 `"accept_eula=false;accept_eula=true"` 传递给 `custom_attributes` 参数，则推理服务器会将值 `true` 与 `accept_eula` 键相关联。

# 基础模型自定义
<a name="jumpstart-foundation-models-customize"></a>

基础模型是非常强大的模型，能够处理各种任务。为了有效地解决大多数任务，这些模型需要进行某种形式的自定义。

根据特定使用案例，推荐用于自定义基础模型的第一种方法是通过提示工程。为基础模型提供精心设计、具有丰富上下文的提示可以帮助实现预期的结果，而无需微调或对模型权重进行任何更改。有关更多信息，请参阅 [适用于基础模型的提示工程](jumpstart-foundation-models-customize-prompt-engineering.md)。

如果仅靠提示工程不足以根据特定任务自定义基础模型，则可以根据其他特定于领域的数据对基础模型进行微调。有关更多信息，请参阅 [用于微调的基础模型和超参数](jumpstart-foundation-models-fine-tuning.md)。微调过程涉及到更改模型权重。

如果您想使用知识库中的信息自定义模型而不进行任何重新训练，请参阅[检索增强生成](jumpstart-foundation-models-customize-rag.md)。

# 适用于基础模型的提示工程
<a name="jumpstart-foundation-models-customize-prompt-engineering"></a>

提示工程是针对语言模型，设计和完善提示或输入刺激以生成特定类型输出的过程。提示工程涉及到选择适当的关键字、提供上下文，并以促进模型生成所需响应的方式塑造输入，这是一项主动塑造基础模型行为和输出的重要技术。

有效的提示工程对于指导模型行为和实现所需的响应至关重要。通过提示工程，您可以控制模型的语气、风格和领域专业知识，而无需进行诸如微调之类的更多自定义措施。我们建议您在考虑根据其他数据对模型进行微调之前，专门用一些时间来设计提示工程。目标是为模型提供足够的背景信息和指导，使其能够对没见过或有限数据的场景进行概括并有好的表现。

## 零样本学习
<a name="jumpstart-foundation-models-customize-prompt-engineering-zero-shot"></a>

零样本学习涉及训练模型以对没见过的类或任务进行概括和预测。要在零样本学习环境中执行提示工程，我们建议您构造提示，明确提供有关目标任务和所需输出格式的信息。例如，如果您要使用基础模型，对模型在训练期间未看到的一组类进行零样本文本分类，则良好设计的提示可能是：`"Classify the following text as either sports, politics, or entertainment: [input text]."`。通过明确指定目标类和预期的输出格式，您可以指导模型即使对没见过的类也能做出准确的预测。

## 少样本学习
<a name="jumpstart-foundation-models-customize-prompt-engineering-few-shot"></a>

少样本学习涉及使用有限的数据量训练模型，以用于新课程或任务。在少样本学习环境中，提示工程侧重于设计能够高效利用有限的可用训练数据的提示。例如，如果您使用基础模型执行图像分类任务，并且只有几个新图像类的样本，则可以设计一个提示，在其中包含可用的已标注样本，并带有用于目标类的占位符。例如，提示可能是：`"[image 1], [image 2], and [image 3] are examples of [target class]. Classify the following image as [target class]"`。通过纳入有限的已标注样本并明确指定目标类，即使训练数据极少，您也可以指导模型进行概括并做出准确的预测。

## 支持的推理参数
<a name="jumpstart-foundation-models-customize-prompt-engineering-inference-params"></a>

更改推理参数也可能会影响对提示的响应。您可以尽量为提示添加具体内容和上下文，也可以尝试使用支持的推理参数。以下是一些常用的推理参数的示例：


| 推理参数 | 说明 | 
| --- | --- | 
| `max_new_tokens` | 基础模型响应的最大输出长度。有效值：整数，范围：正整数。 | 
| `temperature` | 控制输出的随机性。较高的温度会导致输出序列中包含低概率词，而较低的温度会生成带有高概率词的输出序列。如果是 `temperature=0`，则响应只由概率最高的单词组成（贪婪解码）。有效值：浮点型，范围：正浮点数。 | 
| `top_p` | 在文本生成的每一步中在文本生成的每个步骤中，模型都会以 `top_p` 的累积概率从尽可能小的词集中采样。有效值：浮点型，范围：0.0，1.0。 | 
| `return_full_text` | 如果 `True`，则输入文本是生成的输出文本的一部分。有效值：布尔值，默认值：False。 | 

有关基础模型推理的更多信息，请参见 [使用 `JumpStartModel` 类部署公开可用的基础模型](jumpstart-foundation-models-use-python-sdk-model-class.md)。

如果提示工程不足以根据特定的业务需求、特定领域的语言、目标任务或其他要求来调整基础模型，您可以考虑根据其他数据微调模型，或者使用检索增强生成 (RAG)，通过来自存档知识来源的增强上下文来增强模型架构。有关更多信息，请参阅 [用于微调的基础模型和超参数](jumpstart-foundation-models-fine-tuning.md)或 [检索增强生成](jumpstart-foundation-models-customize-rag.md)。

# 用于微调的基础模型和超参数
<a name="jumpstart-foundation-models-fine-tuning"></a>

基础模型的计算成本很高，并且是在大型的、未标注的语料库上训练的。微调预训练的基础模型是一种经济实惠的方式，可以利用其广泛的功能，同时根据自己的小型语料库来自定义模型。微调是一种自定义方法，它涉及进一步的训练，并且会改变模型的权重。

如果您有以下要求，微调可能会很有用：
+ 根据特定业务需求自定义模型
+ 让模型可以成功处理特定于领域的语言，例如行业术语、技术术语或其他专业词汇
+ 针对特定任务增强性能
+ 在应用中提供准确、相对的和感知上下文的响应
+ 更真实、毒性更小、更符合具体要求的响应

根据使用案例和所选的基础模型，您可以采用两种主要方法进行微调。

1. 如果您有兴趣根据特定于领域数据微调模型，请参阅[利用领域适应性微调大型语言模型（LLM）](jumpstart-foundation-models-fine-tuning-domain-adaptation.md)。

1. 如果您对使用提示和响应样本进行基于指令的微调感兴趣，请参阅[使用提示指令微调大型语言模型（LLM）](jumpstart-foundation-models-fine-tuning-instruction-based.md)。

## 可进行微调的基础模型
<a name="jumpstart-foundation-models-fine-tuning-models"></a>

您可以微调以下任何 JumpStart 基础模型：
+ Bloom 3B
+ Bloom 7B1
+ BloomZ 3B FP16
+ BloomZ 7B1 FP16
+ Code Llama 13B
+ Code Llama 13B Python
+ Code Llama 34B
+ Code Llama 34B Python
+ Code Llama 70B
+ Code Llama 70B Python
+ Code Llama 7B
+ Code Llama 7B Python
+ CyberAgentLM2-7B-Chat (-7B-Chat) CALM2
+ Falcon 40B BF16
+ Falcon 40B Instruct BF16
+ Falcon 7B BF16
+ Falcon 7B Instruct BF16
+ Flan-T5 Base
+ Flan-T5 Large
+ Flan-T5 Small
+ Flan-T5 XL
+ Flan-T5 XXL
+ Gemma 2B
+ Gemma 2B Instruct
+ Gemma 7B
+ Gemma 7B Instruct
+ GPT-2 XL
+ GPT-J 6B
+ GPT-Neo 1.3B
+ GPT-Neo 125M
+ GPT-NEO 2.7B
+ LightGPT Instruct 6B
+ Llama 2 13B
+ Llama 2 13B Chat
+ Llama 2 13B Neuron
+ Llama 2 70B
+ Llama 2 70B Chat
+ Llama 2 7B
+ Llama 2 7B Chat
+ Llama 2 7B Neuron
+ Mistral 7B
+ Mixtral 8x7B
+ Mixtral 8x7B Instruct
+ RedPajama Incite Base 3B V1
+ RedPajama Incite Base 7B V1
+ RedPajama INCITE Chat 3B V1
+ RedPajama INCITE Chat 7B V1
+ RedPajama INCITE Instruct 3B V1
+ RedPajama INCITE Instruct 7B V1
+ Stable Diffusion 2.1

## 通常支持的微调超参数
<a name="jumpstart-foundation-models-fine-tuning-hyperparameters"></a>

微调时，不同的基础模型支持不同的超参数。以下是常用的超参数，可在训练过程中进一步自定义模型：


| 推理参数 | 说明 | 
| --- | --- | 
| `epoch` | 模型在训练过程中通过微调数据集的次数。必须是大于 1 的整数。 | 
| `learning_rate` |  完成每批微调训练样本后，更新模型权重的速度。必须是大于 0 的正浮点数。 | 
| `instruction_tuned` |  是否对模型进行指令训练。必须为 `'True'` 或 `'False'`。 | 
| `per_device_train_batch_size` |  用于训练的每个 GPU 内核或 CPU 的批量大小。其值必须为正整数。 | 
| `per_device_eval_batch_size` |  用于评估的每个 GPU 内核或 CPU 的批量大小。其值必须为正整数。 | 
| `max_train_samples` |  为了调试或加快训练速度，请将训练样本的数量截断为该值。值 -1 表示模型使用了所有训练样本。必须是正整数或 -1。 | 
| `max_val_samples` |  为了调试或加快训练速度，请将验证样本的数量截断为该值。值 -1 表示模型使用了所有验证样本。必须是正整数或 -1。 | 
| `max_input_length` |  令牌化后输入序列的最大总长度。长度超过此值的序列将被截断。如果为 -1，`max_input_length` 将被设置为 1024 和分词器定义的 `model_max_length` 的最小值。如果设置为正值，`max_input_length` 将被设置为所提供值和分词器定义的 `model_max_length` 的最小值。必须是正整数或 -1。 | 
| `validation_split_ratio` |  如果没有验证通道，则训练 - 验证的比例将从训练数据中拆分。必须介于 0 和 1 之间。 | 
| `train_data_split_seed` |  如果不存在验证数据，则将输入的训练数据随机拆分为模型使用的训练数据和验证数据。必须是整数。 | 
| `preprocessing_num_workers` |  用于预处理的进程数。如果 `None`，则使用主进程进行预处理。 | 
| `lora_r` |  低秩适应 (LoRA) r 值，作为权重更新的缩放因子。其值必须为正整数。 | 
| `lora_alpha` |  低秩适应 (LoRA) 阿尔法值，作为权重更新的缩放因子。一般是 `lora_r` 的 2 到 4 倍。其值必须为正整数。 | 
| `lora_dropout` |  低秩适应 (LoRA) 层的释放参数必须是介于 0 和 1 之间的正浮点数。 | 
| `int8_quantization` |  如果 `True`，则模型将以 8 位精度加载，以进行训练。 | 
| `enable_fsdp` |  如果 `True`，则训练使用完全分片数据并行。 | 

在 Studio 中微调模型时，您可以指定超参数值。有关更多信息，请参阅 [在 Studio 中微调模型](jumpstart-foundation-models-use-studio-updated-fine-tune.md)。

使用 SDK 微调模型时，您也可以覆盖默认的超参数值。 SageMaker Python有关更多信息，请参阅 [使用 `JumpStartEstimator` 类微调公开可用的基础模型](jumpstart-foundation-models-use-python-sdk-estimator-class.md)。

# 利用领域适应性微调大型语言模型（LLM）
<a name="jumpstart-foundation-models-fine-tuning-domain-adaptation"></a>

通过领域适应微调，您可以利用预先训练的基础模型，并使用有限的特定于领域的数据，根据特定任务来调整模型。如果通过提示工程无法提供足够的自定义，则可以使用领域适应微调，让您的模型处理特定于领域的语言，例如行业术语、技术术语或其他专业数据。这个微调过程修改模型的权重。

要在特定领域的数据集上微调模型：

1. 准备训练数据。有关说明，请参阅[准备和上传训练数据以进行领域适应微调](#jumpstart-foundation-models-fine-tuning-domain-adaptation-prepare-data)。

1. 创建您的微调训练作业。有关说明，请参阅[创建基于指令的微调的训练作业](#jumpstart-foundation-models-fine-tuning-domain-adaptation-train)。

您可以在中找到 end-to-end示例[示例笔记本](#jumpstart-foundation-models-fine-tuning-domain-adaptation-examples)。

领域适应微调适用于以下基础模型：

**注意**  
一些 JumpStart 基础模型，例如 Llama 2 7B，要求在微调和执行推理之前接受最终用户许可协议。有关更多信息，请参阅 [最终用户许可协议](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula)。
+ Bloom 3B
+ Bloom 7B1
+ BloomZ 3B FP16
+ BloomZ 7B1 FP16
+ GPT-2 XL
+ GPT-J 6B
+ GPT-Neo 1.3B
+ GPT-Neo 125M
+ GPT-NEO 2.7B
+ Llama 2 13B
+ Llama 2 13B Chat
+ Llama 2 13B Neuron
+ Llama 2 70B
+ Llama 2 70B Chat
+ Llama 2 7B
+ Llama 2 7B Chat
+ Llama 2 7B Neuron

## 准备和上传训练数据以进行领域适应微调
<a name="jumpstart-foundation-models-fine-tuning-domain-adaptation-prepare-data"></a>

域适应微调的训练数据可以采用 CSV、JSON 或 TXT 文件格式提供。所有训练数据必须放在单个文件夹内的单个文件中。

训练数据取自 CSV 或 JSON 训练数据文件的**文本**列。如果没有标记为**文本**的列，则训练数据将从 CSV 或 JSON 训练数据文件的第一列中获取。

以下是用于微调的 TXT 文件正文示例：

```
This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of ....
```

### 拆分数据用于训练和测试
<a name="jumpstart-foundation-models-fine-tuning-domain-adaptation-split-data"></a>

您可以选择提供另一个包含验证数据的文件夹。此文件夹还应包含一个 CSV、JSON 或 TXT 文件。如果未提供验证数据集，则会留出一定量的训练数据用于验证。在选择用于微调模型的超参数时，可以调整用于验证的训练数据比例。

### 将微调数据上传到 Amazon S3
<a name="jumpstart-foundation-models-fine-tuning-domain-adaptation-upload-data"></a>

将准备好的数据上传到亚马逊简单存储服务 (Amazon S3)，以便在微调 JumpStart 基础模型时使用。您可以使用以下命令上传数据：

```
from sagemaker.s3 import S3Uploader
import sagemaker
import random

output_bucket = sagemaker.Session().default_bucket()
local_data_file = "train.txt"
train_data_location = f"s3://{output_bucket}/training_folder"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"Training data: {train_data_location}")
```

## 创建基于指令的微调的训练作业
<a name="jumpstart-foundation-models-fine-tuning-domain-adaptation-train"></a>

将数据上传到 Amazon S3 后，您可以微调和部署 JumpStart 基础模型。要在 Studio 中微调您的模型，请参阅 [在 Studio 中微调模型](jumpstart-foundation-models-use-studio-updated-fine-tune.md)。要使用 SageMaker Python SDK 微调模型，请参阅[使用 `JumpStartEstimator` 类微调公开可用的基础模型](jumpstart-foundation-models-use-python-sdk-estimator-class.md)。

## 示例笔记本
<a name="jumpstart-foundation-models-fine-tuning-domain-adaptation-examples"></a>

有关域适应微调的更多信息，请参阅以下示例笔记本：
+ [SageMaker JumpStart 基础模型——微调特定领域数据集上的文本生成 GPT-J 6B 模型](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/domain-adaption-finetuning-gpt-j-6b.html)
+ [微调 LLa MA 2 机型 JumpStart](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/llama-2-finetuning.html)

# 使用提示指令微调大型语言模型（LLM）
<a name="jumpstart-foundation-models-fine-tuning-instruction-based"></a>

基于指令的微调使用已标注的样本，提高预训练基础模型在特定任务上的性能。已标注样本采用提示和响应对的格式，可解析为指令。这个微调过程修改模型的权重。有关基于指令的微调的更多信息，请参阅 [FLAN 简介：具有指令微调的更具通用性的语言模型](https://ai.googleblog.com/2021/10/introducing-flan-more-generalizable.html)和[缩放指令微调语言模型](https://arxiv.org/abs/2210.11416)。

经过微调的 LAnguage 网络 (FLAN) 模型使用指令调整来使模型更适合解决一般的下游 NLP 任务。Amazon 在 FLAN 模型系列中 SageMaker JumpStart 提供了许多基础模型。例如，FLAN-T5 模型针对广泛的任务进行了指令微调，以提高各种常见使用案例的零样本性能。通过额外的数据和微调，基于指令的模型可以针对在预训练期间未考虑过的更具体的任务进一步进行调整。

要在特定任务中使用提示 - 响应对任务指令对 LLM 进行微调：

1. 在 JSON 文件中编写指令。有关提示 - 响应对文件所需格式和数据文件夹结构的更多信息，请参阅 [准备并上传训练数据，以便进行基于指令的微调](#jumpstart-foundation-models-fine-tuning-instruction-based-prepare-data)。

1. 创建您的微调训练作业。有关说明，请参阅[创建基于指令的微调的训练作业](#jumpstart-foundation-models-fine-tuning-instruction-based-train)。

您可以在中找到 end-to-end示例[示例笔记本](#jumpstart-foundation-models-fine-tuning-instruction-based-examples)。

只有一部分 JumpStart 基础模型与基于指令的微调兼容。基于指令的微调适用于以下基础模型：

**注意**  
一些 JumpStart 基础模型，例如 Llama 2 7B，要求在微调和执行推理之前接受最终用户许可协议。有关更多信息，请参阅 [最终用户许可协议](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula)。
+ Flan-T5 Base
+ Flan-T5 Large
+ Flan-T5 Small
+ Flan-T5 XL
+ Flan-T5 XXL
+ Llama 2 13B
+ Llama 2 13B Chat
+ Llama 2 13B Neuron
+ Llama 2 70B
+ Llama 2 70B Chat
+ Llama 2 7B
+ Llama 2 7B Chat
+ Llama 2 7B Neuron
+ Mistral 7B
+ RedPajama Incite Base 3B V1
+ RedPajama Incite Base 7B V1
+ RedPajama INCITE Chat 3B V1
+ RedPajama INCITE Chat 7B V1
+ RedPajama INCITE Instruct 3B V1
+ RedPajama INCITE Instruct 7B V1

## 准备并上传训练数据，以便进行基于指令的微调
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-prepare-data"></a>

基于指令的微调所需的训练数据必须以 JSON 行文本文件格式提供，其中每一行都是一个字典。所有训练数据必须放在一个文件夹中。此文件夹可包含多个 .jsonl 文件。

训练文件夹还可以包含一个模板 JSON 文件 (`template.json`)，用于描述数据的输入和输出格式。如果未提供模板文件，则使用以下模板文件：

```
{
  "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Input:\n{context}",
  "completion": "{response}"
}
```

根据 `template.json` 文件，训练数据的每个 .jsonl 条目必须包括 `{instruction}`、`{context}` 和 `{response}` 字段。

如果您提供了自定义模板 JSON 文件，请使用 `"prompt"` 和 `"completion"` 键定义自己的必填字段。根据以下自定义模板 JSON 文件，训练数据的每个 .jsonl 条目必须包括 `{question}`、`{context}` 和 `{answer}` 字段：

```
{
  "prompt": "question: {question} context: {context}",
  "completion": "{answer}"
}
```

### 拆分数据用于训练和测试
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-split-data"></a>

您可以选择提供另一个包含验证数据的文件夹。此文件夹还应包含一个或多个 .jsonl 文件。如果未提供验证数据集，则会留出一定量的训练数据用于验证。在选择用于微调模型的超参数时，可以调整用于验证的训练数据比例。

### 将微调数据上传到 Amazon S3
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-upload-data"></a>

将准备好的数据上传到亚马逊简单存储服务 (Amazon S3)，以便在微调 JumpStart 基础模型时使用。您可以使用以下命令上传数据：

```
from sagemaker.s3 import S3Uploader
import sagemaker
import random

output_bucket = sagemaker.Session().default_bucket()
local_data_file = "train.jsonl"
train_data_location = f"s3://{output_bucket}/dolly_dataset"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"Training data: {train_data_location}")
```

## 创建基于指令的微调的训练作业
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-train"></a>

将数据上传到 Amazon S3 后，您可以微调和部署 JumpStart 基础模型。要在 Studio 中微调您的模型，请参阅 [在 Studio 中微调模型](jumpstart-foundation-models-use-studio-updated-fine-tune.md)。要使用 SageMaker Python SDK 微调模型，请参阅[使用 `JumpStartEstimator` 类微调公开可用的基础模型](jumpstart-foundation-models-use-python-sdk-estimator-class.md)。

## 示例笔记本
<a name="jumpstart-foundation-models-fine-tuning-instruction-based-examples"></a>

有关基于指令的微调的更多信息，请参阅以下示例笔记本：
+ [微调 LLa MA 2 机型 JumpStart](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/llama-2-finetuning.html)
+ [简介 SageMaker JumpStart -使用 Mistral 模型生成文本](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/mistral-7b-instruction-domain-adaptation-finetuning.html)
+ [简介 SageMaker JumpStart -使用 Falcon 模型生成文本](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/falcon-7b-instruction-domain-adaptation-finetuning.html)
+ [SageMaker JumpStart 基础模型- HuggingFace Text2Text 指令微调](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/instruction-fine-tuning-flan-t5.html)

# 检索增强生成
<a name="jumpstart-foundation-models-customize-rag"></a>

基础模型通常是离线训练的，这使得模型不了解在模型训练后创建的任何数据。此外，基础模型在非常通用的领域语料库上训练，这使得它们在特定于领域的任务中的效率较低。您可以使用检索增强生成 (RAG) 在基础模型的外部检索数据，并通过在上下文中添加检索到的相关数据来增强提示。有关 RAG 模型架构的更多信息，请参阅[知识密集型 NLP 任务的检索增强生成](https://arxiv.org/abs/2005.11401)。

使用 RAG，用于增强提示的外部数据可以来自多个数据源，例如文档存储库、数据库或。 APIs第一步是将您的文档和任何用户查询转换为兼容的格式，以执行相关性搜索。为了使格式兼容，需要使用嵌入式语言模型，将文档集合或知识库以及用户提交的查询转换为数字表示形式。*嵌入*是在向量空间中对文本进行数字表示的过程。RAG 模型架构比较知识库向量中用户查询的嵌入情况。然后，将知识库中类似文档的相关上下文附加到原始用户提示中。接下来，此增强提示将发送到基础模型。您可以异步更新知识库及其相关嵌入。

 ![\[A model architecture diagram of Retrieval Augmented Generation (RAG).\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-fm-rag.jpg) 

检索到的文件应足够大，以便包含有用的上下文，帮助增强提示信息，但又应足够小，以适应提示信息的最大序列长度。您可以使用特定于任务的 JumpStart 模型（例如中的通用文本嵌入 (GTE) 模型）来为提示和知识库文档提供嵌入内容。Hugging Face在比较提示和文档嵌入找到最相关的文档后，利用补充上下文构建新的提示。然后，将增强后的提示传递给您选择的文本生成模型。

## 示例笔记本
<a name="jumpstart-foundation-models-customize-rag-examples"></a>

有关 RAG 基础模型解决方案的更多信息，请参阅以下示例笔记本：
+ [检索增强生成：使用 LangChain和 Cohere 的生成和嵌入模型进行问答 SageMaker JumpStart](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_Cohere+langchain_jumpstart.html)
+ [检索增强生成：使用- LLama 2、Pinecone 和自定义数据集回答问题](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_pinecone_llama-2_jumpstart.html)
+ [检索增强生成：基于开源库的自定义数据集问答 LangChain ](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_langchain_jumpstart.html)
+ [检索增强生成：基于自定义数据集的问题回答](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_jumpstart_knn.html)
+ [检索增强生成：使用 Llama-2 和文本嵌入模型进行问题解答](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_text_embedding_llama-2_jumpstart.html)
+ [Amazon SageMaker JumpStart -文本嵌入和句子相似度](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/text-embedding-sentence-similarity.html)

您可以克隆 [Amazon A SageMaker I 示例存储库](https://github.com/aws/amazon-sagemaker-examples/tree/main/introduction_to_amazon_algorithms/jumpstart-foundation-models)，以便在 Studio 中您选择的 Jupyter 环境中运行可用的 JumpStart 基础模型示例。有关可用于在 SageMaker AI 中创建和访问 Jupyter 的应用程序的更多信息，请参阅。[Amazon SageMaker Studio 支持的应用程序](studio-updated-apps.md)

# 评估 Studio 中的文本生成基础模型
<a name="jumpstart-foundation-models-evaluate"></a>

**注意**  
基础模型评估 (FMEval) 是 Amazon Clarif SageMaker y 的预览版，可能会发生变化。

**重要**  
要使用 Clari SageMaker fy 基础模型评估，您必须升级到全新的 Studio 体验。截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。基础评估功能只能在更新的体验中使用。有关如何更新 Studio 的信息，请参阅 [从亚马逊 SageMaker Studio 经典版迁移](studio-updated-migrate.md)。有关使用 Studio Classic 应用程序的信息，请参阅 [亚马逊 SageMaker Studio 经典版](studio.md)。

亚马逊 SageMaker JumpStart 已与 Studio 中的 C SageMaker larify 基础模型评估 (FMEval) 集成。如果 JumpStart 模型具有内置评估功能，则可以在 JumpStart Studio 用户界面中模型详情页面的右上角选择**评估**。有关在 JumpStart Studio 用户界面中导航的更多信息，请参阅 [JumpStart 在工作室中打开](studio-jumpstart.md#jumpstart-open-studio)

使用 Amazon SageMaker JumpStart 来评估基于文本的基础模型。 FMEval您可以使用这些模型评估来比较一个模型、两个模型之间或同一模型的不同版本之间的模型质量和责任指标，以帮助您量化模型风险。 FMEval 可以评估执行以下任务的基于文本的模型：
+  **开放式生成**：对没有预先定义结构的文本做出自然的人类反应。
+  **文本摘要**：生成简明扼要的摘要，同时保留长文本中的含义和关键信息。
+  **问题解答**：用自然语言回答问题。
+  **分类**：根据文本内容，将文本段落分为 `negative` 类和 `positive` 类。

您可以使用 FMEval 根据特定基准自动评估模型响应。您还可以使用自己的提示数据集，根据自己的标准评估模型响应。 FMEval 提供了一个用户界面 (UI)，可指导您完成评估任务的设置和配置。您也可以在自己的代码中使用该 FMEval 库。

每次评估都需要两个实例的配额：
+ 托管实例：托管和部署 LLM 的实例。
+ 评估实例：用于在主机实例上提示和执行 LLM 评估的实例。

如果您的 LLM 已部署，请提供终端节点， SageMaker AI 将使用您的**托管实例来托管**和部署 LLM。

如果您正在评估尚未部署到您的账户的 JumpStart 模型，请在您的账户中为您 FMEval 创建一个临时**托管实例**，并且仅在评估期间保持部署状态。 FMEval 使用为所选 LLM JumpStart 推荐的默认实例作为您的托管实例。您必须拥有足够的配额才能使用此推荐实例。

每次评估都会使用评估实例来提示 LLM 的响应并为其打分。您还必须拥有足够的配额和内存来运行评估算法。评估实例的配额和内存需求通常小于托管实例的需求。我们建议选择 `ml.m5.2xlarge` 实例。有关配额和内存的更多信息，请参阅 [解决在 Amazon A SageMaker I 中创建模型评估任务时出现的错误](clarify-foundation-model-evaluate-troubleshooting.md)。

自动评估可用于对以下维度 LLMs 进行评分：
+ 准确性：适用于文本摘要、问答和文本分类
+ 语义稳健性：适用于开放式生成、文本摘要和文本分类任务
+ 事实知识：适用于开放式一代
+ 提示定式：适用于开放式一代 
+  毒性：适用于开放式生成、文本摘要和问答

您还可以使用人工评估来手动评估模型响应。 FMEval 用户界面将引导您完成选择一个或多个模型、配置资源、为员工编写说明和联系员工的工作流程。人体评估完成后，结果将显示在中 FMEval。

您可以通过 Studio 的 JumpStart 登录页面访问模型评估，方法是选择要评估的模型，然后选择**评估**。请注意，并非所有 JumpStart 模型都具有可用的评估功能。有关如何配置、配置和运行的更多信息 FMEval，请参阅[什么是基础模型评估？](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-foundation-model-evaluate.html)

# 示例笔记本
<a name="jumpstart-foundation-models-example-notebooks"></a>

有关如何在 SageMaker Python SDK 中使用公开 JumpStart 基础模型的 step-by-step示例，请参阅以下关于文本生成、图像生成和模型自定义的笔记本。

**注意**  
专有和公开 JumpStart 的基础模型具有不同的 SageMaker AI Python SDK 部署工作流程。通过 Amazon SageMaker Studio Classic 或 A SageMaker I 控制台探索专有的基础模型示例笔记本电脑。有关更多信息，请参阅 [JumpStart 基础模型用法](jumpstart-foundation-models-use.md)。

您可以克隆 [Amazon A SageMaker I 示例存储库](https://github.com/aws/amazon-sagemaker-examples/tree/main/introduction_to_amazon_algorithms/jumpstart-foundation-models)，以便在 Studio 中您选择的 Jupyter 环境中运行可用的 JumpStart 基础模型示例。有关可用于在 SageMaker AI 中创建和访问 Jupyter 的应用程序的更多信息，请参阅。[Amazon SageMaker Studio 支持的应用程序](studio-updated-apps.md)

## 时间序列预测
<a name="jumpstart-foundation-models-example-notebooks-time-series"></a>

您可以使用 Chronos 模型来预测时间序列数据。它们基于语言模型架构。使用 [Chronos 笔记本上的时间序列预测简介](https://github.com/aws/amazon-sagemaker-examples/blob/default/%20%20%20%20generative_ai/sm-jumpstart_time_series_forecasting.ipynb)开始使用。 SageMaker JumpStart 

有关可用的 Chronos 更多信息，请参阅 [可用的基础模型](jumpstart-foundation-models-latest.md)。

## 文本生成
<a name="jumpstart-foundation-models-example-notebooks-text-generation"></a>

探索文本生成示例笔记本，包括一般文本生成工作流、多语言文本分类、实时批量推理、少样本学习、聊天机器人交互等方面的指导。
+ [SageMaker JumpStart 基础模型——以 FLAN-T5 XL 为例生成 HuggingFace Text2Text](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/text2text-generation-flan-t5.html)
+ [SageMaker JumpStart 基础模型——BloomZ：多语言文本分类、问答、代码生成、段落改写等](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/text2text-generation-bloomz.html)
+ [SageMaker JumpStart 基础模型- HuggingFace Text2Text 生成批量转换和实时批量推理](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/text2text-generation-Batch-Transform.html)
+ [SageMaker JumpStart 基础模型——GPT-J、GPT-neo Few-shot Learning](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/text-generation-few-shot-learning.html)
+ [SageMaker JumpStart 基础模型-聊天机器人](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/text-generation-chatbot.html)
+ [简介 SageMaker JumpStart -使用 Mistral 模型生成文本](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/mistral-7b-instruction-domain-adaptation-finetuning.html)
+ [简介 SageMaker JumpStart -使用 Falcon 模型生成文本](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/falcon-7b-instruction-domain-adaptation-finetuning.html)

## 图像生成
<a name="jumpstart-foundation-models-example-notebooks-image-generation"></a>

开始使用 text-to-image稳定扩散模型，学习如何部署修复模型，并尝试使用简单的工作流程来生成狗的图像。
+ [简介 JumpStart -文字转图像](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart_text_to_image/Amazon_JumpStart_Text_To_Image.html)
+ [ JumpStart 图像编辑简介-稳定扩散修复术](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart_inpainting/Amazon_JumpStart_Inpainting.html)
+ [为您的狗生成有趣的图片](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart_text_to_image/custom_dog_image_generator.html)

## 模型自定义
<a name="jumpstart-foundation-models-example-notebooks-model-customization"></a>

有时，您的使用案例需要针对特定任务进行更多的基础模型自定义。有关模型自定义方法的更多信息，请参阅[基础模型自定义](jumpstart-foundation-models-customize.md)或浏览以下示例笔记本之一。
+ [SageMaker JumpStart 基础模型——微调特定领域数据集上的文本生成 GPT-J 6B 模型](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/domain-adaption-finetuning-gpt-j-6b.html)
+ [SageMaker JumpStart 基础模型- HuggingFace Text2Text 指令微调](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/instruction-fine-tuning-flan-t5.html)
+ [检索增强生成：使用 LangChain 和 Cohere 的生成和嵌入模型进行问答 SageMaker JumpStart](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_Cohere+langchain_jumpstart.html)
+ [检索增强生成：使用- LLama 2、Pinecone 和自定义数据集回答问题](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_pinecone_llama-2_jumpstart.html)
+ [检索增强生成：基于开源库的自定义数据集问答 LangChain ](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_langchain_jumpstart.html)
+ [检索增强生成：基于自定义数据集的问题回答](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_jumpstart_knn.html)
+ [检索增强生成：使用 Llama-2 和文本嵌入模型进行问题解答](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/question_answering_text_embedding_llama-2_jumpstart.html)
+ [Amazon SageMaker JumpStart -文本嵌入和句子相似度](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/jumpstart-foundation-models/question_answering_retrieval_augmented_generation/text-embedding-sentence-similarity.html)

# 用于基础模型访问控制的私人策划中心 JumpStart
<a name="jumpstart-curated-hubs"></a>

使用私有中心为您的组织策划经过预训练 JumpStart 的基础模型。使用最新的公开基础模型和专有基础模型，同时实施管理防护措施，确保贵组织只能访问经批准的模型。

使用私有模型中心共享模型和笔记本，集中管理模型构件，提高模型的可发现性，并简化组织内的模型使用。管理员可以创建私有中心，其中包括为不同团队、使用场景或安全要求自定义的模型子集。管理员可以使用 SageMaker Python SDK 创建 JumpStart私有模型中心。然后，用户可以使用 Amazon SageMaker Studio 或 SageMaker Python SDK 浏览、训练和部署精选的模型集。

有关创建私有模型中心的更多信息，请参阅 [Amazon 私有模型中心管理员指南 SageMaker JumpStart](jumpstart-curated-hubs-admin-guide.md)。

有关跨账户共享私有模型中心的更多信息，请参阅 [私有模型中心的跨账户共享 AWS Resource Access Manager](jumpstart-curated-hubs-ram.md)。

有关访问私有模型中心的更多信息，请参阅 [用户指南](jumpstart-curated-hubs-user-guide.md)。

# Amazon 私有模型中心管理员指南 SageMaker JumpStart
<a name="jumpstart-curated-hubs-admin-guide"></a>

管理员可以采取一些与组织内用户可以访问的策管模型中心相关的操作。这包括创建、添加、删除和管理私有中心的访问权限。本页还包含了有关为策管的私有中心支持的 AWS 区域以及使用策管的私有模型中心所需的先决条件的信息。

## 支持的 AWS 区域
<a name="jumpstart-curated-hubs-admin-guide-regions"></a>

精心策划的私人中心目前在以下 AWS 商业区域普遍可用：
+ us-east-1
+ us-east-2
+ us-west-2
+ eu-west-1
+ eu-central-1
+ ap-northeast-1
+ ap-northeast-2
+ ap-south-1
+ ap-southeast-1
+ ap-southeast-2
+ il-central-1（仅限 SDK）

默认情况下，单个区域允许的最大中心数量为 50 个。

## 先决条件
<a name="jumpstart-curated-hubs-admin-guide-prerequisites"></a>

要在 Studio 中使用策管的私有中心，您必须具有以下先决条件：
+ 具有管理员访问权限的 AWS 账户
+ 有权访问 Amazon SageMaker Studio 的 AWS Identity and Access Management (IAM) 角色
+ 已 JumpStart 启用的 Amazon SageMaker AI 域
+ 如果您的用户尝试使用专有模型，则他们必须在 AWS Marketplace 中订阅这些模型。
+ AWS 部署专有模型的账户必须在 AWS Marketplace 中订阅这些模型。

有关 Studio 入门的更多信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。

# 创建私有模型中心
<a name="jumpstart-curated-hubs-admin-guide-create"></a>

使用以下步骤创建私有中心，以管理组织预训练 JumpStart 基础模型的访问控制。在创建模型中心之前，您必须安装 SageMaker Python 开发工具包并配置必要的 IAM 权限。

**创建私有中心**

1. 安装 SageMaker Python 软件开发工具包并导入必要的 Python 软件包。

   ```
   # Install the SageMaker Python SDK
   !pip3 install sagemaker --force-reinstall --quiet
   
   # Import the necessary Python packages
   import boto3
   from sagemaker import Session
   from sagemaker.jumpstart.hub.hub import Hub
   ```

1. 初始化 A SageMaker I 会话。

   ```
   sm_client = boto3.client('sagemaker')
   session = Session(sagemaker_client=sm_client)
   session.get_caller_identity_arn()
   ```

1. 配置私有中心的详细信息，例如内部中心名称、用户界面显示名称和用户界面中心描述。
**注意**  
如果您在创建中心时未指定 Amazon S3 存储桶名称，则 SageMaker中心服务会代表您创建一个新的存储桶。新存储桶的命名结构如下：`sagemaker-hubs-REGION-ACCOUNT_ID`。

   ```
   HUB_NAME="Example-Hub"
   HUB_DISPLAY_NAME="Example Hub UI Name"
   HUB_DESCRIPTION="A description of the example private curated hub."
   REGION="us-west-2"
   ```

1. 检查您的**管理员** IAM 角色是否拥有创建私有中心所需的 Amazon S3 权限。如果您的角色没有必要的权限，请导航到 IAM 管理控制台中的**角色**页面。选择**管理员**角色，然后在**权限策略**窗格中选择**添加权限**，即可使用 JSON 编辑器创建具有以下权限的内联策略：

------
#### [ JSON ]

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Action": [
                   "s3:ListBucket",
                   "s3:GetObject",
                   "s3:GetObjectTagging"
               ],
               "Resource": [
                   "arn:aws:s3:::jumpstart-cache-prod-REGION",
                   "arn:aws:s3:::jumpstart-cache-prod-REGION/*"
               ],
               "Effect": "Allow"
           }
       ]
   }
   ```

------

1. 使用 `hub.create()` **步骤 3** 中的配置创建私有模型中心。

   ```
   hub = Hub(hub_name=HUB_NAME, sagemaker_session=session)
   
   try:
   # Create the private hub
     hub.create(
         description=HUB_DESCRIPTION,
         display_name=HUB_DISPLAY_NAME
     )
     print(f"Successfully created Hub with name {HUB_NAME} in {REGION}")
   # Check that no other hubs with this internal name exist
   except Exception as e:
     if "ResourceInUse" in str(e):
       print(f"A hub with the name {HUB_NAME} already exists in your account.")
     else:
       raise e
   ```

1. 使用以下 `describe` 命令验证新的私有中心配置：

   ```
   hub.describe()
   ```

# 将模型添加到私有中心
<a name="jumpstart-curated-hubs-admin-guide-add-models"></a>

创建私有中心后，您就可以添加已列入许可名单的模型。有关可用 JumpStart 模型的完整列表，请参阅 SageMaker Python SDK 参考中的[带有预训练模型的内置算法表](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html)。

1. 您可以使用 `hub.list_sagemaker_public_hub_models()` 方法以编程方式筛选可用的模型。您可以选择按框架 (`"framework == pytorch"`)、任务（如映像分类 (`"task == ic"`)）等类别进行筛选。有关筛选条件的更多信息，请参阅[https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/jumpstart/notebook_utils.py](https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/jumpstart/notebook_utils.py)。在 `hub.list_sagemaker_public_hub_models()` 方法中，筛选条件参数是可选的。

   ```
   filter_value = "framework == meta"
   response = hub.list_sagemaker_public_hub_models(filter=filter_value)
   models = response["hub_content_summaries"]
   while response["next_token"]:
       response = hub.list_sagemaker_public_hub_models(filter=filter_value, next_token=response["next_token"])
       models.extend(response["hub_content_summaries"])
   
   print(models)
   ```

1. 然后，您可以通过在 `hub.create_model_reference()` 方法中指定模型 ARN 来添加筛选后的模型。

   ```
   for model in models:
       print(f"Adding {model.get('hub_content_name')} to Hub")
       hub.create_model_reference(model_arn=model.get("hub_content_arn"), model_name=model.get("hub_content_name"))
   ```

# 更新私有中心中的资源
<a name="jumpstart-curated-hubs-update"></a>

您可以在私有中心中更新资源以更改其元数据。您可以更新的资源包括对 Amazon 模型的 SageMaker JumpStart模型引用、自定义模型、笔记本、数据集和 JsonDoc。

更新模型、笔记本、数据集或 JsonDoc 资源时，您可以更新内容描述、显示名称、关键字和支持状态。更新模型对 JumpStart 模型的引用时，只能更新指定要使用的最低模型版本的字段。
+ “更新模型或笔记本资源” 以包含 DataSet/JsonDoc。在 CLI 命令中， DataSets/JsonDocs 应添加到 hub-content-type参数中。

请按照特定于您希望更新的资源的部分进行操作。

## 更新模型或笔记本资源
<a name="jumpstart-curated-hubs-update-model-notebook"></a>

要更新模型或笔记本资源，请使用 [UpdateHubContent](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateHubContent.html)API。

您可以使用此 API 更新的有效元数据字段如下：
+ `HubContentDescription`：资源的描述。
+ `HubContentDisplayName`：资源的显示名称。
+ `HubContentMarkdown`：资源的描述，采用 Markdown 格式。
+ `HubContentSearchKeywords`：资源的可搜索关键字。
+ `SupportStatus`：资源的当前状态。

在您的请求中，请涵盖针对上述一个或多个字段的更改。如果您尝试更新任何其他字段，例如中心内容类型，则会收到错误消息。

------
#### [ 适用于 Python (Boto3) 的 AWS SDK ]

以下示例说明如何使用 适用于 Python (Boto3) 的 AWS SDK 提交[ UpdateHubContent](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateHubContent.html)请求。

**注意**  
您在请求中指定的 `HubContentVersion` 表示特定版本的元数据已更新。要查找您的中心内容的所有可用版本，您可以使用 [ ListHubContentVersions](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListHubContentVersions.html)API。

```
import boto3
sagemaker_client = boto3.Session(region_name=<AWS-region>).client("sagemaker")

sagemaker_client.update_hub_contents(
    HubName=<hub-name>,
    HubContentName=<resource-content-name>,
    HubContentType=<"Model"|"Notebook">,
    HubContentVersion='1.0.0', # specify the correct version that you want to update
    HubContentDescription=<updated-description-string>
)
```

------
#### [ AWS CLI ]

以下示例说明如何使用 AWS CLI 提交[ update-hub-content](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/sagemaker/update-hub-content.html)请求。

```
aws sagemaker update-hub-content \
--hub-name <hub-name> \
--hub-content-name <resource-content-name> \
--hub-content-type <"Model"|"Notebook"> \
--hub-content-version "1.0.0" \
--hub-content-description <updated-description-string>
```

------

## 更新模型参考
<a name="jumpstart-curated-hubs-update-model-reference"></a>

要更新模型对 JumpStart 模型的引用，请使用 [ UpdateHubContentReference](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateHubContentReference.html)API。

您只能更新模型参考的 `MinVersion` 字段。

------
#### [ 适用于 Python (Boto3) 的 AWS SDK ]

以下示例说明如何使用 适用于 Python (Boto3) 的 AWS SDK 提交[ UpdateHubContentReference](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateHubContentReference.html)请求。

```
import boto3
sagemaker_client = boto3.Session(region_name=<AWS-region>).client("sagemaker")

update_response = sagemaker_client.update_hub_content_reference(
    HubName=<hub-name>,
    HubContentName=<model-reference-content-name>,
    HubContentType='ModelReference',
    MinVersion='1.0.0'
)
```

------
#### [ AWS CLI ]

以下示例说明如何使用 AWS CLI 提交[ update-hub-content-reference](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/sagemaker/update-hub-content-reference.html)请求。

```
aws sagemaker update-hub-content-reference \
 --hub-name <hub-name> \
 --hub-content-name <model-reference-content-name> \
 --hub-content-type "ModelReference" \
 --min-version "1.0.0"
```

------

# 私有模型中心的跨账户共享 AWS Resource Access Manager
<a name="jumpstart-curated-hubs-ram"></a>

创建私有模型中心后，您可以使用 AWS Resource Access Manager (AWS RAM) 将该中心共享给必要的帐户。有关创建私有中心的更多信息，请参阅 [创建私有模型中心](jumpstart-curated-hubs-admin-guide-create.md)。下一页将深入介绍与 AWS RAM中私有中心相关的托管权限。有关如何在中创建资源共享的信息 AWS RAM，请参阅[设置跨账户中心共享](jumpstart-curated-hubs-ram-setup.md)。

## 策管的私有中心的托管权限
<a name="jumpstart-curated-hubs-ram-permissions"></a>

可用的访问权限包括读取、读取和使用以及完全访问权限。以下列出了每个权限的权限名称、描述和特定 APIs 可用权限列表：
+ 读取权限 (`AWS RAMPermissionSageMaker AIHubRead`)：读取权限允许资源使用者账户读取共享中心中的内容并查看详细信息和元数据。
  + `DescribeHub`：检索有关中心及其配置的详细信息
  + `DescribeHubContent`：检索有关特定中心可用模型的详细信息
  + `ListHubContent`：列出中心中的所有可用模型
  + `ListHubContentVersions`：列出中心中所有可用模型的版本
+ 读取和使用权限 (`AWS RAMPermissionSageMaker AIHubReadAndUse`)：读取和使用权限允许资源使用者账户读取共享中心中的内容，并部署可用模型进行推理。
  + `DescribeHub`：检索有关中心及其配置的详细信息
  + `DescribeHubContent`：检索有关特定中心可用模型的详细信息
  + `ListHubContent`：列出中心中的所有可用模型
  + `ListHubContentVersions`：列出中心中所有可用模型的版本
  + `DeployHubModel`：支持部署用于推理的可用开放权重中心模型
+ 完全访问权限 (`AWS RAMPermissionSageMaker AIHubFullAccessPolicy`)：完全访问权限允许资源使用者账户读取共享中心中的内容、添加和删除中心内容，并部署用于推理的可用模型。
  + `DescribeHub`：检索有关中心及其配置的详细信息
  + `DescribeHubContent`：检索有关特定中心可用模型的详细信息
  + `ListHubContent`：列出中心中的所有可用模型
  + `ListHubContentVersions`：列出中心中所有可用模型的版本
  + `ImportHubContent`：导入中心内容 
  + `DeleteHubContent`：删除中心内容
  + `CreateHubContentReference`: 创建中心内容引用，将模型从 SageMaker AI **公共模型**中心共享到私有中心 
  + `DeleteHubContentReference`: 删除从 SageMaker AI **公共模型中心到私有中心共享模型**的中心内容引用 
  + `DeployHubModel`：支持部署用于推理的可用开放权重中心模型

专有模型不需要 `DeployHubModel` 权限。

# 设置跨账户中心共享
<a name="jumpstart-curated-hubs-ram-setup"></a>

SageMaker 使用 [AWS Resource Access Manager (AWS RAM)](https://docs.aws.amazon.com/ram/latest/userguide/what-is.html) 帮助您安全地跨账户共享您的私有中心。使用以下说明以及*AWS RAM 用户指南*中的共享[AWS 资源说明来设置跨账户中心共享](https://docs.aws.amazon.com/ram/latest/userguide/getting-started-sharing.html#getting-started-sharing-create)。

**创建资源共享**

1. 通过 [AWS RAM 管理控制台](https://console.aws.amazon.com/ram/home)选择**创建资源共享**。

1. 指定资源共享详细信息时，请选择**SageMaker 集线器**资源类型，然后再选择一个要共享的专用集线器。当您与任何其他账户共享中心时，其所有内容也会被隐式共享。

1. 将权限与资源共享关联。有关托管权限的更多信息，请参阅 [策管的私有中心的托管权限](jumpstart-curated-hubs-ram.md#jumpstart-curated-hubs-ram-permissions)。

1. 使用 AWS 账户指定 IDs 要向其授予共享资源访问权限的账户。

1. 查看您的资源共享配置，然后选择**创建资源共享**。可能需要几分钟时间来完成资源共享和主体关联。

有关更多信息，请参阅《*AWS Resource Access Manager 用户指南》*[中的共享 AWS 资源](https://docs.aws.amazon.com/ram/latest/userguide/getting-started-sharing.html)。

设置资源共享和主体关联后，指定的 AWS 账户会收到加入资源共享的邀请。 AWS 账号必须接受邀请才能访问任何共享资源。

有关通过接受资源共享邀请的更多信息 AWS RAM，请参阅*AWS Resource Access Manager 用户指南*中的[使用共享 AWS 资源](https://docs.aws.amazon.com/ram/latest/userguide/getting-started-shared.html)。

# 从私有中心删除模型
<a name="jumpstart-curated-hubs-admin-guide-delete-models"></a>

通过在 `hub.delete_model_reference()` 方法中指定模型 ARN，您可以从组织使用的私有中心中删除模型。这就取消了从私有中心访问模型的权限。

```
hub.delete_model_reference(model-name)
```

# 限制对 JumpStart 门控模型的访问权限
<a name="jumpstart-curated-hubs-gated-model-access"></a>

Amazon SageMaker JumpStart 提供对公开和专有基础模型的访问权限。私有 Amazon S3 存储桶中的某些门控模型需要您接受模型的 EULA（最终用户许可协议）后才能访问这些模型。有关更多信息，请参阅 [使用 SDK 接受最终用户许可协议 SageMaker Python](jumpstart-foundation-models-choose.md#jumpstart-foundation-models-choose-eula-python-sdk)。

当前的默认行为是，如果用户接受模型的 EULA，则用户可以访问模型并创建[微调训练作业](jumpstart-foundation-models-use-python-sdk-estimator-class.md)。但是，如果您是管理员，并且想要限制对这些门控模型的微调访问权限，则可以设置一个策略，拒绝在向门控模型发出请求时使用 `CreateTrainingJob` 操作的权限。

以下是管理员可以向用户的 IAM 角色添加的示例 AWS Identity and Access Management (IAM) 策略：

```
{
    "Effect": "Deny",
    "Action": "sagemaker:CreateTrainingJob",
    "Resource": "*",
    "Condition": {
        "Bool": {
            "sagemaker:DirectGatedModelAccess": "true"
        }
    }
}
```

如果您想授予用户访问特定模型的权限，而不提供对门控模型的无限制访问权限，请设置策管中心并将具体的模型添加到该中心。有关更多信息，请参阅 [用于基础模型访问控制的私人策划中心 JumpStart](jumpstart-curated-hubs.md)。

# 移除对 SageMaker **公共模型**中心的访问权限
<a name="jumpstart-curated-hubs-admin-guide-remove-public-hub"></a>

除了在 Studio JumpStart 中添加私有精选中心外，您还可以取消用户对 SageMaker **公共模型**中心的访问权限。 SageMaker **公共模型**中心可以访问所有可用的 JumpStart 基础模型。

如果您删除了对 SageMaker **公共模型**中心的访问权限，并且用户只能访问一个专用中心，则当用户在 Studio 的左侧导航窗格**JumpStart**中进行选择时，他们将直接进入该专用中心。如果用户可以访问多个专用集线器，则当用户在 Studio 的左侧导航窗格**JumpStart**中进行选择时，系统会将该用户带到**集线器**菜单页面。

使用以下内联策略删除用户对 SageMaker **公共模型**中心的访问权限：

**注意**  
您可以在下面的策略中指定您希望中心访问的任何其他 Amazon S3 存储桶。请务必将 *`REGION`* 替换为您中心的区域。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Action": "s3:*",
            "Effect": "Deny",
            "NotResource": [
                "arn:aws:s3:::jumpstart-cache-prod-us-east-1/*.ipynb",
                "arn:aws:s3:::jumpstart-cache-prod-us-east-1/*eula*",
                "arn:aws:s3:::amzn-s3-demo-bucket/*"
            ]
        },
        {
            "Action": "sagemaker:*",
            "Effect": "Deny",
            "Resource": [
                "arn:aws:sagemaker:us-east-1:aws:hub/SageMakerPublicHub",
                "arn:aws:sagemaker:us-east-1:aws:hub-content/SageMakerPublicHub/*/*"
            ]
        }
    ]
}
```

------

# 删除私有中心
<a name="jumpstart-curated-hubs-admin-guide-delete"></a>

您可以从管理员账户删除私有中心。删除私有中心之前，您必须先删除此中心中的任何内容。使用以下命令删除中心内容和中心：

```
# List the model references in the private hub
response = hub.list_models()
models = response["hub_content_summaries"]
while response["next_token"]:
    response = hub.list_models(next_token=response["next_token"])
    models.extend(response["hub_content_summaries"])

# Delete all model references in the hub
for model in models:
    hub.delete_model_reference(model_name=model.get('HubContentName'))

# Delete the private hub
hub.delete()
```

# 问题排查
<a name="jumpstart-curated-hubs-admin-guide-troubleshooting"></a>

以下几节将介绍有关创建私有模型中心时可能出现的 IAM 权限问题以及如何解决这些问题的信息。

**调用 `CreateModel` 操作时 `ValidationException`：无法访问模型数据**

如果您没有为**管理员**角色配置相应的 Amazon S3 权限，则会出现此异常。有关创建私有中心所需的 Amazon S3 权限的更多信息，请参阅 [创建私有模型中心](jumpstart-curated-hubs-admin-guide-create.md) 中的 **步骤 3**。

**调用 `create()` 时 `Access Denied` 或 `Forbidden`**

如果您没有访问与 SageMaker**公共模型**中心关联的 Amazon S3 存储桶的相应权限，则在创建私有中心时会被拒绝访问。有关创建私有中心所需的 Amazon S3 权限的更多信息，请参阅 [创建私有模型中心](jumpstart-curated-hubs-admin-guide-create.md) 中的 **步骤 3**。

# 用户指南
<a name="jumpstart-curated-hubs-user-guide"></a>

以下主题涵盖了在 Amazon SageMaker JumpStart 策划的模型中心中访问和使用模型。了解如何通过 Amazon SageMaker Studio 界面或使用 Pyth SageMaker on 软件开发工具包以编程方式访问你精心策划的中心模型。此外，了解如何微调策管中心模型，以使其适应您的特定使用案例和业务需求。

**Topics**
+ [访问 Amazon 中精心策划的模型中心 SageMaker JumpStart](jumpstart-curated-hubs-access-hubs.md)
+ [微调策管中心模型](jumpstart-curated-hubs-fine-tune.md)

# 访问 Amazon 中精心策划的模型中心 SageMaker JumpStart
<a name="jumpstart-curated-hubs-access-hubs"></a>

你可以通过 Studio 或 SageMaker Python SDK 访问私有模型中心。

## 访问 Studio 中的私有模型中心
<a name="jumpstart-curated-hubs-user-guide-studio"></a>

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用更新后的 Studio 体验。有关使用 Studio Classic 应用程序的信息，请参阅 [亚马逊 SageMaker Studio 经典版](studio.md)。

**在 Amazon SageMaker Studio 中，通过左侧面板上的**主页或主页**菜单打开 JumpStart 登录页面。**这将打开**SageMaker JumpStart**登录页面，您可以在其中浏览模型中心并搜索模型。
+ 在 “**主页**” 页面中，**JumpStart**在 “**预构建和自动解决方案**” 窗格中进行选择。
+ 从左侧面板的 “**主页**” 菜单中导航到该**JumpStart**节点。

有关开始使用 Amazon SageMaker Studio 的更多信息，请参阅[亚马逊 SageMaker Studio](studio-updated.md)。

在 Studio 的**SageMaker JumpStart**登录页面上，您可以浏览任何包含贵组织允许名单模型的私有模型中心。如果您只能访问一个模型中心，则**SageMaker JumpStart**登录页面会将您直接带到该中心。如果您有权访问多个中心，则会进入**中心**页面。

有关微调、部署和评估可以在 Studio 中访问的模型的更多信息，请参阅 [在 Studio 中使用基础模型](jumpstart-foundation-models-use-studio-updated.md)。

## 使用 SageMaker Python 软件开发工具包访问你的私有模型中心
<a name="jumpstart-curated-hubs-user-guide-sdk"></a>

你可以使用 SageMaker Python 软件开发工具包访问你的私有模型中心。您的管理员提供您读取、使用或编辑策管的中心的权限。

**注意**  
如果中心是跨账户共享的，则 `HUB_NAME` 必须是中心 ARN。如果中心不是跨账户共享的，则 `HUB_NAME` 可以是中心名称。

1. 安装 SageMaker Python 软件开发工具包并导入必要的 Python 软件包。

   ```
   # Install the SageMaker Python SDK
       !pip3 install sagemaker --force-reinstall --quiet
       
       # Import the necessary Python packages
       import boto3
       from sagemaker import Session
       from sagemaker.jumpstart.hub.hub import Hub
       from sagemaker.jumpstart.model import JumpStartModel
       from sagemaker.jumpstart.estimator import JumpStartEstimator
   ```

1. 初始化 A SageMaker I 会话并使用集线器名称和区域连接到您的私有集线器。

   ```
   # If a hub is shared across accounts, then the HUB_NAME must be the hub ARN
       HUB_NAME="Example-Hub-ARN" 
       REGION="us-west-2" 
       
       # Initialize a SageMaker session
       sm_client = boto3.client('sagemaker') 
       sm_runtime_client = boto3.client('sagemaker-runtime') 
       session = Session(sagemaker_client=sm_client, 
                           sagemaker_runtime_client=sm_runtime_client)
       
       # Initialize the private hub
       hub = Hub(hub_name=HUB_NAME, sagemaker_session=session)
   ```

1. 连接到私有中心后，您可以使用以下命令列出此中心中的所有可用模型：

   ```
   response = hub.list_models()
       models = response["hub_content_summaries"]
       while response["next_token"]:
           response = hub.list_models(next_token=response["next_token"])
           models.extend(response["hub_content_summaries"])
           
       print(models)
   ```

1. 您可以使用以下命令，通过模型名称获取特定模型的更多信息：

   ```
   response = hub.describe_model(model_name="example-model")
       print(response)
   ```

有关微调和部署您可以使用 SageMaker Python SDK 访问的模型的更多信息，请参阅[在 SageMaker Python SDK 中使用基础模型](jumpstart-foundation-models-use-python-sdk.md)。

# 微调策管中心模型
<a name="jumpstart-curated-hubs-fine-tune"></a>

在您的私有策管模型中心中，您可以使用模型参考运行微调训练作业。模型引用指向 SageMaker AI 公共中心中公开可用的 JumpStart 模型，但您可以根据自己的数据针对您的特定用例对模型进行微调。微调作业完成后，您可以访问模型权重，然后可以使用这些权重或将其部署到端点。

使用 Pyth SageMaker on SDK，只需几行代码即可对精心策划的中心模型进行微调。有关微调公开可用 JumpStart模型的更多一般信息，请参阅[用于微调的基础模型和超参数](jumpstart-foundation-models-fine-tuning.md)。

## 先决条件
<a name="jumpstart-curated-hubs-fine-tune-prereqs"></a>

要微调精选中心中的 JumpStart 模型引用，请执行以下操作：

1. 确保您的用户的 IAM 角色附加了 SageMaker AI `TrainHubModel` 权限。有关更多信息，请参阅《AWS IAM 用户指南》**中的[添加和移除 IAM 身份权限](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html)。

   您应将下列示例策略附加到用户的 IAM 角色。

------
#### [ JSON ]

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Sid": "VisualEditor0",
               "Effect": "Allow",
               "Action": "sagemaker:TrainHubModel",
               "Resource": "arn:aws:sagemaker:*:111122223333:hub/*"
           }
       ]
   }
   ```

------
**注意**  
如果您跨多个账户共享策管中心，并且中心内容归其他账户所有，请确保您的 `HubContent`（模型参考资源）具有基于资源的 IAM 策略，另外向请求的账户授予 `TrainHubModel` 权限，如以下示例所示。  

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Sid": "AllowCrossAccountSageMakerAccess",
               "Effect": "Allow",
               "Principal": {
                   "AWS": "arn:aws:iam::111122223333:root"
               },
               "Action": [
                   "sagemaker:TrainHubModel"
               ],
               "Resource": [
                   "arn:aws:sagemaker:*:111122223333:hub/*"
               ]
           }
       ]
   }
   ```

1. 拥有一个私人策划中心，其中包含对要微调的 JumpStart 模型的模型引用。有关创建私有中心的更多信息，请参阅 [创建私有模型中心](jumpstart-curated-hubs-admin-guide-create.md)。要了解如何向您的私有中心添加公开可用的 JumpStart 模型，请参阅[将模型添加到私有中心](jumpstart-curated-hubs-admin-guide-add-models.md)。
**注意**  
您选择的 JumpStart 模型应该是可微调的。您可以通过查看[内置算法与预训练模型表](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html)来验证模型是否可微调。

1. 有一个要用于微调该模型的训练数据集。数据集应采用适用于您希望微调的模型的训练格式。

## 微调策管中心模型参考
<a name="jumpstart-curated-hubs-fine-tune-pysdk"></a>

以下过程向您展示了如何使用 Pyth SageMaker on SDK 在您的私有策划中心中微调模型引用。

1. 确保你安装了（至少`2.242.0`）最新版本的 SageMaker Python 开发工具包。有关更多信息，请参阅[使用 SageMaker Python 软件开发工具包的 2.x 版本](https://sagemaker.readthedocs.io/en/stable/v2.html)。

   ```
   !pip install --upgrade sagemaker
   ```

1. 从 SageMaker Python 软件开发工具包中导入 适用于 Python (Boto3) 的 AWS SDK 和你需要的模块。

   ```
   import boto3
   from sagemaker.jumpstart.estimator import JumpStartEstimator
   from sagemaker.session import Session
   ```

1. 初始化 Boto3 会话、A SageMaker I 客户端和 Pyth SageMaker on SDK 会话。

   ```
   sagemaker_client = boto3.Session(region_name=<AWS-region>).client("sagemaker")
   sm_session = Session(sagemaker_client=sagemaker_client)
   ```

1. 创建`JumpStartEstimator`并提供 JumpStart 模型 ID、包含模型引用的中心名称以及您的 SageMaker Python SDK 会话。有关模型列表 IDs，请参阅 “[带有预训练模型的内置算法表](https://sagemaker.readthedocs.io/en/stable/doc_utils/pretrainedmodels.html)”。

   或者，您可以在创建估算器时指定 `instance_type` 和 `instance_count` 字段。如果您不这样做，则训练作业将使用您所使用的模型的默认实例类型和计数。

   您也可以选择指定要存储经过微调的模型权重的 Amazon S3 位置的 `output_path`。如果您未指定`output_path`，则使用账户中该区域的默认 A SageMaker I Amazon S3 存储桶，其命名格式如下：`sagemaker-<region>-<account-id>`。

   ```
   estimator = JumpStartEstimator(
       model_id="meta-textgeneration-llama-3-2-1b",
       hub_name=<your-hub-name>,
       sagemaker_session=sm_session, # If you don't specify an existing session, a default one is created for you
       # Optional: specify your desired instance type and count for the training job
       # instance_type = "ml.g5.2xlarge"
       # instance_count = 1
       # Optional: specify a custom S3 location to store the fine-tuned model artifacts
       # output_path: "s3://<output-path-for-model-artifacts>"
   )
   ```

1. 使用 `training` 键创建字典，其中您指定了微调数据集的位置。此示例指向 Amazon S3 URI。如果您还有其他注意事项，例如使用本地模式或多个训练数据通道，请参阅 SageMaker Python SDK 文档中的 [ JumpStartEstimator.fit ()](https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html#sagemaker.jumpstart.estimator.JumpStartEstimator.fit) 以了解更多信息。

   ```
   training_input = {
       "training": "s3://<your-fine-tuning-dataset>"
   }
   ```

1. 调用估算器的 `fit()` 方法并传入您的训练数据和您的 EULA 接受情况（如果适用）。
**注意**  
以下示例设置 `accept_eula=False.`。要接受 EULA，您应该手动将该值更改为 `True`。

   ```
   estimator.fit(inputs=training_input, accept_eula=False)
   ```

您的微调作业现在应该开始了。

您可以在 SageMaker AI 控制台中或使用 [ListTrainingJobs](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ListTrainingJobs.html)API 查看训练作业，查看微调作业。

您可以在`JumpStartEstimator`对象中指定的 Amazon S3 `output_path` 上访问经过微调的模型项目（该区域的默认 SageMaker AI Amazon S3 存储桶，或者您指定的自定义 Amazon S3 路径（如果适用））。

# Studio 经典版 SageMaker JumpStart 中的亚马逊
<a name="jumpstart-studio-classic"></a>

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

以下 JumpStart 功能仅在 Amazon SageMaker Studio 经典版中可用。
+ [特定于任务的模型](jumpstart-models.md)
+ [共享模型和笔记本](jumpstart-content-sharing.md)
+ [End-to-end JumpStart 解决方案模板](jumpstart-solutions.md)
+ [亚马逊 SageMaker JumpStart 行业：金融](studio-jumpstart-industry.md)

# 特定于任务的模型
<a name="jumpstart-models"></a>

JumpStart 支持十五种最流行的问题类型的任务特定模型。在支持的问题类型中，共有十三种类型与视觉和 NLP 相关。有八种问题类型支持增量训练和微调。有关增量训练和超参数调整的更多信息，请参阅 [SageMaker AI 自动模型](https://docs.aws.amazon.com/sagemaker/latest/dg/automatic-model-tuning.html)调整。 JumpStart 还支持四种常用的表格数据建模算法。

您可以从 Studio 或 Studio Classic 的 JumpStart 登录页面搜索和浏览模特。当您选择模型时，模型详细信息页面会提供有关该模型的信息，您可以通过几个步骤来训练和部署模型。描述部分介绍了您可以通过模型完成的任务、预期的输入和输出类型以及微调模型所需的数据类型。

您还可以通过 [SageMaker Python 软件开发工具包](https://sagemaker.readthedocs.io/en/stable/overview.html#use-prebuilt-models-with-sagemaker-jumpstart)以编程方式使用模型。有关所有可用型号的列表，请参阅[JumpStart可用型号表](https://sagemaker.readthedocs.io/en/v2.132.0/doc_utils/pretrainedmodels.html)。

下表汇总了问题类型列表及其示例 Jupyter 笔记本的链接。


| 问题类型  | 支持使用预训练模型进行推理  | 可在自定义数据集上训练  | 支持的框架  | 示例笔记本  | 
| --- | --- | --- | --- | --- | 
| 图像分类  | 支持  | 是  |  PyTorch, TensorFlow  |  [简介 JumpStart -图像分类](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_image_classification/Amazon_JumpStart_Image_Classification.ipynb)  | 
| 对象检测  | 支持  | 是  | PyTorch, TensorFlow, MXNet |  [简介 JumpStart -物体检测](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_object_detection/Amazon_JumpStart_Object_Detection.ipynb)  | 
| 语义分割  | 支持  | 是  | MXNet  |  [简介 JumpStart -语义分割](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_semantic_segmentation/Amazon_JumpStart_Semantic_Segmentation.ipynb)  | 
| 实例分段  | 支持  | 是  | MXNet  |  [简介 JumpStart -实例分割](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_instance_segmentation/Amazon_JumpStart_Instance_Segmentation.ipynb)  | 
| 图像嵌入  | 是  | 否  | TensorFlow, MXNet |  [简介 JumpStart -图像嵌入](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_image_embedding/Amazon_JumpStart_Image_Embedding.ipynb)  | 
| 文本分类  | 支持  | 是  | TensorFlow |  [简介 JumpStart -文本分类](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_text_classification/Amazon_JumpStart_Text_Classification.ipynb)  | 
| 句子对分类  | 支持  | 是  | TensorFlow，Hugging Face |  [简介 JumpStart -句子对分类](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_sentence_pair_classification/Amazon_JumpStart_Sentence_Pair_Classification.ipynb)  | 
| 问题回答  | 支持  | 是  | PyTorch，Hugging Face |  [简介 JumpStart — 问题解答](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_question_answering/Amazon_JumpStart_Question_Answering.ipynb)  | 
| 指定实体识别  | 是  | 否  | Hugging Face  |  [简介 JumpStart -命名实体识别](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_named_entity_recognition/Amazon_JumpStart_Named_Entity_Recognition.ipynb)  | 
| 文本摘要  | 是  | 否  | Hugging Face  |  [简介 JumpStart -文本摘要](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_text_summarization/Amazon_JumpStart_Text_Summarization.ipynb)  | 
| 文本生成  | 是  | 否  | Hugging Face  |  [简介 JumpStart -文本生成](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_text_generation/Amazon_JumpStart_Text_Generation.ipynb)  | 
| 机器翻译  | 是  | 否  | Hugging Face  |  [简介 JumpStart -机器翻译](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_machine_translation/Amazon_JumpStart_Machine_Translation.ipynb)  | 
| 文本嵌入  | 是  | 否  | TensorFlow, MXNet |  [简介 JumpStart -文本嵌入](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/jumpstart_text_embedding/Amazon_JumpStart_Text_Embedding.ipynb)  | 
| 表格分类  | 支持  | 是  | LightGBM、、 AutoGluon-Tabular CatBoost、 XGBoost、Linear Learner TabTransformer |  [简介 JumpStart ——表格分类——LightGBM， CatBoost](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/lightgbm_catboost_tabular/Amazon_Tabular_Classification_LightGBM_CatBoost.ipynb) [简介 JumpStart -表格分类- XGBoost，线性学习器](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/xgboost_linear_learner_tabular/Amazon_Tabular_Classification_XGBoost_LinearLearner.ipynb) [简介 JumpStart -表格分类-学员 AutoGluon](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/autogluon_tabular/Amazon_Tabular_Classification_AutoGluon.ipynb) [简介 JumpStart -表格分类-学员 TabTransformer](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/tabtransformer_tabular/Amazon_Tabular_Classification_TabTransformer.ipynb)  | 
| 表格回归  | 支持  | 是  | LightGBM、、 AutoGluon-Tabular CatBoost、 XGBoost、Linear Learner TabTransformer |  [简介 JumpStart ——表格回归——lightGBM， CatBoost](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/lightgbm_catboost_tabular/Amazon_Tabular_Regression_LightGBM_CatBoost.ipynb) [简介 JumpStart — 表格回归- XGBoost，线性学习器](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/xgboost_linear_learner_tabular/Amazon_Tabular_Regression_XGBoost_LinearLearner.ipynb) [简介 JumpStart — 表格回归-学员 AutoGluon ](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/autogluon_tabular/Amazon_Tabular_Regression_AutoGluon.ipynb) [简介 JumpStart — 表格回归-学员 TabTransformer](https://github.com/aws/amazon-sagemaker-examples/blob/main/introduction_to_amazon_algorithms/tabtransformer_tabular/Amazon_Tabular_Regression_TabTransformer.ipynb)  | 

# 部署模型
<a name="jumpstart-deploy"></a>

当您从部署模型时 JumpStart， SageMaker AI 会托管模型并部署可用于推理的终端节点。 JumpStart 还提供了一个示例笔记本，您可以在部署模型后使用它来访问模型。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

**注意**  
有关在 Studio 中部署 JumpStart 模型的更多信息，请参阅 [在 Studio 中部署模型](jumpstart-foundation-models-use-studio-updated-deploy.md)

## 模型部署配置
<a name="jumpstart-config"></a>

选择模型后，将打开该模型的选项卡。在**部署模型**窗格中，选择**部署配置**以配置您的模型部署。

 ![\[The Deploy Model pane.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy.png) 

用于部署模型的默认实例类型取决于模型。实例类型是运行训练作业的硬件。在以下示例中，`ml.p2.xlarge` 实例默认用于此特定 BERT 模型。

您还可以更改终端节点名称、添加`key;value`资源标签、激活或停用与模型相关的任何 JumpStart 资源`jumpstart-`的前缀，以及指定用于存储 A SageMaker I 终端节点使用的模型项目的 Amazon S3 存储桶。

 ![\[JumpStart Deploy Model pane with Deployment Configuration open to select its settings.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-config.png) 

选择**安全设置**为模型指定 AWS Identity and Access Management (IAM) 角色、Amazon Virtual Private Cloud (Amazon VPC) 和加密密钥。

 ![\[JumpStart Deploy Model pane with Security Settings open to select its settings.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security.png) 

## 模型部署安全
<a name="jumpstart-config-security"></a>

使用部署模型时 JumpStart，您可以为模型指定 IAM 角色、Amazon VPC 和加密密钥。没有为这些条目指定任何值时：默认 IAM 角色是您的 Studio Classic 运行时系统角色；使用默认加密方法；不使用 Amazon VPC。

### IAM 角色
<a name="jumpstart-config-security-iam"></a>

您可以选择在培训作业和托管作业中传递的 IAM 角色。 SageMaker AI 使用此角色来访问训练数据和模型工件。如果您未选择 IAM 角色，A SageMaker I 将使用您的 Studio Classic 运行时角色部署模型。有关 IAM 角色的更多信息，请参阅 [AWS Identity and Access Management 适用于亚马逊 A SageMaker I](security-iam.md)。

您传递的角色必须有权访问模型所需的资源，并且必须具备以下所有权限。
+ 对于训练作业：[CreateTrainingJob API：执行角色权限](https://docs.aws.amazon.com//sagemaker/latest/dg/sagemaker-roles.html#sagemaker-roles-createtrainingjob-perms)。
+ 对于托管作业：[CreateModel API：执行角色权限](https://docs.aws.amazon.com//sagemaker/latest/dg/sagemaker-roles.html#sagemaker-roles-createmodel-perms)。

**注意**  
您可以缩小在以下每个角色中授予的 Amazon S3 权限的范围。使用您的亚马逊简单存储服务 (Amazon S3) 存储桶的 ARN 和 Amazon S3 存储桶来执行此操作。 JumpStart   

```
[
    {
      "Effect": "Allow",
      "Action": [
        "s3:GetObject",
        "s3:ListBucket"
      ],
      "Resource": [
        "arn:aws:s3:::jumpstart-cache-prod-<region>/*",
        "arn:aws:s3:::jumpstart-cache-prod-<region>",
        "arn:aws:s3:::<bucket>/*"
      ]
    },
    {
      "Effect": "Allow",
      "Action": [
           "cloudwatch:PutMetricData",
           "logs:CreateLogStream",
          "logs:PutLogEvents",
          "logs:CreateLogGroup",
          "logs:DescribeLogStreams",
          "ecr:GetAuthorizationToken"
      ],
      "Resource": [
        "*"
      ]
    },
    {
      "Effect": "Allow",
      "Action": [
        "ecr:BatchGetImage",
        "ecr:BatchCheckLayerAvailability",
        "ecr:GetDownloadUrlForLayer"
      ],
      "Resource": [
        "*"
      ]
    },
  ]
}
```

**查找 IAM 角色**

如果您选择此选项，则必须从下拉列表中选择一个现有 IAM 角色。

 ![\[JumpStart Security Settings IAM section with Find IAM role selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security-findiam.png) 

**输入 IAM 角色**

如果您选择此选项，则必须手动输入现有 IAM 角色的 ARN。如果您的 Studio Classic 运行时系统角色或 Amazon VPC 阻止了 `iam:list* ` 调用，则必须通过此选项来使用现有的 IAM 角色。

 ![\[JumpStart Security Settings IAM section with Input IAM role selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security-inputiam.png) 

### Amazon VPC
<a name="jumpstart-config-security-vpc"></a>

所有 JumpStart 模型均在网络隔离模式下运行。创建模型容器后，就无法再进行调用。您可以选择在训练作业和托管作业中通过的 Amazon VPC。 SageMaker AI 使用此 Amazon VPC 从您的 Amazon S3 存储桶中推送和提取资源。此 Amazon VPC 不同于限制从您的 Studio Classic 实例访问公共互联网的 Amazon VPC。有关 Studio Classic Amazon VPC 的更多信息，请参阅 [将 VPC 中的 Studio 笔记本连接到外部资源](studio-notebooks-and-internet-access.md)。

您传递的 Amazon VPC 不需要访问公共互联网，但它需要能够访问 Amazon S3。用于 Amazon S3 的 Amazon VPC 端点必须至少允许访问模型所需的以下资源。

```
{
  "Effect": "Allow",
  "Action": [
    "s3:GetObject",
    "s3:PutObject",
    "s3:ListMultipartUploadParts",
    "s3:ListBucket"
  ],
  "Resources": [
    "arn:aws:s3:::jumpstart-cache-prod-<region>/*",
    "arn:aws:s3:::jumpstart-cache-prod-<region>",
    "arn:aws:s3:::bucket/*"
  ]
}
```

如果您未选择 Amazon VPC，则不使用 Amazon VPC。

**查找 VPC**

如果您选择此选项，则必须从下拉列表中选择一个现有 Amazon VPC。选择 Amazon VPC 后，您必须为 Amazon VPC 选择子网和安全组。有关子网和安全组的更多信息，请参阅[ VPCs和子网概述](https://docs.aws.amazon.com//vpc/latest/userguide/VPC_Subnets.html)。

 ![\[JumpStart Security Settings VPC section with Find VPC selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security-findvpc.png) 

**输入 VPC**

如果您选择此选项，则必须手动选择构成您的 Amazon VPC 的子网和安全组。如果 Studio Classic 运行时系统角色或 Amazon VPC 阻止了 `ec2:list*` 调用，则您必须使用此选项来选择子网和安全组。

 ![\[JumpStart Security Settings VPC section with Input VPC selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security-inputvpc.png) 

### 加密密钥
<a name="jumpstart-config-security-encryption"></a>

您可以选择在训练作业和托管作业中传递的 AWS KMS 密钥。 SageMaker AI 使用此密钥加密容器的 Amazon EBS 卷，并使用 Amazon S3 中重新打包的模型来托管任务和训练作业的输出。有关 AWS KMS 密钥的更多信息，请参阅[AWS KMS 密钥](https://docs.aws.amazon.com//kms/latest/developerguide/concepts.html#kms_keys)。

您传递的密钥必须信任您传递的 IAM 角色。如果您未指定 IAM 角色，则该 AWS KMS 密钥必须信任您的 Studio Classic 运行时角色。

如果您不选择 AWS KMS 密钥， SageMaker AI 会为 Amazon EBS 卷和 Amazon S3 项目中的数据提供默认加密。

**查找加密密钥**

如果选择此选项，则必须从下拉列表中选择现有 AWS KMS 密钥。

 ![\[JumpStart Security Settings encryption section with Find encryption keys selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security-findencryption.png) 

**输入加密密钥**

如果选择此选项，则必须手动输入 AWS KMS 密钥。如果您的 Studio Classic 执行角色或 Amazon VPC 阻止了`kms:list* `呼叫，则必须使用此选项来选择现有 AWS KMS 密钥。

 ![\[JumpStart Security Settings encryption section with Input encryption keys selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-deploy-security-inputencryption.png) 

## 为 JumpStart 模型配置默认值
<a name="jumpstart-config-defaults"></a>

您可以为 IAM 角色和 KMS 密钥等参数配置默认值 VPCs，以便为 JumpStart 模型部署和训练进行预填充。配置默认值后，Studio Classic UI 会自动向 JumpStart 模型提供您指定的安全设置和标签，以简化部署和训练工作流程。管理员和最终用户可以初始化 YAML 格式的配置文件中的默认值。

默认情况下， SageMaker Python SDK 使用两个配置文件：一个用于管理员，另一个用于用户。使用管理员配置文件，管理员可以定义一组默认值。最终用户可以使用用户配置文件来覆盖在管理员配置文件中设置的值，并设置其他默认值。有关更多信息，请参阅[默认配置文件位置](https://sagemaker.readthedocs.io/en/stable/overview.html#default-configuration-file-location)。

以下代码示例列出了在 Amazon SageMaker Studio Classic 中使用 SageMaker Python 软件开发工具包时配置文件的默认位置。

```
# Location of the admin config file
/etc/xdg/sagemaker/config.yaml

# Location of the user config file
/root/.config/sagemaker/config.yaml
```

在用户配置文件中指定的值会覆盖在管理员配置文件中设置的值。在 Amazon A SageMaker I 域中，每个用户个人资料的配置文件都是唯一的。用户配置文件的 Studio Classic 应用程序与用户配置文件关联。有关更多信息，请参阅 [域用户配置文件](domain-user-profile.md)。

管理员可以选择通过`JupyterServer`生命周期配置为 JumpStart 模型训练和部署设置默认配置。有关更多信息，请参阅 [创建生命周期配置并将其与 Amazon SageMaker Studio Classic 关联](studio-lcc-create.md)。

### 默认值配置 YAML 文件
<a name="jumpstart-config-defaults-yaml"></a>

您的配置文件应符合 P SageMaker ython SDK [配置文件结构](https://sagemaker.readthedocs.io/en/stable/overview.html#configuration-file-structure)。请注意，`TrainingJob``Model`、和`EndpointConfig`配置中的特定字段适用于 JumpStart 模型训练和部署默认值。

```
SchemaVersion: '1.0'
SageMaker:
  TrainingJob:
    OutputDataConfig:
      KmsKeyId: example-key-id
    ResourceConfig:
      # Training configuration - Volume encryption key
      VolumeKmsKeyId: example-key-id
    # Training configuration form - IAM role
    RoleArn: arn:aws:iam::123456789012:role/SageMakerExecutionRole
    VpcConfig:
      # Training configuration - Security groups
      SecurityGroupIds:
      - sg-1
      - sg-2
      # Training configuration - Subnets
      Subnets:
      - subnet-1
      - subnet-2
    # Training configuration - Custom resource tags
    Tags:
    - Key: Example-key
      Value: Example-value
  Model:
    EnableNetworkIsolation: true
    # Deployment configuration - IAM role
    ExecutionRoleArn: arn:aws:iam::123456789012:role/SageMakerExecutionRole
    VpcConfig:
      # Deployment configuration - Security groups
      SecurityGroupIds:
      - sg-1
      - sg-2
      # Deployment configuration - Subnets
      Subnets:
      - subnet-1
      - subnet-2
  EndpointConfig:
    AsyncInferenceConfig:
      OutputConfig:
        KmsKeyId: example-key-id
    DataCaptureConfig:
      # Deployment configuration - Volume encryption key
      KmsKeyId: example-key-id
    KmsKeyId: example-key-id
    # Deployment configuration - Custom resource tags
    Tags:
    - Key: Example-key
      Value: Example-value
```

# 微调模型
<a name="jumpstart-fine-tune"></a>

微调过程在新数据集上训练已经预训练的模型，而无需从头开始训练。这个过程也称为转移学习，可以使用较小数据集和较短的训练时间生成准确模型。如果模型的卡片显示**可微调**属性设置为**是**，则可以对其进行微调。

 ![\[JumpStart fine-tunable Image Classification - TensorFlow model\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-finetune-model.png) 

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

**注意**  
有关在 Studio 中微调 JumpStart 模型的更多信息，请参阅 [在 Studio 中微调模型](jumpstart-foundation-models-use-studio-updated-fine-tune.md)

## 微调数据来源
<a name="jumpstart-fine-tune-data"></a>

 在微调模型时，您可以使用默认数据集或选择自己的数据，该数据位于 Amazon S3 存储桶中。

要浏览可供您使用的存储桶，请选择**查找 S3 存储桶**。这些存储桶受用于设置 Studio Classic 帐户的权限的限制。您也可以通过选择**输入 Amazon S3 存储桶位置**来指定 Amazon S3 URI。

 ![\[JumpStart data source settings with default dataset selected.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-dataset.png) 

**提示**  
 要了解如何格式化存储桶中的数据，请选择**了解更多**。模型的描述部分还提供了有关输入和输出的详细信息。  

 对于文本模型：
+  存储桶必须具有 data.csv 文件。
+  第一列必须是用于类标签的唯一整数。例如，`1`、`2`、`3`、`4`、`n`
+  第二列必须是字符串。
+  第二列应包含与模型的类型和语言相符的对应文本。  

 对于视觉模型：
+  存储桶中的子目录数量必须与类数相同。
+  每个子目录都应包含属于该类的 .jpg 格式的图像。

**注意**  
 Amazon S3 存储桶必须与您运行 SageMaker Studio Classic 的 AWS 区域 位置相同，因为 SageMaker AI 不允许跨区域请求。

## 微调部署配置
<a name="jumpstart-fine-tune-deploy"></a>

p3 系列是用于深度学习训练最快的系列，建议用于微调模型。下图显示了每种实例类型 GPUs 中的数量。还有其他可供选择的选项，包括 p2 和 g4 实例类型。


|  实例类型  |  GPUs  | 
| --- | --- | 
|  p3.2xlarge  |  1  | 
|  p3.8xlarge  |  4  | 
|  p3.16xlarge  |  8  | 
|  p3dn.24xlarge  |  8  | 

## 超参数
<a name="jumpstart-hyperparameters"></a>

您可以自定义用于微调模型的训练作业的超参数。每个可微调模型的可用超参数因模型而异。有关每个可用超参数的信息，请参阅您在[Amazon 中的内置算法和预训练模型 SageMaker](algos.md)中选择的模型的超参数文档。例如，有关可微调[图像分类- TensorFlow 超参数](IC-TF-Hyperparameter.md)的图像分类- TensorFlow 超参数的详细信息，请参阅。

如果您在不更改超参数的情况下将默认数据集用于文本模型，则会得到几乎相同的模型。对于视觉模型，默认数据集与预训练模型在训练时使用的数据集不同，因此您的模型也会不同。

以下超参数在模型中很常见：
+ **纪元** – 一个纪元是遍历整个数据集的一个周期。通过多个时间间隔完成一个批次，通过多个批次最终完成一个纪元。系统运行多个纪元，直到模型的准确性达到可接受的水平，或者说当错误率降至可接受的水平以下时。
+ **学习率** – 各个纪元之间应该变化的值的数量。随着模型的优化，其内部权重将被调整，并检查错误率以确定模型是否有所改善。典型的学习率为 0.1 或 0.01，其中 0.01 是一个小得多的调整，可能会导致训练需要很长时间才能收敛，而 0.1 则要大得多，可能会导致训练过度。这是在训练模型时可能会调整的主要超参数之一。请注意，对于文本模型，小得多的学习率（BERT 为 5e-5）可以生成更准确的模型。
+ **Batch siz** e — 要从数据集中为每个间隔选择的记录数量，然后发送到 GPUs 进行训练。

  在图像示例中，您可以向每个 GPU 发送 32 张图像，所以批次大小是 32。如果您选择具有多个 GPU 的实例类型，则批次将除以数量 GPUs。建议的批次大小因数据和所使用的模型而异。例如，针对图像数据进行优化的方式与处理语言数据的方式不同。

  在部署配置部分的实例类型图表中，您可以看到 GPUs 每种实例类型的数量。从推荐的标准批次大小开始（例如，对于视觉模型为 32）。然后，将其乘以您选择的实例类型 GPUs 中的数量。例如，如果您使用的是`p3.8xlarge`，则这将是 32（批次大小）乘以 4 (GPUs)，总共为 128，因为批量大小会根据数量进行调整。 GPUs对于 BERT 这样的文本模型，请尝试从批次大小 64 开始，然后根据需要减少。

 
## 训练输出
<a name="jumpstart-training"></a>

微调过程完成后， JumpStart 提供有关模型的信息：父模型、训练作业名称、训练作业 ARN、训练时间和输出路径。输出路径是您在 Amazon S3 存储桶中可以找到新模型的位置。文件夹结构使用您提供的模型名称，模型文件位于 `/output` 子文件夹内，其名称始终为 `model.tar.gz`。  

 示例：`s3://bucket/model-name/output/model.tar.gz`

## 配置模型训练的默认值
<a name="jumpstart-config-defaults-training"></a>

您可以为 IAM 角色和 KMS 密钥等参数配置默认值 VPCs，以便为 JumpStart 模型部署和训练进行预填充。有关更多信息，请参阅[为 JumpStart 模型配置默认值](jumpstart-deploy.md#jumpstart-config-defaults)。

# 共享模式
<a name="jumpstart-share-models"></a>

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

您可以按照以下步骤直接从已**启动的 JumpStart 资源**页面通过 Studio Classic 用户界面共享 JumpStart 模型：

1. 打开 Amazon SageMaker Studio Classic，然后在左侧导航窗格的**JumpStart**部分中选择已**启动的 JumpStart 资产**。

1. 选择**训练作业**选项卡以查看您的模型训练作业列表。

1. 在**训练作业**列表中，选择要共享的训练作业。随即打开训练作业详细信息页面。您一次仅能共享一个训练作业。

1. 在训练作业的标题中，选择**共享**，然后选择**与我的组织共享**。

有关与组织共享模型的更多信息，请参阅[共享模型和笔记本](jumpstart-content-sharing.md)。

# 共享模型和笔记本
<a name="jumpstart-content-sharing"></a>

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

共享您的模型和笔记本，以集中管理模型构件，提高可发现性，并增加模型在组织内模型的重复使用。在共享模型时，您可以提供训练和推理环境信息，并允许协作者将这些环境用于自己的训练和推理作业。

您可以直接在 Amazon SageMaker Studio Classic 中集中搜索您共享的所有模型和与您共享的模型。有关登录 Amazon SageMaker Studio Classic 的入门步骤的信息，请参阅[加入亚马逊 A SageMaker I 域名](https://docs.aws.amazon.com/sagemaker/latest/dg/gs-studio-onboard.html)。

**Topics**
+ [共享模型和笔记本](jumpstart-content-sharing-access.md)
+ [访问共享内容](jumpstart-content-sharing-access-filter.md)
+ [添加模型](jumpstart-content-sharing-add-model.md)

# 共享模型和笔记本
<a name="jumpstart-content-sharing-access"></a>

要共享模型和笔记本，请导航至 Amazon SageMaker Studio Classic 中的**共享**模型**部分，选择我的组织**共享，然后选择**添加**下拉列表。选择添加模型或添加笔记本。

![\[用于添加共享模型或笔记本的菜单 JumpStart。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-shared-models.png)


# 访问共享内容
<a name="jumpstart-content-sharing-access-filter"></a>

在 Amazon SageMaker Studio Classic 用户界面中，您可以访问共享内容并筛选所看到的内容。

有三个主要选项可用于筛选共享模型和笔记本：

1. **由我共享** — 您共享给的模型和笔记本 JumpStart。

1. **与我共享** – 与您共享的模型和笔记本

1. **由我的组织共享** – 与组织中的任何人共享的所有模型和笔记本

您还可以根据上次更新时间或者按字母顺序升序或降序对模型和笔记本进行排序。选择筛选条件图标 (![\[Funnel or filter icon representing data filtering or narrowing down options.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-filter-icon.png)) 对您的选择进行进一步排序。

# 添加模型
<a name="jumpstart-content-sharing-add-model"></a>

要添加模型，请选择**由我的组织共享**，然后从**添加**下拉列表中选择**添加模型**。输入模型的基本信息，并添加要与协作者共享的任何训练或推理信息，以便训练或部署模型。输入所有必需信息后，选择屏幕右下角的**添加模型**。

**Topics**
+ [添加基本信息](jumpstart-content-sharing-info.md)
+ [启用训练](jumpstart-content-sharing-training.md)
+ [启用部署](jumpstart-content-sharing-deployment.md)
+ [添加笔记本](jumpstart-content-sharing-notebooks.md)

# 添加基本信息
<a name="jumpstart-content-sharing-info"></a>

在中添加模型 JumpStart 需要提供有关您要训练的模型的一些基本信息。这些信息有助于确定模型的特征和功能，并提高其可发现性和可搜索性。要创建新模型，请按照以下步骤操作：

1. 添加此模型的标题。添加标题后，系统会根据模型标题自动在 ID 字段中填充唯一标识符。

1. 添加模型的描述。

1. 从选项中选择一种数据类型：*文本*、*视觉*、*表格*或*音频*。

1. 从可用任务列表中选择机器学习任务，例如*图像分类*或*文本生成*。

1. 选择机器学习框架。

1. 添加带有关键字或短语的元数据信息，以便用于搜索模型。使用逗号分隔关键字。所有空格都将自动替换为逗号。

# 启用训练
<a name="jumpstart-content-sharing-training"></a>

添加要共享的模型时，您可以选择提供训练环境，并允许组织中的协作者训练共享的模型。

**注意**  
如果您要添加表格模型，则还需要指定列格式和目标列以启用训练。

提供模型的基本详细信息后，您需要配置用于训练模型的训练作业的设置。这包括指定容器环境、代码脚本、数据集、输出位置和其他各种参数，以控制训练作业的执行方式。要配置训练作业设置，请按照以下步骤操作：

1. 添加用于模型训练的容器。您可以选择用于现有训练作业的容器，将自己的容器带入 Amazon ECR，或者使用 Amazon SageMaker 深度学习容器。

1. 添加环境变量。

1. 提供训练脚本位置。

1. 提供脚本模式入口点。

1. 为训练期间生成的模型构件提供 Amazon S3 URI。

1. 向默认训练数据集提供 Amazon S3 URI。

1. 提供模型输出路径。模型输出路径应为训练生成的任何模型项目的 Amazon S3 URI 路径。 SageMaker AI 将模型工件作为单个压缩的 TAR 文件保存到 Amazon S3 中。

1. 提供验证数据集，用于在训练期间评估您的模型。验证数据集必须包含与训练数据集相同的列数和相同的特征标题。

1. 开启网络隔离。网络隔离可隔离模型容器，这样就无法通过模型容器进行入站或出站网络调用。

1. 提供培训渠道， SageMaker AI 可以通过这些渠道访问您的数据。例如，您可以指定名为 `train` 或 `test` 的输入通道。对于每个通道，请指定通道名称以及您数据位置的 URI。选择**浏览**以搜索 Amazon S3 位置。

1. 提供超参数。添加任意超参数，合作者在训练期间应使用这些参数进行实验。为这些超参数提供一系列有效值。此范围用于训练作业超参数验证。您可以根据超参数的数据类型定义范围。

1. 选择一个实例类型。对于大批量训练，建议使用具有更多内存的 GPU 实例。有关各AWS区域 SageMaker 训练实例的完整列表，请参阅 [Amazon Pricing 中的**按需 SageMaker 定价**表。](https://aws.amazon.com/sagemaker/pricing/)

1. 提供指标。通过为训练作业所监控的各个指标指定名称和正则表达式，定义训练作业的指标。设计正则表达式以捕获您的算法发出的指标值。例如，指标 `loss` 可以具有正则表达式 `"Loss =(.*?);"`。

# 启用部署
<a name="jumpstart-content-sharing-deployment"></a>

添加要共享的模型时，您可以选择提供推理环境，组织中的协作者可以在该环境中部署共享的模型用于推理。

训练完机器学习模型后，您需要将其部署到 Amazon A SageMaker I 终端节点进行推理。这包括提供容器环境、推理脚本、训练期间生成的模型构件，以及选择适当的计算实例类型。正确配置这些设置对于确保部署的模型能够进行准确预测和高效处理推理请求至关重要。要设置推理模型，请按照以下步骤操作：

1. 添加用于推理的容器。您可以将自己的容器带入 Amazon ECR，也可以使用亚马逊 SageMaker 深度学习容器。

1. 提供推理脚本的 Amazon S3 URI。自定义推理脚本在您选择的容器内运行。您的推理脚本应包括用于模型加载的函数，用于生成预测的可选函数，以及输入和输出处理。有关为所选框架创建推理脚本的更多信息，请参阅 SageMaker Python SDK 文档中的[框架](https://sagemaker.readthedocs.io/en/stable/frameworks/index.html)。例如 TensorFlow，请参阅[如何实现预 and/or 后处理处理程序。](https://sagemaker.readthedocs.io/en/stable/frameworks/tensorflow/deploying_tensorflow_serving.html#how-to-implement-the-pre-and-or-post-processing-handler-s)

1. 为模型构件提供 Amazon S3 URI。模型构件是训练模型得到的输出，通常由经过训练的参数、描述如何计算推理的模型定义以及其他元数据组成。如果您使用 SageMaker AI 训练模型，则模型工件将作为单个压缩的 TAR 文件保存在 Amazon S3 中。如果您在 SageMaker AI 之外训练模型，则需要创建这个压缩的 TAR 文件并将其保存在 Amazon S3 的位置。

1. 选择一个实例类型。对于大批量训练，建议使用具有更多内存的 GPU 实例。有关各AWS区域 SageMaker 训练实例的完整列表，请参阅 [Amazon Pricing 中的**按需 SageMaker 定价**](https://aws.amazon.com/sagemaker/pricing/)表。

# 添加笔记本
<a name="jumpstart-content-sharing-notebooks"></a>

要添加笔记本，请选择**由我的组织共享**，然后从**添加**下拉列表中选择**添加笔记本**。输入笔记本的基本信息，并提供该笔记本所在位置的 Amazon S3 URI。

首先，添加有关笔记本的基本描述性信息。这些信息用于提高笔记本的可搜索性。

1. 为此笔记本添加标题。添加标题后，系统会根据笔记本标题自动在 ID 字段中填充唯一标识符。

1. 添加笔记本的描述。

1. 从选项中选择一种数据类型：*文本*、*视觉*、*表格*或*音频*。

1. 从可用任务列表中选择 ML 任务，例如*图像分类*或*文本生成*。

1. 选择一个 ML 框架。

1. 添加带有关键字或短语的元数据信息，以便用于搜索笔记本。使用逗号分隔关键字。所有空格都将自动替换为逗号。

指定基本信息后，您可以提供笔记本所在位置的 Amazon S3 URI。您可以选择**浏览**，在 Amazon S3 存储桶中搜索笔记本文件的位置。找到笔记本后，复制 Amazon S3 URI，选择**取消**，然后将 Amazon S3 URI 添加到**笔记本位置**字段。

输入所有必需信息后，选择右下角的**添加笔记本**。

# End-to-end JumpStart 解决方案模板
<a name="jumpstart-solutions"></a>

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

**注意**  
JumpStart 解决方案仅在 Studio 经典版中可用。

SageMaker JumpStart 提供一键式 end-to-end解决方案，旨在解决常见的机器学习用例。它们针对各自的领域使用成熟的算法，并提供完整的工作流程，通常包括数据处理、模型训练、部署、推理和监控。浏览以下使用案例，了解有关可用解决方案模板的更多信息。
+ [需求预测](#jumpstart-solutions-demand-forecasting)
+ [信用评级预测](#jumpstart-solutions-credit-prediction)
+ [欺诈侦测](#jumpstart-solutions-fraud-detection)
+ [计算机视觉](#jumpstart-solutions-computer-vision)
+ [从文档中提取和分析数据](#jumpstart-solutions-documents)
+ [预测性维护](#jumpstart-solutions-predictive-maintenance)
+ [流失预测](#jumpstart-solutions-churn-prediction)
+ [个性化推荐](#jumpstart-solutions-recommendations)
+ [强化学习](#jumpstart-solutions-reinforcement-learning)
+ [医疗保健与生命科学](#jumpstart-solutions-healthcare-life-sciences)
+ [财务定价](#jumpstart-solutions-financial-pricing)
+ [因果推理](#jumpstart-solutions-causal-inference)

从 JumpStart 登录页面中选择最适合您的用例的解决方案模板。选择解决方案模板后，会 JumpStart 打开一个显示解决方案描述的新选项卡和一个**启动**按钮。选择 **Launch** 后，将 JumpStart 创建运行解决方案所需的所有资源，包括训练和模型托管实例。有关启动 JumpStart 解决方案的更多信息，请参阅[启动解决方案](jumpstart-solutions-launch.md)。

启动解决方案后，您可以在中浏览解决方案功能和任何生成的工件 JumpStart。使用 “**已启动的 JumpStart 资产**” 菜单查找您的解决方案。在解决方案的选项卡中，选择**打开笔记本**以使用提供的笔记本并浏览解决方案的功能。由于构件是在启动期间或运行提供的笔记本之后生成的，因此它们在**生成的构件**表中列出。您可以使用垃圾桶图标 (![\[The trash icon for JumpStart.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-trash.png)) 删除单独的构件。您可以通过选择**删除解决方案资源**来删除解决方案的所有资源。

## 需求预测
<a name="jumpstart-solutions-demand-forecasting"></a>

需求预测使用历史时间序列数据来对未来特定时期的客户需求进行估计，从而简化企业的供需决策流程。

需求预测使用案例包括预测交通行业的车票销售、股票价格、医院就诊次数、下个月在多个地点雇用的客户代表人数、下一季度多个地区的产品销售、第二天的视频流服务云服务器使用情况、下周多个地区的用电量、物联网设备和传感器（例如能耗）的数量等等。

时间序列数据分为*单变量*和*多变量*。例如，单个家庭的总用电量是一段时间内的单变量时间序列。当多个单变量时间序列相互堆叠时，它被称为多变量时间序列。例如，一个街区中 10 个不同（但相关）家庭的总用电量构成了一个多变量时间序列数据集。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 需求预测  | [使用三 state-of-the-art种时间序列预测算法对多变量时间序列数据进行需求预测：[LSTNet](https://ts.gluon.ai/stable/api/gluonts/gluonts.mx.model.lstnet.html)、Prophet 和 AI [SageMaker Deepa](https://docs.aws.amazon.com/sagemaker/latest/dg/deepar.html) r。](https://facebook.github.io/prophet/) |  [GitHub »](https://github.com/awslabs/sagemaker-deep-demand-forecast)  | 

## 信用评级预测
<a name="jumpstart-solutions-credit-prediction"></a>

使用 JumpStart我们的信用评级预测解决方案来预测企业信用评级或解释机器学习模型做出的信用预测决策。与传统的信用评级建模方法相比，机器学习模型可以自动进行信用预测并提高其准确性。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 企业信用评级预测  | [使用 AWS AutoGluon 表格进行多模态（长文本和表格）机器学习，用于高质量的信用预测。](https://auto.gluon.ai/scoredebugweight/tutorials/tabular_prediction/index.html) | [GitHub »](https://github.com/awslabs/sagemaker-corporate-credit-rating) | 
| 基于图形的信用评分  | 通过训练[图神经网络 GraphSage 和表格模型，使用 AWS[AutoGluon 表格](https://auto.gluon.ai/scoredebugweight/tutorials/tabular_prediction/index.html)数据和企业网络](https://cs.stanford.edu/people/jure/pubs/graphsage-nips17.pdf)预测企业信用评级。 | 在亚马逊 SageMaker Studio 经典版中查找。 | 
| 解释信用决策  | 使用 [LightGBM](https://lightgbm.readthedocs.io/en/latest/) 和S [HAP（SHapley加](https://shap.readthedocs.io/en/latest/index.html)法解释）预测信用申请中的信用违约并提供解释。 |  [GitHub »](https://github.com/awslabs/sagemaker-explaining-credit-decisions)  | 

## 欺诈侦测
<a name="jumpstart-solutions-fraud-detection"></a>

许多企业每年因欺诈损失数十亿美元。基于机器学习的欺诈检测模型有助于以系统化的方式，从海量数据中识别可能的欺诈活动。以下解决方案使用交易和用户身份数据集来识别欺诈性交易。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 检测恶意用户和交易 | 使用具有过度采样技术[SageMaker 的人工智能](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html)自动检测交易中潜在 XGBoost的欺诈活动。[合成少数族裔过度采样](https://arxiv.org/abs/1106.1813) (SMOTE)。 |  [GitHub »](https://github.com/awslabs/fraud-detection-using-machine-learning)  | 
| 使用深度图形库检测金融交易中的欺诈行为 | 通过使用[深度图库](https://www.dgl.ai/)和[SageMaker 人工智能 XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html)模型训练[图形卷积网络](https://arxiv.org/pdf/1703.06103.pdf)，检测金融交易中的欺诈行为。 |  [GitHub »](https://github.com/awslabs/sagemaker-graph-fraud-detection)  | 
| 财务支付分类 | 使用 [SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html) 根据交易信息对金融付款进行分类 XGBoost。使用此解决方案模板作为欺诈检测、个性化或异常检测的中间步骤。 |  在亚马逊 SageMaker Studio 经典版中查找。  | 

## 计算机视觉
<a name="jumpstart-solutions-computer-vision"></a>

随着自动驾驶汽车、智能视频监控、医疗保健监控和各种对象计数任务等业务使用案例的兴起，对快速、准确的对象检测系统的需求也在不断增加。这些系统不仅涉及识别和分类图像中的每个对象，还需要通过在图像周围绘制相应的边界框来定位每个对象。在过去的十年中，深度学习技术的飞速发展极大地加速了对象检测的进步。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 视觉产品缺陷检测 | 通过[从头开始训练物体检测模型或微调预训练的 SageMaker AI 模型](https://ieeexplore.ieee.org/document/8709818)，识别产品图像中的缺陷区域。 |  [GitHub »](https://github.com/awslabs/sagemaker-defect-detection)  | 
| 手写识别  | 通过训练[对象检测模型](https://mxnet.apache.org/versions/1.0.0/api/python/gluon/model_zoo.html#mxnet.gluon.model_zoo.vision.resnet34_v1)和[手写识别模型](https://arxiv.org/abs/1910.00663)来识别映像中的手写文本。使用 G [SageMaker round Trut](https://aws.amazon.com/sagemaker/data-labeling/) h 标记你自己的数据。 | [GitHub »](https://github.com/awslabs/sagemaker-handwritten-text-recognition) | 
| 针对鸟类种类的对象检测 | 使用 [SageMaker AI 物体检测模型](https://docs.aws.amazon.com/sagemaker/latest/dg/object-detection.html)识别场景中的鸟类。 |  在亚马逊 SageMaker Studio 经典版中查找。  | 

## 从文档中提取和分析数据
<a name="jumpstart-solutions-documents"></a>

JumpStart 为您提供解决方案，让您在关键业务文档中发现宝贵的见解和联系。使用案例包括文本分类、文档摘要、手写识别、关系提取、问答以及填写表格记录中的缺失值。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 情绪分类的隐私性  | [文本匿名化](https://www.amazon.science/blog/preserving-privacy-in-analyses-of-textual-data)，以便在情绪分类中更好地保护用户隐私。 |  [GitHub »](https://github.com/awslabs/sagemaker-privacy-for-nlp)  | 
| 文档理解 | 使用中的[转换器](https://huggingface.co/docs/transformers/index)库进行文档摘要、实体和关系提取。 PyTorch |  [GitHub »](https://github.com/awslabs/sagemaker-document-understanding)  | 
| 手写识别  | 通过训练[对象检测模型](https://mxnet.apache.org/versions/1.0.0/api/python/gluon/model_zoo.html#mxnet.gluon.model_zoo.vision.resnet34_v1)和[手写识别模型](https://arxiv.org/abs/1910.00663)来识别映像中的手写文本。使用 G [SageMaker round Trut](https://aws.amazon.com/sagemaker/data-labeling/) h 标记你自己的数据。 | [GitHub »](https://github.com/awslabs/sagemaker-handwritten-text-recognition) | 
| 填写表格记录中的缺失值  | 通过训练[SageMaker 自动驾驶](https://aws.amazon.com/sagemaker/autopilot/)模型，填充表格记录中的缺失值。 |  [GitHub »](https://github.com/awslabs/filling-in-missing-values-in-tabular-records)  | 

## 预测性维护
<a name="jumpstart-solutions-predictive-maintenance"></a>

预测性维护的目标是协调及时更换部件，从而在纠正性维护和预防性维护之间实现最佳的平衡。以下解决方案使用来自工业资产的传感器数据，预测机器故障、计划外停机时间和维修成本。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 车队的预测性维护  | 通过卷积神经网络模型，使用车辆传感器信息和维护信息预测车队故障。 |  [GitHub »](https://github.com/awslabs/aws-fleet-predictive-maintenance/)  | 
| 制造业的预测性维护  | 使用历史传感器读数训练[堆叠式双向 LSTM 神经网络](https://arxiv.org/pdf/1801.02143.pdf)模型，预测每个传感器的剩余使用寿命。 |  [GitHub »](https://github.com/awslabs/predictive-maintenance-using-machine-learning)  | 

## 流失预测
<a name="jumpstart-solutions-churn-prediction"></a>

客户流失率是许多公司面临的代价高昂的问题。在减少客户流失的工作中，公司可以识别可能退出其服务的客户，以便将精力集中在客户保留上。使用 JumpStart流失预测解决方案来分析用户行为和客户支持聊天记录等数据源，以确定哪些客户面临取消订阅或服务的高风险。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 使用文本预测流失  | 使用带有 B [ER](https://huggingface.co/) T 编码器的数字、分类和文本特征预测流失，以及. [RandomForestClassifier](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html)  |  [GitHub »](https://github.com/awslabs/sagemaker-churn-prediction-text)  | 
| 手机客户流失预测 | 使用 [SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html) 识别不满意的手机客户 XGBoost。 |  在亚马逊 SageMaker Studio 经典版中查找。  | 

## 个性化推荐
<a name="jumpstart-solutions-recommendations"></a>

您可以使用 JumpStart 解决方案来分析客户身份图或用户会话，以更好地了解和预测客户行为。针对个性化推荐，使用以下解决方案，对客户在多台设备上的身份建模，确定客户购买的可能性，或者根据过去的客户行为创建自定义电影推荐程序。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 使用深度图形库对身份图中的实体进行解析  | 通过使用[深度图形库](https://www.dgl.ai/)训练[图形卷积网络](https://arxiv.org/pdf/1703.06103.pdf)，为线上广告投放执行跨设备实体链接。 |  [GitHub »](https://github.com/awslabs/sagemaker-graph-entity-resolution)  | 
| 购买建模 | 通过训练 [SageMaker AI XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html) 模型来预测客户是否会进行购买。 |  [GitHub »](https://github.com/awslabs/sagemaker-purchase-modelling)  | 
| 自定义推荐系统 |  训练和部署自定义推荐系统，该系统使用 SageMaker 人工智能中的神经协作过滤根据过去的行为为客户生成电影建议。  |  在亚马逊 SageMaker Studio 经典版中查找。  | 

## 强化学习
<a name="jumpstart-solutions-reinforcement-learning"></a>

强化学习 (RL) 是一种基于与环境的交互进行学习的类型。这种类型的学习是由代理人使用的，该代理必须通过与动态环境的 trial-and-error互动来学习行为，在这种环境中，目标是最大限度地提高代理人因其行为而获得的长期回报。通过权衡具有不确定奖励的探索行为与具有已知奖励的探索行为，实现奖励最大化。

RL 非常适合解决大型复杂问题，例如供应链管理、HVAC 系统、工业机器人、游戏人工智能、对话系统和自动驾驶汽车。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 适用于 Battlesnake AI 竞赛的强化学习  | 通过[BattleSnake](https://play.battlesnake.com/)人工智能竞赛为训练和推理提供强化学习工作流程。 |  [GitHub »](https://github.com/awslabs/sagemaker-battlesnake-ai)  | 
| 适用于 Procgen 挑战的分布式强化学习  | 适用于 [NeurIPS 2020 Procgen](https://www.aicrowd.com/challenges/neurips-2020-procgen-competition) 强化学习挑战的分布式强化学习入门套件。 | [GitHub »](https://github.com/aws-samples/sagemaker-rl-procgen-ray) | 

## 医疗保健与生命科学
<a name="jumpstart-solutions-healthcare-life-sciences"></a>

临床医生和研究人员可以使用 JumpStart 解决方案来分析医学影像、基因组信息和临床健康记录。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 肺癌存活率预测 | [使用 AI 通过三维肺部计算机断层扫描 (CT) 扫描、基因组数据和临床健康记录，预测非小细胞肺癌患者的存活状态。SageMaker XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html) |  [GitHub »](https://github.com/aws-samples/machine-learning-pipelines-for-multimodal-health-data/tree/sagemaker-soln-lcsp)  | 

## 财务定价
<a name="jumpstart-solutions-financial-pricing"></a>

许多企业定期动态调整定价，以尽可能地提高回报。使用以下 JumpStart 解决方案进行价格优化、动态定价、期权定价或投资组合优化用例。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 价格优化 |  使用双重机器学习 (ML)（用于因果推断）和 [Prophet](https://facebook.github.io/prophet/) 预测程序估算价格弹性。使用这些估算值来优化每日价格。  |  在亚马逊 SageMaker Studio 经典版中查找。  | 

## 因果推理
<a name="jumpstart-solutions-causal-inference"></a>

研究人员可以使用贝叶斯网络等机器学习模型来表示因果依赖关系，并根据数据得出因果结论。使用以下 JumpStart解决方案来了解氮基肥料施用与玉米作物产量之间的因果关系。


| 解决方案名称  | 说明  | 开始使用  | 
| --- | --- | --- | 
| 作物产量反设事实 |  对玉米对氮肥的反应进行反设事实分析。该解决方案使用多光谱卫星图像和[地面观测数据](https://www.sciencedirect.com/science/article/pii/S2352340921010283#tbl0001)来全面了解作物物候周期。  |  在亚马逊 SageMaker Studio 经典版中查找。  | 

# 启动解决方案
<a name="jumpstart-solutions-launch"></a>

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

**注意**  
JumpStart 解决方案仅在 Studio 经典版中可用。

首先，通过 Amazon SageMaker Studio Classic 用户界面的 SageMaker JumpStart 登录页面选择解决方案。有关登录 Amazon SageMaker Studio Classic 的入门步骤的信息，请参阅登录 [Amazon A SageMaker I 域](https://docs.aws.amazon.com/sagemaker/latest/dg/gs-studio-onboard.html)。有关访问 SageMaker JumpStart 登录页面的详细信息，请参阅[JumpStart 在 Studio 经典版中打开并使用](studio-jumpstart.md#jumpstart-open-use)。

在您选择解决方案后，将打开解决方案的选项卡，其中显示解决方案的描述和一个 `Launch` 按钮。要启动解决方案，请`Launch`在 “**启动解决方案**” 部分中选择。 JumpStart 然后创建运行解决方案所需的所有资源。这包括训练和模型托管实例。

## 高级参数
<a name="jumpstart-solutions-config"></a>

您选择的解决方案可能会有可供选择的高级参数。选择 “**高级参数**” 以指定解决方案的 AWS Identity and Access Management 角色。

解决方案能够跨9个相互交互的 AWS 服务启动资源。要使解决方案按预期运行，在一项服务中新创建的组件，必须能够对在另一项服务中的新创建的组件执行操作。建议您使用默认 IAM 角色来确保添加了所有必需的权限。有关 IAM 角色的更多信息，请参阅 [AWS Identity and Access Management 适用于亚马逊 A SageMaker I](security-iam.md)。

**Default IAM role**（原定设置 IAM 角色）

如果您选择此选项，则使用此解决方案所需的默认 IAM 角色。每种解决方案都需要不同的资源。以下列表根据所需的服务，描述了用于解决方案的默认角色。有关每项服务所需权限的说明，请参阅[AWS SageMaker 项目管理策略和 JumpStart](security-iam-awsmanpol-sc.md)。
+ **API Gateway** — AmazonSageMakerServiceCatalogProductsApiGatewayRole 
+ **CloudFormation** – AmazonSageMakerServiceCatalogProductsCloudformationRole
+ **CodeBuild** – AmazonSageMakerServiceCatalogProductsCodeBuildRole 
+ **CodePipeline** – AmazonSageMakerServiceCatalogProductsCodePipelineRole
+ **事件** – AmazonSageMakerServiceCatalogProductsEventsRole
+ **Firehose** – AmazonSageMakerServiceCatalogProductsFirehoseRole
+ **Glu** e — AmazonSageMakerServiceCatalogProductsGlueRole
+ **Lambda** – AmazonSageMakerServiceCatalogProductsLambdaRole
+ **SageMaker 人工智能** — AmazonSageMakerServiceCatalogProductsExecutionRole 

如果您使用的是启用了 JumpStart 项目模板的新 SageMaker AI 域，则会在您的账户中自动创建这些角色。

如果您使用的是现有的 SageMaker AI 域，则您的账户中可能不存在这些角色。在这种情况下，启动解决方案时您将收到以下错误。

```
Unable to locate the updated roles required to launch this solution, a general role '/service-role/AmazonSageMakerServiceCatalogProductsUseRole' will be used. Please update your studio domain to generate these roles.
```

您仍然可以在没有所需角色的情况下启动解决方案，但会使用旧的默认角色 `AmazonSageMakerServiceCatalogProductsUseRole` 代替所需的角色。传统默认角色与 JumpStart 解决方案需要与之交互的所有服务都有信任关系。为了获得最佳安全性，我们建议您更新域名，为每项 AWS 服务设置新创建的默认角色。

如果您已经加入 A SageMaker I 域，则可以使用以下步骤更新您的域以生成默认角色。

1. 打开 Amazon A SageMaker I 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

1. 选择页面左上角的**控制面板**。

1. 在**域**页面中，选择**设置**图标 (![\[Black square icon representing a placeholder or empty image.\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/icons/Settings_squid.png)) 以编辑域设置。

1. 在**常规设置**上选择**下一步**。

1. 在 “**SageMaker 项目和**” 下 JumpStart，选择 “** SageMaker JumpStart 为此账户启用亚马逊 SageMaker 项目模板和亚马逊**” 和 “为 **Studio Classic 用户启用亚马逊 SageMaker 项目模板和亚马逊 SageMaker JumpStart **”，选择 “**下一步**”。

1. 选择**提交**。

您应该能够在 “**应用程序-Studio**” 选项卡下的 “**项目-为该账户启用的亚马逊 SageMaker项目模板**” 中看到列出的默认角色。

**查找 IAM 角色**

如果您选择此选项，则必须从下拉列表中为每项必需的服务选择一个现有 IAM 角色。所选角色必须至少具有相应服务所需的最低权限。有关每项服务所需权限的说明，请参阅[AWS SageMaker 项目管理策略和 JumpStart](security-iam-awsmanpol-sc.md)。

**输入 IAM 角色**

如果您选择此选项，则必须手动输入现有 IAM 角色的 ARN。所选角色必须至少具有相应服务所需的最低权限。有关每项服务所需权限的说明，请参阅[AWS SageMaker 项目管理策略和 JumpStart](security-iam-awsmanpol-sc.md)。

# 亚马逊 SageMaker JumpStart 行业：金融
<a name="studio-jumpstart-industry"></a>

使用 “ SageMaker JumpStart 行业：金融解决方案”、模型和示例笔记本，通过精心策划的一步式解决方案和以行业为重点的机器学习 (ML) 问题的示例笔记本来了解 SageMaker AI 的特性和功能。笔记本还介绍了如何使用 SageMaker JumpStart 行业 Python SDK 来增强行业文本数据和微调预训练模型。

**Topics**
+ [亚马逊 SageMaker JumpStart 行业 Python SDK](#studio-jumpstart-industry-pysdk)
+ [亚马逊 SageMaker JumpStart 行业：财务解决方案](#studio-jumpstart-industry-solutions)
+ [亚马逊 SageMaker JumpStart 行业：财务模型](#studio-jumpstart-industry-models)
+ [Amazon SageMaker JumpStart 行业：财务示例笔记本](#studio-jumpstart-industry-examples)
+ [亚马逊 SageMaker JumpStart 行业：金融博客文章](#studio-jumpstart-industry-blogs)
+ [亚马逊 SageMaker JumpStart 行业：金融相关研究](#studio-jumpstart-industry-research)
+ [亚马逊 SageMaker JumpStart 行业：其他财务资源](#studio-jumpstart-industry-resources)

## 亚马逊 SageMaker JumpStart 行业 Python SDK
<a name="studio-jumpstart-industry-pysdk"></a>

SageMaker Runtime 通过其名为 Industry SageMaker JumpStart Python SDK 的客户端库 JumpStart 提供了用于整理行业数据集和微调预训练模型的处理工具。如需详细了解 SDK 的 API 文档，以及有关处理和增强行业文本数据集以提高 state-of-the-art模型性能的更多信息 SageMaker JumpStart，请参阅 Industry [Python SDK 开源文档](https://sagemaker-jumpstart-industry-pack.readthedocs.io)。SageMaker JumpStart

## 亚马逊 SageMaker JumpStart 行业：财务解决方案
<a name="studio-jumpstart-industry-solutions"></a>

SageMaker JumpStart 行业：Financial 提供以下解决方案笔记本：
+ **企业信用评级预测**

本 SageMaker JumpStart 行业：金融解决方案为文本增强型企业信用评级模型提供了模板。它展示了如何根据数字特征（在本例中为 Altman 著名的 5 个财务比率）与 SEC 申报文件中的文本相结合的模型，来改善信用评级的预测。除了 5 个 Altman 比率之外，您还可以根据需要添加更多变量或设置自定义变量。本解决方案笔记本展示了 Industr SageMaker JumpStart y Python SDK 如何帮助处理美国证券交易委员会文件中文本的自然语言处理 (NLP) 评分。此外，该解决方案还演示了如何使用增强的数据集训练模型以实现 best-in-class模型，将模型部署到 SageMaker 人工智能端点进行生产，以及如何实时接收改进的预测。
+ **基于图形的信用评分**

传统上，信用评级是通过使用财务报表数据和市场数据的模型生成的，这些数据仅为表格数据（数字和类别）。该解决方案使用 [SEC 申报文件](https://www.sec.gov/edgar/searchedgar/companysearch.html)构建了一个公司网络，并展示了如何通过表格数据使用公司关系网络来生成准确的评级预测。该解决方案演示了一种方法，使用公司关联数据，将基于表格的传统信用评分模型（已在评级行业中使用了数十年），扩展到网络上的机器学习模型类别。

**注意**  
解决方案笔记本仅用于演示目的。不应将其作为财务或投资建议。

您可以通过 Studio Classic 中的 SageMaker JumpStart 页面找到这些金融服务解决方案。

**重要**  
截至 2023 年 11 月 30 日，之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新的 Studio 体验的信息，请参阅 [亚马逊 SageMaker Studio](studio-updated.md)。  
Studio Classic 仍针对现有工作负载进行维护，但不再可供入门使用。您只能停止或删除现有的 Studio Classic 应用程序，不能创建新的应用程序。我们建议您将[工作负载迁移到全新 Studio 体验](studio-updated-migrate.md)。

**注意**  
 SageMaker JumpStart 行业：财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录 [SageMaker AI 控制台](https://console.aws.amazon.com/sagemaker)，然后启动 SageMaker Studio Classic。有关如何查找解决方案卡片的更多信息，请参阅上一个主题[SageMaker JumpStart](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)。

## 亚马逊 SageMaker JumpStart 行业：财务模型
<a name="studio-jumpstart-industry-models"></a>

SageMaker JumpStart 行业：Financial 提供了以下经过预训练的[稳健优化的 BERT 方法 (RoBERTa) 模型](https://arxiv.org/pdf/1907.11692.pdf)：
+ **财务文本嵌入（Ro BERTa-sec-base）**
+ **RoBERTa-SEC-WIKI-Base **
+ **RoBERTa-SEC-Large **
+ **RoBERTa-SEC-WIKI-Large **

 RoBERTa-SEC-Base和 RoBERTa-SEC-Large模型是基于 [GluonNLP的Ro模型的文本嵌入BERTa 模型](https://nlp.gluon.ai/api/model.html#gluonnlp.model.RoBERTaModel)，并根据标准普尔500指数美国证券交易委员会2010年十年（从2010年到2019年）的10-K/10-Q报告进行了预训练。除此之外， SageMaker AI Industr JumpStart y：Financial还提供了另外两个Ro BERTa 变体 RoBERTa-SEC-WIKI-Large， RoBERTa-SEC-WIKI-Base并根据美国证券交易委员会的文件和维基百科的常用文本进行了预先训练。

导航到 “文本模型” 节点，选择 “**浏览所有**文本模型**”，然后筛选 “机器学习任务**文本嵌入**”，即可在中找到这些模型**。 SageMaker JumpStart 选择所选模型后，您可以访问任何对应的笔记本。配对的笔记本将引导您了解如何针对多模态数据集上的特定分类任务对预训练模型进行微调，Industry SageMaker JumpStart Python SDK 增强了这些任务。

**注意**  
模型笔记本仅用于演示目的。不应将其作为财务或投资建议。

以下屏幕截图显示了通过 Studio Classic 上的 SageMaker AI JumpStart 页面提供的预训练模型卡片。

![\[通过 Studio Classic 上的 SageMaker AI JumpStart 页面提供的预训练模型卡片。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/jumpstart/jumpstart-finance-models.png)


**注意**  
 SageMaker JumpStart 行业：财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录 [SageMaker AI 控制台](https://console.aws.amazon.com/sagemaker)，然后启动 SageMaker Studio Classic。有关如何查找模型卡片的更多信息，请参阅上一个主题，网址为[SageMaker JumpStart](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)。

## Amazon SageMaker JumpStart 行业：财务示例笔记本
<a name="studio-jumpstart-industry-examples"></a>

SageMaker JumpStart Industry: Financial 提供了以下示例笔记本来演示以行业为重点的机器学习问题的解决方案：
+ **财务 TabText 数据构建** — 此示例介绍如何使用 SageMaker JumpStart 行业 Python SDK 来处理美国证券交易委员会的文件，例如基于自然语言处理分数类型及其相应单词列表的文本摘要和评分文本。要预览此笔记本的内容，请参阅[根据 SEC 申报文件的多模式数据集和 NLP 分数简单地进行构建](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/finance/notebook1/SEC_Retrieval_Summarizer_Scoring.html)。
+ **基于 TabText 数据的多模态机器学习** — 此示例说明如何将不同类型的数据集合并到一个名为多模态机器学习的数据框中 TabText 并执行多模态机器学习。要预览本笔记本的内容，请参阅 M [achine Learning on a TabText DataFrame — 基于薪资保护计划的示例](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/finance/notebook2/PPP_TabText_ML.html)。
+ **美国证券交易委员会申报数据的多类别机器学习** — 此示例显示了如何根据美国证券交易委员会申报为多类分类任务整理的多模式 (TabText) 数据集训练 AutoGluon 自然语言处理模型。[根据 MDNA 文本列将 SEC 10K/Q 身份文件按行业代码分类](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/finance/notebook3/SEC_MNIST_ML.html)。

**注意**  
示例笔记本仅用于演示目的。不应将其作为财务或投资建议。

**注意**  
 SageMaker JumpStart 行业：财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录 [SageMaker AI 控制台](https://console.aws.amazon.com/sagemaker)，然后启动 SageMaker Studio Classic。有关如何查找示例笔记本的更多信息，请参阅上一个主题，网址为[SageMaker JumpStart](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)。

要预览示例笔记本的内容，请参阅[教程 — SageMaker JumpStart 行业财务](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/index.html) *Python SDK 文档*。

## 亚马逊 SageMaker JumpStart 行业：金融博客文章
<a name="studio-jumpstart-industry-blogs"></a>

有关使用 “ SageMaker JumpStart 行业：财务解决方案”、模型、示例和 SDK 的完整应用，请参阅以下博客文章：
+ [在 Amazon 中使用预先训练的金融语言模型进行迁移学习 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/use-pre-trained-financial-language-models-for-transfer-learning-in-amazon-sagemaker-jumpstart/)
+ [在 Amazon 中使用多模式机器学习使用美国证券交易委员会文本进行评级分类 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/use-sec-text-for-ratings-classification-using-multimodal-ml-in-amazon-sagemaker-jumpstart/)
+ [在 Amazon 中为财务 NLP 创建包含美国证券交易委员会文本的控制面板 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/create-a-dashboard-with-sec-text-for-financial-nlp-in-amazon-sagemaker-jumpstart/)
+ [在 Amazon 中使用图形机器学习构建企业信用评级分类器 SageMaker JumpStart](https://aws.amazon.com/blogs/machine-learning/build-a-corporate-credit-ratings-classifier-using-graph-machine-learning-in-amazon-sagemaker-jumpstart/)
+ [根据财务数据在 Amazon 中对基础模型进行域自适应微调 SageMaker JumpStart ](https://aws.amazon.com/blogs/machine-learning/domain-adaptation-fine-tuning-of-foundation-models-in-amazon-sagemaker-jumpstart-on-financial-data/)

## 亚马逊 SageMaker JumpStart 行业：金融相关研究
<a name="studio-jumpstart-industry-research"></a>

有关 “ SageMaker JumpStart 工业：金融解决方案” 的研究，请参阅以下论文：
+ [金融业中的情境、语言建模和多模式数据](https://www.pm-research.com/content/iijjfds/3/3/52)
+ [用于信用建模的多模式机器学习](https://www.amazon.science/publications/multimodal-machine-learning-for-credit-modeling)
+ [论神经文本分类器缺乏稳健可解释性](https://www.amazon.science/publications/on-the-lack-of-robust-interpretability-of-neural-text-classifiers)
+ [FinLex: 有效使用词汇嵌入生成金融词典](https://www.sciencedirect.com/science/article/pii/S2405918821000131)

## 亚马逊 SageMaker JumpStart 行业：其他财务资源
<a name="studio-jumpstart-industry-resources"></a>

有关其他文档和教程，请参阅以下资源：
+ [ SageMaker JumpStart 行业：金融 Python 软件开发工具包](https://pypi.org/project/smjsindustry/)
+ [SageMaker JumpStart 行业：金融 Python 软件开发工具包教程](https://sagemaker-jumpstart-industry-pack.readthedocs.io/en/latest/notebooks/index.html#)
+ [ SageMaker JumpStart 行业：财务 GitHub 存储库](https://github.com/aws/sagemaker-jumpstart-industry-pack/)
+ [Amazon A SageMaker I 入门——Machine Learning 教程](https://aws.amazon.com/sagemaker/getting-started/)