先决条件创建部 HyperPod 署编辑部 HyperPod 署删除部 HyperPod 署

JumpStart 通过使用 Amazon SageMaker Studio 部署模型

以下步骤向您展示了如何 JumpStart 使用 Amazon SageMaker Studio 部署模型。

先决条件

确认您已在 Amazon SageMaker HyperPod 集群上设置了推理功能。有关更多信息，请参阅设置 HyperPod 集群以进行模型部署。

创建部 HyperPod 署

在 Amazon SageMaker Studio 中，从左侧导航窗格中打开JumpStart登录页面。
在所有公共模型下，选择要部署的模型。

注意
如果您选择了门控模型，则必须接受最终用户许可协议（EULA）。
选择 SageMaker HyperPod。
在 “部署设置” 下， JumpStart将推荐一个实例进行部署。如有必要，您可以修改这些设置。
1. 如果您修改实例类型，请确保它与所选HyperPod 集群兼容。如果没有任何兼容的实例，则需要选择一个新HyperPod 集群或联系管理员向集群添加兼容的实例。
2. 要确定模型部署的优先级，请安装任务治理加载项，创建计算资源分配，然后为集群策略设置任务排名。完成此操作后，您应看到一个为模型部署选择优先级的选项，该优先级可用于抢占集群上的其他部署和任务。
3. 输入管理员已为您提供访问权限的命名空间。您可能需要直接联系管理员以获取确切的命名空间。提供有效的命名空间后，应启用部署按钮来部署模型。
4. 如果您的实例类型为分区（已启用 MIG），请选择 GPU 分区类型。
5. 如果要启用 L2 kvCache 或智能路由来加快 LLM 推理，请启用它们。默认情况下，仅启用 L1 KV 缓存。有关 KvCache 和智能路由的更多详细信息，请参阅SageMaker HyperPod 模型部署。
选择部署，然后等待端点创建完成。
创建端点后，选择测试推理。

编辑部 HyperPod 署

在 Amazon SageMaker Studio 中，选择计算，然后从左侧导航窗格中选择HyperPod集群。
在 “部署” 下，选择要修改的 HyperPod 集群部署。
从垂直省略号图标（⋮）中，选择编辑。
在 “部署设置” 下，您可以启用或禁用Auto-scaling以及更改最大副本数量。
选择保存。
状态将变为正在更新。在状态变回正在服务后，您的更改便已完成，并且您将看到一条确认消息。

删除部 HyperPod 署

在 Amazon SageMaker Studio 中，选择计算，然后从左侧导航窗格中选择HyperPod集群。
在 “部署” 下，选择要修改的 HyperPod 集群部署。
从垂直省略号图标（⋮）中，选择删除。
在 “删除部 HyperPod 署” 窗口中，选中该复选框。
选择删除。
状态将变为正在删除。删除 HyperPod 部署后，您将看到一条确认消息。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

部署基础模型和自定义经过微调的模型

JumpStart 使用 kubectl 部署模型

JumpStart 通过使用 Amazon SageMaker Studio 部署模型

先决条件

创建部 HyperPod 署

注意

编辑部 HyperPod 署

删除部 HyperPod 署