View a markdown version of this page

在 Studio 中部署模型 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Studio 中部署模型

要部署 JumpStart 基础模型,请导航到 Studio 用户界面中的模型详细信息卡。有关如何在 Studio JumpStart 中打开的更多信息,请参阅JumpStart 在工作室中打开。导航到所选模型的详情页面后,在 Studio 用户界面的右上角选择部署。然后,按照使用 SageMaker Studio 部署模型中的步骤进行操作。

Amazon SageMaker JumpStart 还提供经过优化的部署,提供专为特定用例(例如内容生成、摘要或聊天式交互)设计的预定义部署配置。部署支持的模型时,您可以选择目标用例并选择约束优化(成本优化、吞吐量优化、延迟优化或平衡),Amazon SageMaker JumpStart 会自动为该场景配置终端节点。这使您可以了解关键性能指标,例如 P50 延迟、 time-to-first-token (TTFT) 和吞吐量,同时确保根据您的工作负载调整部署。要开始使用,请在 Studio 中打开受支持型号的详细信息页面,选择 “部署”,然后使用 “性能” 面板配置您的优化部署。

重要

一些基础模型在部署之前,要求明确接受最终用户许可协议 (EULA)。有关更多信息,请参阅 亚马逊 SageMaker Studio 接受最终用户许可协议