在 Studio 中部署模型

要部署 JumpStart 基础模型，请导航到 Studio 用户界面中的模型详细信息卡。有关如何在 Studio JumpStart 中打开的更多信息，请参阅JumpStart 在工作室中打开。导航到所选模型的详情页面后，在 Studio 用户界面的右上角选择部署。然后，按照使用 SageMaker Studio 部署模型中的步骤进行操作。

Amazon SageMaker JumpStart 还提供经过优化的部署，提供专为特定用例（例如内容生成、摘要或聊天式交互）设计的预定义部署配置。部署支持的模型时，您可以选择目标用例并选择约束优化（成本优化、吞吐量优化、延迟优化或平衡），Amazon SageMaker JumpStart 会自动为该场景配置终端节点。这使您可以了解P50延迟、首次使用令牌的时间 (TTFT) 和吞吐量等关键性能指标，同时确保根据您的工作负载调整部署。要开始使用，请在 Studio 中打开受支持型号的详细信息页面，选择 “部署”，然后使用 “性能” 面板配置您的优化部署。

重要

一些基础模型在部署之前，要求明确接受最终用户许可协议 (EULA)。有关更多信息，请参阅亚马逊 SageMaker Studio 接受最终用户许可协议。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

Fine-tune 工作室里的模特

在 Studio 中评估模型