本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Studio 中部署模型
若要部署 JumpStart 基礎模型,請在 Studio 使用者介面中導覽至模型詳細資訊卡。如需如何在 Studio 中開啟 JumpStart 的詳細資訊,請參閱在 Studio 中開啟 JumpStart。導覽至您選擇的模型詳細資訊頁面後,請選擇 Studio 使用者介面右上角的部署。然後,依照使用 SageMaker Studio 部署模型中的步驟進行。
Amazon SageMaker JumpStart 也提供最佳化的部署,提供專為特定使用案例設計的預先定義部署組態,例如內容產生、摘要或聊天式互動。部署支援的模型時,您可以選取目標使用案例,然後選擇限制最佳化:成本最佳化、輸送量最佳化、延遲最佳化或平衡,Amazon SageMaker JumpStart 會自動設定該案例的端點。這可讓您查看關鍵效能指標,例如 P50 延遲、time-to-first-token(TTFT) 和輸送量,同時確保已針對工作負載調整部署。若要開始使用,請在 Studio 中開啟支援模型的詳細資訊頁面,選擇部署,然後使用效能面板來設定最佳化的部署。
重要
部分基礎模型需要在部署前明確接受終端使用者授權協議 (EULA)。如需詳細資訊,請參閱在 Amazon SageMaker Studio 接受 EULA。