Bereitstellen eines Modells in Studio

Um JumpStart Foundation-Modelle bereitzustellen, navigieren Sie in der Studio-Benutzeroberfläche zu einer Modelldetailkarte. Weitere Informationen zum Öffnen JumpStart in Studio finden Sie unterIn Studio öffnen JumpStart. Nachdem Sie zur Modelldetailseite Ihrer Wahl navigiert haben, wählen Sie in der oberen rechten Ecke der Studio-Benutzeroberfläche die Option Bereitstellen aus. Folgen Sie anschließend den Schritten unter Bereitstellen von Modellen mit SageMaker Studio.

Amazon bietet SageMaker JumpStart auch optimierte Bereitstellungen an, die vordefinierte Bereitstellungskonfigurationen bieten, die für bestimmte Anwendungsfälle wie Inhaltsgenerierung, Zusammenfassung oder Interaktionen im Chat-Stil konzipiert sind. Bei der Bereitstellung eines unterstützten Modells können Sie Ihren Zielanwendungsfall und eine Einschränkungsoptimierung wählen — Kostenoptimiert, Durchsatzoptimiert, Latenzoptimiert oder Ausgewogen — und Amazon konfiguriert SageMaker JumpStart automatisch den Endpunkt für dieses Szenario. Auf diese Weise erhalten Sie Einblick in wichtige Leistungskennzahlen wie P50-Latenz, Time-to-First-Token (TTFT) und Durchsatz und stellen gleichzeitig sicher, dass die Bereitstellung auf Ihre Arbeitslast abgestimmt ist. Öffnen Sie zunächst die Detailseite eines unterstützten Modells in Studio, wählen Sie Bereitstellen aus und konfigurieren Sie im Leistungsbereich Ihre optimierte Bereitstellung.

Wichtig

Einige Basismodelle erfordern vor der Bereitstellung die ausdrückliche Annahme einer Endbenutzer-Lizenzvereinbarung (EULA). Weitere Informationen finden Sie unter EULA-Akzeptanz in Amazon Studio SageMaker.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Fine-tune ein Modell in Studio

Bewerten eines Modells in Studio