Bereitstellen von Grundlagenmodellen und maßgeschneiderten, optimierten Modellen

Ganz gleich, ob Sie vortrainierte Open-Weights-Modelle oder Gated-Modelle von Amazon SageMaker JumpStart oder Ihre eigenen benutzerdefinierten oder fein abgestimmten Modelle einsetzen, die in Amazon S3 oder Amazon gespeichert sind FSx, SageMaker HyperPod bietet die flexible, skalierbare Infrastruktur, die Sie für Produktionsinferenz-Workloads benötigen.

	Stellen Sie Open-Weights- und Gated-Foundation-Modelle bereit von JumpStart	Stellen Sie benutzerdefinierte und fein abgestimmte Modelle von Amazon S3 und Amazon bereit FSx
Beschreibung	Nutzen Sie für die Implementierung einen umfassenden Katalog vortrainierter Grundlagenmodelle mit automatischen Optimierungs- und Skalierungsrichtlinien, die auf jede Modellfamilie zugeschnitten sind.	Bringen Sie Ihre eigenen maßgeschneiderten und fein abgestimmten Modelle mit und nutzen Sie die SageMaker HyperPod Unternehmensinfrastruktur für Inferenzen im Produktionsmaßstab. Wählen Sie zwischen kostengünstigem Speicher mit Amazon S3 oder einem leistungsstarken Dateisystem mit Amazon FSx.
Die wichtigsten Vorteile	Bereitstellung mit einem Klick über die Amazon SageMaker Studio-Benutzeroberfläche Automatische Skalierung auf der Grundlage eingehender Anfragen ist automatisch aktiviert Voroptimierte Container und Konfigurationen für jede Modellfamilie EULA-Verwaltung für geschlossene Modelle	Support für mehrere Speicher-Backends: Amazon S3, Amazon FSx Flexible Container- und Framework-Unterstützung Benutzerdefinierte Skalierungsrichtlinien, die auf den Merkmalen Ihres Modells basieren
Optionen für die Bereitstellung	Amazon SageMaker Studio für die visuelle Bereitstellung kubectl für Kubernetes-native Operationen Python-SDK für programmatische Integration HyperPod CLI für Befehlszeilenautomatisierung	kubectl für Kubernetes-native Operationen Python-SDK für programmatische Integration HyperPod CLI für Befehlszeilenautomatisierung

In den folgenden Abschnitten werden Sie Schritt für Schritt durch die Bereitstellung von Modellen von Amazon SageMaker JumpStart sowie von Amazon S3 und Amazon geführt FSx.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Einrichtung Ihrer HyperPod Cluster für die Modellbereitstellung

Stellen Sie Modelle JumpStart mithilfe von Studio bereit