Stellen Sie Basismodelle und benutzerdefinierte, fein abgestimmte Modelle bereit - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Stellen Sie Basismodelle und benutzerdefinierte, fein abgestimmte Modelle bereit

Ganz gleich, ob Sie vortrainierte Open-Weights-Modelle oder Gated-Modelle von Amazon SageMaker JumpStart oder Ihre eigenen benutzerdefinierten oder fein abgestimmten Modelle einsetzen, die in Amazon S3 oder Amazon gespeichert sind FSx, SageMaker HyperPod bietet die flexible, skalierbare Infrastruktur, die Sie für Produktionsinferenz-Workloads benötigen.

Stellen Sie Open-Weights- und Gated-Foundation-Modelle bereit von JumpStart Stellen Sie benutzerdefinierte und fein abgestimmte Modelle von Amazon S3 und Amazon bereit FSx
Beschreibung

Nutzen Sie für die Implementierung einen umfassenden Katalog vortrainierter Basismodelle mit automatischen Optimierungs- und Skalierungsrichtlinien, die auf jede Modellfamilie zugeschnitten sind.

Bringen Sie Ihre eigenen, maßgeschneiderten und fein abgestimmten Modelle mit und nutzen Sie die SageMaker HyperPod Unternehmensinfrastruktur für Inferenzen im Produktionsmaßstab. Wählen Sie zwischen kostengünstigem Speicher mit Amazon S3 oder einem leistungsstarken Dateisystem mit Amazon FSx.
Die wichtigsten Vorteile
  • Bereitstellung mit einem Klick über die Amazon SageMaker Studio-Benutzeroberfläche

  • Automatische Skalierung auf der Grundlage eingehender Anfragen wird automatisch aktiviert

  • Voroptimierte Container und Konfigurationen für jede Modellfamilie

  • EULA-Verwaltung für geschlossene Modelle

  • Support für mehrere Speicher-Backends: Amazon S3, Amazon FSx

  • Flexible Container- und Framework-Unterstützung

  • Benutzerdefinierte Skalierungsrichtlinien, die auf den Merkmalen Ihres Modells basieren

Optionen für die Bereitstellung
  • Amazon SageMaker Studio für die visuelle Bereitstellung

  • kubectl für Kubernetes-native Operationen

  • Python-SDK für die programmatische Integration

  • HyperPod CLI für Befehlszeilenautomatisierung

  • kubectl für Kubernetes-native Operationen

  • Python-SDK für die programmatische Integration

  • HyperPod CLI für Befehlszeilenautomatisierung

In den folgenden Abschnitten werden Sie Schritt für Schritt durch die Bereitstellung von Modellen von Amazon SageMaker JumpStart sowie von Amazon S3 und Amazon geführt FSx.