Déployez des modèles de base et des modèles personnalisés et affinés - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déployez des modèles de base et des modèles personnalisés et affinés

Que vous déployiez des modèles de base ouverts ou fermés préentraînés d'Amazon SageMaker JumpStart ou que vous déployiez vos propres modèles personnalisés ou affinés stockés dans Amazon S3 ou Amazon FSx, SageMaker HyperPod vous disposez de l'infrastructure flexible et évolutive dont vous avez besoin pour les charges de travail d'inférence de production.

Déployez des modèles de fondations ouvertes et fermées à partir de JumpStart Déployez des modèles personnalisés et affinés depuis Amazon S3 et Amazon FSx
Description

Déployez à partir d'un catalogue complet de modèles de base préentraînés avec des politiques d'optimisation et de dimensionnement automatiques adaptées à chaque famille de modèles.

Apportez vos propres modèles personnalisés et affinés et tirez parti de l'infrastructure d'entreprise pour des SageMaker HyperPod inférences à l'échelle de la production. Choisissez entre un stockage rentable avec Amazon S3 ou un système de fichiers performant avec Amazon FSx.
Principaux avantages
  • Déploiement en un clic via l'interface utilisateur d'Amazon SageMaker Studio

  • Mise à l'échelle automatique en fonction des demandes entrantes activée automatiquement

  • Conteneurs et configurations préoptimisés pour chaque famille de modèles

  • Gestion des EULA pour les modèles à accès fermé

  • Support pour plusieurs backends de stockage : Amazon S3, Amazon FSx

  • Support flexible pour conteneurs et cadres

  • Politiques de dimensionnement personnalisées en fonction des caractéristiques de votre modèle

Options de déploiement
  • Amazon SageMaker Studio pour le déploiement visuel

  • kubectl pour les opérations natives de Kubernetes

  • SDK Python pour l'intégration programmatique

  • HyperPod CLI pour l'automatisation par ligne de commande

  • kubectl pour les opérations natives de Kubernetes

  • SDK Python pour l'intégration programmatique

  • HyperPod CLI pour l'automatisation par ligne de commande

Les sections suivantes vous expliquent comment déployer des modèles depuis Amazon SageMaker JumpStart et depuis Amazon S3 et Amazon FSx.