Déploiement de modèles de fondation et de modèles personnalisés et peaufinés - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déploiement de modèles de fondation et de modèles personnalisés et peaufinés

Que vous déployiez des modèles de base ouverts ou fermés préentraînés d'Amazon SageMaker JumpStart ou que vous déployiez vos propres modèles personnalisés ou affinés stockés dans Amazon S3 ou Amazon FSx, SageMaker HyperPod vous disposez de l'infrastructure flexible et évolutive dont vous avez besoin pour les charges de travail d'inférence de production.

Déployez des modèles à poids ouverts et à fondations fermées à partir de JumpStart Déployez des modèles personnalisés et affinés depuis Amazon S3 et Amazon FSx
Description

Déployez à partir d’un catalogue complet de modèles de fondation pré-entraînés avec des politiques d’optimisation et de mise à l’échelle automatiques adaptées à chaque famille de modèles.

Apportez vos propres modèles personnalisés et affinés et tirez parti de l'infrastructure d'entreprise pour des SageMaker HyperPod inférences à l'échelle de la production. Choisissez entre un stockage rentable avec Amazon S3 ou un système de fichiers performant avec Amazon FSx.
Principaux avantages
  • Déploiement en un clic via l'interface utilisateur d'Amazon SageMaker Studio

  • Autoscaling en fonction des demandes entrantes activée automatiquement

  • Conteneurs et configurations pré-optimisés pour chaque famille de modèles

  • Gestion des CLUF pour les modèles à accès contrôlé

  • Support pour plusieurs backends de stockage : Amazon S3, Amazon FSx

  • Prise en charge flexible de conteneurs et de cadres

  • Politiques de mise à l’échelle personnalisées en fonction des caractéristiques de votre modèle

Options de déploiement
  • Amazon SageMaker Studio pour le déploiement visuel

  • kubectl pour les opérations natives de Kubernetes

  • Kit SDK Python pour l’intégration programmatique

  • HyperPod CLI pour l'automatisation par ligne de commande

  • kubectl pour les opérations natives de Kubernetes

  • Kit SDK Python pour l’intégration programmatique

  • HyperPod CLI pour l'automatisation par ligne de commande

Les sections suivantes vous expliquent comment déployer des modèles depuis Amazon SageMaker JumpStart et depuis Amazon S3 et Amazon FSx.