Déploiement de modèles depuis JumpStart à l’aide d’Amazon SageMaker Studio - Amazon SageMaker AI

Déploiement de modèles depuis JumpStart à l’aide d’Amazon SageMaker Studio

Les étapes suivantes montrent comment déployer des modèles depuis JumpStart à l’aide d’Amazon SageMaker Studio.

Prérequis

Vérifiez que vous avez configuré les fonctionnalités d’inférence sur vos clusters Amazon SageMaker HyperPod. Pour plus d’informations, consultez Configuration de vos clusters HyperPod pour le déploiement de modèles.

Création d’un déploiement HyperPod

  1. Dans Amazon SageMaker Studio, ouvrez la page de destination JumpStart depuis le volet de navigation de gauche.

  2. Sous Tous les modèles publics, choisissez le modèle que vous souhaitez déployer.

    Note

    Si vous avez sélectionné un modèle à accès contrôlé, vous devez accepter le contrat de licence utilisateur final (CLUF).

  3. Choisissez SageMaker HyperPod.

  4. Sous Paramètres de déploiement, JumpStart recommandera une instance à déployer. Vous pouvez modifier ces paramètres, si nécessaire.

    1. Si vous modifiez le type d’instance, assurez-vous qu’il est compatible avec le cluster HyperPod choisi. S’il n’existe aucune instance compatible, vous devez sélectionner un nouveau cluster HyperPod ou contacter votre administrateur pour ajouter des instances compatibles au cluster.

    2. Pour hiérarchiser le déploiement du modèle, installez le module complémentaire de gouvernance des tâches, créez des allocations de calcul et configurez le classement des tâches pour la politique de cluster. Une fois cela fait, vous devriez voir une option permettant de sélectionner une priorité pour le déploiement du modèle, qui peut être utilisée pour la préemption d’autres déploiements et tâches sur le cluster.

    3. Entrez l’espace de noms auquel votre administrateur vous a donné accès. Vous devrez peut-être contacter directement votre administrateur pour obtenir l’espace de noms exact. Une fois qu’un espace de noms valide est fourni, le bouton Déployer doit être activé pour déployer le modèle.

  5. Choisissez Déployer et attendez que le point de terminaison soit créé.

  6. Une fois le point de terminaison créé, sélectionnez Tester l’inférence.

Modification d’un déploiement HyperPod

  1. Dans Amazon SageMaker Studio, sélectionnez Calcul puis Clusters HyperPod dans le volet de navigation de gauche.

  2. Sous Déploiements, choisissez le déploiement du cluster HyperPod que vous souhaitez modifier.

  3. À partir de l’icône aux points de suspension verticaux (⋮), choisissez Modifier.

  4. Sous Paramètres de déploiement, vous pouvez activer ou désactiver Auto Scaling et modifier le nombre Réplicas max.

  5. Sélectionnez Save.

  6. Le statut passera à Mise à jour. Lorsqu’il redevient En service, vos modifications sont terminées et un message de confirmation s’affiche.

Suppression d’un déploiement HyperPod

  1. Dans Amazon SageMaker Studio, sélectionnez Calcul puis Clusters HyperPod dans le volet de navigation de gauche.

  2. Sous Déploiements, choisissez le déploiement du cluster HyperPod que vous souhaitez modifier.

  3. À partir de l’icône aux points de suspension verticaux (⋮), choisissez Supprimer.

  4. Dans la fenêtre de déploiement Supprimer HyperPod, cochez la case.

  5. Sélectionnez Delete (Supprimer).

  6. Le statut passera à Suppression. Une fois le déploiement HyperPod supprimé, vous verrez un message le confirmant.