View a markdown version of this page

Déploiement d’un modèle dans Studio - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déploiement d’un modèle dans Studio

Pour déployer des modèles de JumpStart base, accédez à une fiche détaillée du modèle dans l'interface utilisateur de Studio. Pour plus d'informations sur la procédure d'ouverture JumpStart dans Studio, consultezOuvrir JumpStart dans le studio. Après avoir accédé à la page des détails du modèle de votre choix, choisissez Déployer dans le coin supérieur droit de l’interface utilisateur Studio. Suivez ensuite les étapes décrites dans Déployer des modèles avec SageMaker Studio.

Amazon propose SageMaker JumpStart également des déploiements optimisés, qui fournissent des configurations de déploiement prédéfinies conçues pour des cas d'utilisation spécifiques tels que la génération de contenu, la synthèse ou les interactions de type chat. Lorsque vous déployez un modèle pris en charge, vous pouvez sélectionner votre cas d'utilisation cible et choisir une optimisation des contraintes (optimisation des coûts, optimisation du débit, optimisation de la latence ou équilibrée) et Amazon configure SageMaker JumpStart automatiquement le point de terminaison pour ce scénario. Cela vous donne une visibilité sur les indicateurs de performance clés tels que la latence P50 time-to-first-token (TTFT) et le débit, tout en garantissant que le déploiement est adapté à votre charge de travail. Pour commencer, ouvrez la page détaillée d'un modèle pris en charge dans Studio, choisissez Deploy et utilisez le panneau Performances pour configurer votre déploiement optimisé.

Important

Certains modèles de fondation nécessitent l’acceptation explicite d’un contrat de licence d’utilisateur final (CLUF) avant le déploiement. Pour de plus amples informations, veuillez consulter Acceptation du CLUF dans Amazon Studio SageMaker.