Configuration de l’inférence pour un modèle personnalisé

Une fois le modèle personnalisé créé, vous pouvez configurer l’inférence à l’aide de l’une des options suivantes :

Acheter du débit provisionné : achetez du débit provisionné pour votre modèle afin de configurer une capacité de calcul dédiée avec un débit garanti pour des performances constantes et une latence réduite.

Pour plus d’informations sur le débit provisionné, consultez Augmentez la capacité d'invocation des modèles grâce au débit provisionné dans Amazon Bedrock. Pour plus d’informations sur l’utilisation des modèles personnalisés avec débit provisionné, consultez Achat de débit provisionné pour un modèle personnalisé.
Déployer un modèle personnalisé pour l’inférence à la demande : pour configurer l’inférence à la demande, vous déployez le modèle avec un déploiement de modèles personnalisés. Une fois le modèle déployé, vous pouvez l’invoquer à l’aide de l’ARN pour déployer le modèle personnalisé. Avec l’inférence à la demande, vous ne payez que pour ce que vous utilisez et vous n’avez pas besoin de configurer des ressources informatiques provisionnées.

Pour plus d’informations sur le déploiement de modèles personnalisés pour l’inférence à la demande, consultez Déploiement d’un modèle personnalisé pour une inférence à la demande.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Affichage des détails d’un modèle personnalisé

Achat de débit provisionné pour un modèle personnalisé