Prérequis pour la distillation à l'aide d'un modèle - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Prérequis pour la distillation à l'aide d'un modèle

Avant de commencer, assurez-vous d’avoir bien compris les contrôles d’accès et de sécurité de la distillation de modèles. Vous devez également choisir un modèle enseignant et étudiant pour votre travail de distillation.

Permissions

Avant de commencer, assurez-vous d’avoir bien compris les contrôles d’accès et de sécurité de la distillation de modèles. Vous devez avoir un rôle de service IAM pouvant accéder au compartiment Amazon S3 où vous voulez stocker vos données d’entraînement et de validation pour la distillation de modèles. Amazon Bedrock propose également des options pour chiffrer et sécuriser davantage vos tâches de distillation et vos artefacts. Pour de plus amples informations, veuillez consulter Personnalisation, accès et sécurité des modèles.

Pour utiliser un profil d'inférence interrégional pour un modèle d'enseignant dans un poste de distillation, votre rôle de service doit être autorisé à invoquer le profil d'inférence dans un Région AWS, en plus du modèle de chaque région dans le profil d'inférence. Pour un exemple de stratégie, consultez (Facultatif) Autorisations pour créer une tâche de distillation avec un profil d’inférence interrégional. Pour plus d’informations sur l’inférence interrégionale, consultez Augmentez le débit grâce à l’inférence entre régions.

Choix des modèles enseignants et étudiants pour la distillation

Type de modèle Critères de sélection Considérations clés Exigences
Modèle d'enseignant Choisissez un modèle enseignant bien plus grand et plus performant que le modèle étudiant et dont vous souhaitez atteindre la précision pour votre cas d’utilisation. Pour rendre la distillation plus efficace, choisissez un modèle déjà entraîné pour des tâches similaires à votre cas d’utilisation. Pour certains modèles d'enseignants, vous pouvez choisir un profil d'inférence interrégional. Doit disposer des autorisations nécessaires pour invoquer des profils et des modèles d'inférence dans chaque région. Consultez la documentation sur l'inférence interrégionale pour des exemples de politiques.
Modèle étudiant Choisissez un modèle étudiant dont la taille est nettement plus petite que celle du modèle enseignant. Le modèle étudiant doit être l'un des modèles étudiants associés à votre modèle enseignant dans le tableau des modèles pris en charge. Doit être compatible avec le modèle d'enseignant sélectionné, comme indiqué dans le tableau suivant.

La section suivante répertorie les modèles et régions pris en charge pour la distillation de modèles Amazon Bedrock. Après avoir choisi vos modèles enseignants et étudiants, vous préparez et optimisez vos jeux de données d’entraînement pour la distillation. Pour plus d’informations, consultez Préparation de vos jeux de données d’entraînement pour la distillation.

Modèles et régions pris en charge pour la distillation de modèles Amazon Bedrock

Le tableau suivant indique quels modèles et Régions AWS Amazon Bedrock Model Distillation sont compatibles avec les modèles destinés aux enseignants et aux étudiants. Si vous utilisez un profil d’inférence entre régions, seuls les profils d’inférence système sont pris en charge pour la distillation de modèles. Pour plus d’informations, consultez Augmentez le débit grâce à l’inférence entre régions.

Fournisseur Enseignant ID enseignant Support des profils d’inférence Étudiant ID étudiant Région
Amazon Nova Pro amazon. nova-pro-v1:0 les deux

Nova Lite

Nova Micro

amazon. nova-lite-v1:30:300 km

amazon. nova-micro-v1:40:128 km

USA Est (Virginie du Nord)
Nova Premier amazon. nova-premier-v1:0 Profil d’inférence uniquement

Nova Lite

Nova Micro

Nova Pro

amazon. nova-lite-v1:30:300 km

amazon. nova-micro-v1:40:128 km

amazon. nova-pro-v1:30:300 km

USA Est (Virginie du Nord)
Anthropic Claude 3.5 v1 anthropic.claude-3-5-sonnet-20240620-v1:0 les deux

Claude 3 Haiku

anthropic.claude-3-haiku-20240307-v1:0:200k

USA Ouest (Oregon)
Claude 3.5 v2 anthropic.claude-3-5-sonnet-20241022-v2:0 les deux

Claude 3 Haiku

anthropic.claude-3-haiku-20240307-v1:0:200k

USA Ouest (Oregon)
Meta Llama 3.1 405B meta.llama3-1-405 1:0 b-instruct-v À la demande

Llama 3.1 8B

Llama 3.1 70B

Llama 3.2 1B

Llama 3.3 70B

b-instruct-vmeta.llama3-1-8 1:10:128 k

b-instruct-vmeta.llama3-1-70 1:10:128 k

b-instruct-vmeta.llama3-2-1 1:0:128 k

b-instruct-vmeta.llama3-3-70 1:10:128 k

USA Ouest (Oregon)
Llama 3.1 70B meta.llama3-1-70 1:0 b-instruct-v les deux

Llama 3.1 8B

Llama 3.2 1B

Llama 3.2 3B

b-instruct-vmeta.llama3-1-8 1:10:128 k

b-instruct-vmeta.llama3-2-1 1:0:128 k

b-instruct-vmeta.llama3-2-3 1:0:128 k

USA Ouest (Oregon)
Llama 3.3 70B meta.llama3-3-70 1:0 b-instruct-v Profil d’inférence uniquement

Llama 3.1 8B

Llama 3.2 1B

Llama 3.2 3B

b-instruct-vmeta.llama3-1-8 1:10:128 k

b-instruct-vmeta.llama3-2-1 1:0:128 k

b-instruct-vmeta.llama3-2-3 1:0:128 k

USA Ouest (Oregon)
Note
  • Pour les modèles Claude et Llama, la tâche de distillation est effectuée dans la région USA Ouest (Oregon). Vous pouvez soit acheter du débit provisionné dans la région USA Ouest (Oregon), soit copier le modèle distillé dans une autre région, puis acheter du débit provisionné.

  • Pour les modèles Nova, vous exécutez une tâche de distillation dans la région USA Est (Virginie du Nord). Pour l’inférence, vous devez acheter du débit provisionné dans la région USA Est (Virginie du Nord). Vous ne pouvez pas copier de modèles Nova vers d’autres régions.