Scelta di modelli studente e insegnante per la distillazione
Per distillazione di modelli, scegli un modello studente o insegnante.
-
Scelta di un modello insegnante
Scegli un modello insegnante che sia significativamente più grande e più capace del modello studente e di cui desideri la precisione per il tuo caso d’uso. Per rendere la distillazione più efficace, scegli un modello che sia già stato addestrato su attività simili al tuo caso d’uso.
Per alcuni modelli insegnante, puoi scegliere un profilo di inferenza interregionale (Aumentare il throughput con l’inferenza tra Regioni). L’inferenza interregionale seleziona automaticamente la Regione AWS ottimale all’interno della geografica per elaborare la richiesta di inferenza. Ciò migliora l’esperienza del cliente massimizzando le risorse disponibili e la disponibilità del modello. Per utilizzare un profilo di inferenza interregionale, il ruolo di servizio deve disporre delle autorizzazioni per invocare il profilo di inferenza in una Regione AWS, oltre al modello in ogni Regione del profilo di inferenza. Per un esempio di policy, consulta (Facoltativo) Autorizzazioni per creare un processo di distillazione con un profilo di inferenza interregionale.
-
Scegli un modello studente
Scegli un modello studente che sia significativamente più piccolo rispetto al modello insegnante. Il modello studente deve essere uno dei modelli studente abbinati al modello insegnante nella tabella seguente.
Nella sezione seguente vengono elencati i modelli e le Regioni supportati per Amazon Bedrock Model Distillation. Dopo aver scelto i modelli insegnante e studente, prepara e ottimizza i set di dati di addestramento per la distillazione. Per ulteriori informazioni, consulta Preparare i set di dati di addestramento per la distillazione.
Modelli e Regioni supportati per Amazon Bedrock Model Distillation
Nella tabella seguente vengono mostrati quali modelli e Regioni AWS sono supportati da Amazon Bedrock Model Distillation per i modelli insegnante e studente. Se utilizzi un profilo di inferenza tra Regioni, per la distillazione di modelli sono supportati solo i profili di inferenza di sistema. Per ulteriori informazioni, consulta Aumentare il throughput con l’inferenza tra Regioni.
| Provider | Insegnante | ID insegnante | Supporto per profili di inferenza | Studente | ID studente | Regione |
|---|---|---|---|---|---|---|
| Amazon | Nova Pro | amazon.nova-pro-v1:0 | Entrambi | Nova Lite Nova Micro |
amazon.nova-lite-v1:0:300k amazon.nova-micro-v1:0:128k |
Stati Uniti orientali (Virginia settentrionale) |
| Nova Premier | amazon.nova-premier-v1:0 | Solo profilo di inferenza | Nova Lite Nova Micro Nova Pro |
amazon.nova-lite-v1:0:300k amazon.nova-micro-v1:0:128k amazon.nova-pro-v1:0:300k |
Stati Uniti orientali (Virginia settentrionale) | |
| Anthropic | Claude 3.5 v1 | anthropic.claude-3-5-sonnet-20240620-v1:0 | Entrambi | Claude 3 Haiku |
anthropic.claude-3-haiku-20240307-v1:0:200k |
Stati Uniti occidentali (Oregon) |
| Claude 3.5 v2 | anthropic.claude-3-5-sonnet-20241022-v2:0 | Entrambi | Claude 3 Haiku |
anthropic.claude-3-haiku-20240307-v1:0:200k |
Stati Uniti occidentali (Oregon) | |
| Meta | Llama 3.1 405B | meta.llama3-1-405b-instruct-v1:0 | On demand | Llama 3.1 8B Llama 3.1 70B Llama 3.2 1B Llama 3.3 70B |
meta.llama3-1-8b-instruct-v1:0:128k meta.llama3-1-70b-instruct-v1:0:128k meta.llama3-2-1b-instruct-v1:0:128k meta.llama3-3-70b-instruct-v1:0:128k |
Stati Uniti occidentali (Oregon) |
| Llama 3.1 70B | meta.llama3-1-70b-instruct-v1:0 | Entrambi | Llama 3.1 8B Llama 3.2 1B Llama 3.2 3B |
meta.llama3-1-8b-instruct-v1:0:128k meta.llama3-2-1b-instruct-v1:0:128k meta.llama3-2-3b-instruct-v1:0:128k |
Stati Uniti occidentali (Oregon) | |
| Llama 3.3 70B | meta.llama3-3-70b-instruct-v1:0 | Solo profilo di inferenza | Llama 3.1 8B Llama 3.2 1B Llama 3.2 3B |
meta.llama3-1-8b-instruct-v1:0:128k meta.llama3-2-1b-instruct-v1:0:128k meta.llama3-2-3b-instruct-v1:0:128k |
Stati Uniti occidentali (Oregon) |
Nota
-
Per i modelli Claude e Llama, il processo di distillazione viene eseguito negli Stati Uniti occidentali (Oregon). Puoi acquistare il throughput assegnato negli Stati Uniti occidentali (Oregon) o copiare il modello distillato in un’altra Regione e quindi acquistare il throughput assegnato.
-
Per i modelli Nova, esegui un processo di distillazione negli Stati Uniti orientali (Virginia settentrionale). Per inferenza, è necessario acquistare il throughput assegnato negli Stati Uniti orientali (Virginia settentrionale). Non puoi copiare modelli Nova in altre Regioni.