Scelta di modelli studente e insegnante per la distillazione - Amazon Bedrock

Scelta di modelli studente e insegnante per la distillazione

Per distillazione di modelli, scegli un modello studente o insegnante.

  • Scelta di un modello insegnante

    Scegli un modello insegnante che sia significativamente più grande e più capace del modello studente e di cui desideri la precisione per il tuo caso d’uso. Per rendere la distillazione più efficace, scegli un modello che sia già stato addestrato su attività simili al tuo caso d’uso.

    Per alcuni modelli insegnante, puoi scegliere un profilo di inferenza interregionale (Aumentare il throughput con l’inferenza tra Regioni). L’inferenza interregionale seleziona automaticamente la Regione AWS ottimale all’interno della geografica per elaborare la richiesta di inferenza. Ciò migliora l’esperienza del cliente massimizzando le risorse disponibili e la disponibilità del modello. Per utilizzare un profilo di inferenza interregionale, il ruolo di servizio deve disporre delle autorizzazioni per invocare il profilo di inferenza in una Regione AWS, oltre al modello in ogni Regione del profilo di inferenza. Per un esempio di policy, consulta (Facoltativo) Autorizzazioni per creare un processo di distillazione con un profilo di inferenza interregionale.

  • Scegli un modello studente

    Scegli un modello studente che sia significativamente più piccolo rispetto al modello insegnante. Il modello studente deve essere uno dei modelli studente abbinati al modello insegnante nella tabella seguente.

Nella sezione seguente vengono elencati i modelli e le Regioni supportati per Amazon Bedrock Model Distillation. Dopo aver scelto i modelli insegnante e studente, prepara e ottimizza i set di dati di addestramento per la distillazione. Per ulteriori informazioni, consulta Preparare i set di dati di addestramento per la distillazione.

Modelli e Regioni supportati per Amazon Bedrock Model Distillation

Nella tabella seguente vengono mostrati quali modelli e Regioni AWS sono supportati da Amazon Bedrock Model Distillation per i modelli insegnante e studente. Se utilizzi un profilo di inferenza tra Regioni, per la distillazione di modelli sono supportati solo i profili di inferenza di sistema. Per ulteriori informazioni, consulta Aumentare il throughput con l’inferenza tra Regioni.

Provider Insegnante ID insegnante Supporto per profili di inferenza Studente ID studente Regione
Amazon Nova Pro amazon.nova-pro-v1:0 Entrambi

Nova Lite

Nova Micro

amazon.nova-lite-v1:0:300k

amazon.nova-micro-v1:0:128k

Stati Uniti orientali (Virginia settentrionale)
Nova Premier amazon.nova-premier-v1:0 Solo profilo di inferenza

Nova Lite

Nova Micro

Nova Pro

amazon.nova-lite-v1:0:300k

amazon.nova-micro-v1:0:128k

amazon.nova-pro-v1:0:300k

Stati Uniti orientali (Virginia settentrionale)
Anthropic Claude 3.5 v1 anthropic.claude-3-5-sonnet-20240620-v1:0 Entrambi

Claude 3 Haiku

anthropic.claude-3-haiku-20240307-v1:0:200k

Stati Uniti occidentali (Oregon)
Claude 3.5 v2 anthropic.claude-3-5-sonnet-20241022-v2:0 Entrambi

Claude 3 Haiku

anthropic.claude-3-haiku-20240307-v1:0:200k

Stati Uniti occidentali (Oregon)
Meta Llama 3.1 405B meta.llama3-1-405b-instruct-v1:0 On demand

Llama 3.1 8B

Llama 3.1 70B

Llama 3.2 1B

Llama 3.3 70B

meta.llama3-1-8b-instruct-v1:0:128k

meta.llama3-1-70b-instruct-v1:0:128k

meta.llama3-2-1b-instruct-v1:0:128k

meta.llama3-3-70b-instruct-v1:0:128k

Stati Uniti occidentali (Oregon)
Llama 3.1 70B meta.llama3-1-70b-instruct-v1:0 Entrambi

Llama 3.1 8B

Llama 3.2 1B

Llama 3.2 3B

meta.llama3-1-8b-instruct-v1:0:128k

meta.llama3-2-1b-instruct-v1:0:128k

meta.llama3-2-3b-instruct-v1:0:128k

Stati Uniti occidentali (Oregon)
Llama 3.3 70B meta.llama3-3-70b-instruct-v1:0 Solo profilo di inferenza

Llama 3.1 8B

Llama 3.2 1B

Llama 3.2 3B

meta.llama3-1-8b-instruct-v1:0:128k

meta.llama3-2-1b-instruct-v1:0:128k

meta.llama3-2-3b-instruct-v1:0:128k

Stati Uniti occidentali (Oregon)
Nota
  • Per i modelli Claude e Llama, il processo di distillazione viene eseguito negli Stati Uniti occidentali (Oregon). Puoi acquistare il throughput assegnato negli Stati Uniti occidentali (Oregon) o copiare il modello distillato in un’altra Regione e quindi acquistare il throughput assegnato.

  • Per i modelli Nova, esegui un processo di distillazione negli Stati Uniti orientali (Virginia settentrionale). Per inferenza, è necessario acquistare il throughput assegnato negli Stati Uniti orientali (Virginia settentrionale). Non puoi copiare modelli Nova in altre Regioni.