Come usare Amazon Bedrock Model Distillation Come funziona Amazon Bedrock Model Distillation

Personalizzare un modello con distillazione in Amazon Bedrock

Per distillazione di modelli si intende il processo di trasferimento delle informazioni da un modello più grande e intelligente (noto come insegnante) a un modello più piccolo, veloce e conveniente (noto come studente). In questo processo, le prestazioni del modello studente migliorano per un caso d’uso specifico. Amazon Bedrock Model Distillation automatizza il processo di distillazione utilizzando le tecniche di sintesi dei dati più recenti per generare risposte diverse e di alta qualità a partire dal modello insegnante ed esegue il fine-tuning del modello studente.

Come usare Amazon Bedrock Model Distillation

Per utilizzare Amazon Bedrock Model Distillation, procedi come segue:

Scegli un modello di insegnante e un modello di studente: per ulteriori informazioni, consulta. Prerequisiti per la distillazione modello
Prepara i dati di allenamento per la distillazione: i dati di allenamento sono una raccolta di istruzioni archiviate in file. .jsonl Amazon Bedrock utilizza i dati di input forniti per generare risposte dal modello insegnante e utilizza le risposte per eseguire il fine-tuning del modello studente.
- Ottimizza i prompt: formatta i prompt di input per il caso d'uso che desideri. Per ulteriori informazioni, consulta Ottimizzare i prompt di input per la generazione di dati sintetici.
- Usa esempi etichettati: prepara i dati di input etichettati come coppie di pronta risposta. Amazon Bedrock può utilizzare queste coppie come esempi utili per generare risposte in base al modello insegnante. Per ulteriori informazioni, consulta Opzione 1: fornisci i tuoi prompt per la preparazione dei dati.
- Usa i log delle chiamate: se abiliti la registrazione delle chiamate di CloudWatch Logs, puoi utilizzare le risposte esistenti degli insegnanti dai log delle chiamate archiviati in Amazon S3 come dati di formazione. In Amazon Bedrock, un log delle invocazioni è un registro dettagliato delle invocazioni del modello. Per ulteriori informazioni, consulta Opzione 2: utilizzare i log delle invocazioni per la preparazione dei dati.
Crea un processo di distillazione: questo processo crea un modello più piccolo, più veloce e più conveniente per il tuo caso d'uso. Solo tu puoi accedere al modello distillato finale. Amazon Bedrock non utilizza i tuoi dati per addestrare alcun altro modello studente o insegnante per uso pubblico. Per ulteriori informazioni, consulta Inviare un processo di distillazione di modelli in Amazon Bedrock. Per ulteriori informazioni sulla configurazione dell'inferenza su richiesta, vedere. Impostazione dell’inferenza per un modello personalizzato

Come funziona Amazon Bedrock Model Distillation

Amazon Bedrock Model Distillation è un unico flusso di lavoro che automatizza il processo di creazione di un modello distillato. In questo flusso di lavoro, Amazon Bedrock genera risposte da un modello insegnante, aggiungendo tecniche di sintesi dei dati per migliorare la generazione delle risposte ed eseguendo il fine-tuning del modello studente con le risposte generate. Il set di dati aumentato è suddiviso in set di dati separati da utilizzare per l’addestramento e la convalida. Amazon Bedrock utilizza solo i dati del set di dati di addestramento per eseguire il fine-tuning del modello studente.

Dopo aver identificato i modelli studente e insegnante, puoi scegliere in che modo desideri che Amazon Bedrock crei un modello distillato per il caso d’uso specifico. Amazon Bedrock può generare le risposte del modello insegnante utilizzando i prompt forniti oppure è possibile utilizzare i propri dati di produzione tramite i log delle invocazioni. Amazon Bedrock Model Distillation utilizza queste risposte per eseguire il fine-tuning del modello studente.

Nota

Se Amazon Bedrock Model Distillation utilizza le sue tecniche proprietarie di sintesi dei dati per generare risposte degli insegnanti di qualità superiore, Account AWS dovrai sostenere costi aggiuntivi per le chiamate di inferenza al modello di insegnante. Tali costi verranno addebitati in base alle tariffe di inferenza on demand del modello insegnante. Le tecniche di sintesi dei dati possono aumentare le dimensioni del set di dati di fine-tuning fino a un massimo di 15.000 coppie di prompt-risposta. Per ulteriori informazioni sui prezzi di Amazon Bedrock, consulta Prezzi di Amazon Bedrock.

Amazon Bedrock utilizza i prompt di input forniti dall’utente per generare risposte dal modello insegnante. Amazon Bedrock utilizza quindi le risposte per eseguire il fine-tuning del modello studente identificato. In base al caso d’uso, Amazon Bedrock potrebbe aggiungere tecniche proprietarie di sintesi dei dati per generare risposte diverse e di qualità superiore. Ad esempio, Amazon Bedrock potrebbe generare prompt simili per generare risposte più diversificate a partire dal modello insegnante. In alternativa, se facoltativamente si forniscono alcuni dati di input etichettati come coppie prompt-risposta, Amazon Bedrock potrebbe utilizzare tali coppie come ottimi esempi per istruire il modello insegnante a generare risposte simili di alta qualità.

Se si dispone già di risposte generate dal modello insegnante e le hai archiviate nei log delle invocazioni, è possibile utilizzare le risposte esistenti del modello insegnante per eseguire il fine-tuning del modello studente. A tal fine, è necessario fornire ad Amazon Bedrock l’accesso ai log delle invocazioni. In Amazon Bedrock, un log delle invocazioni è un registro dettagliato delle invocazioni del modello. Per ulteriori informazioni, consulta Monitorare la chiamata del modello tramite Logs. CloudWatch

Se scegli questa opzione, puoi continuare a utilizzare le operazioni dell'API di inferenza di Amazon Bedrocks, come InvokeModell'API Converse, e raccogliere i log delle chiamate, i dati di input del modello (prompt) e i dati di output del modello (risposte) per tutte le chiamate utilizzate in Amazon Bedrock.

Quando si generano risposte del modello utilizzando le operazioni dell’API InvokeModel o Converse, è possibile (facoltativamente) aggiungere requestMetadata alle risposte. Quando si crea un processo di distillazione, è possibile applicare un filtro in base a questi metadati nell’ambito della configurazione dei log delle invocazioni. Si possono applicare filtri in ai casi d’uso specifici, quindi Amazon Bedrock utilizza solo le risposte filtrate per eseguire il fine-tuning del modello studente. Se si sceglie di utilizzare i log delle invocazioni per eseguire il fine-tuning del modello studente, Amazon Bedrock può utilizzare solo i prompt o coppie di prompt-risposta.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Valuta il tuo modello RFT

Prerequisiti