Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ottimizzazione supervisionata su 2.0 Amazon Nova
Panoramica di
Amazon NovaI dati SFT 2.0 utilizzano lo stesso formato API Converse della versione Amazon Nova 1.0, con l'aggiunta di campi di contenuto facoltativi di ragionamento. Per le specifiche complete del formato, consulta lo ReasoningContentBlockschema delle API di Converse.
Funzionalità supportate
Tipi di input: testo, immagine o video nei blocchi di contenuti utente
Contenuti dell'assistente: risposte di solo testo e contenuti di ragionamento
Composizione del set di dati: deve essere omogenea. Scegliete una delle seguenti opzioni: giri di solo testo, giri testo+immagine o testo+video
Importante
Non puoi mescolare immagini e video all'interno dello stesso set di dati o in turni diversi.
Limitazioni attuali
Utilizzo degli strumenti: sebbene l'utilizzo degli strumenti sia supportato nel formato di input, attualmente non è supportato da Amazon Nova 2.0 SFT. L'aggiunta di sezioni relative agli strumenti potrebbe causare il fallimento del lavoro.
Contenuto di ragionamento multimodale: sebbene il formato Converse supporti contenuti di ragionamento basati su immagini, questo non è supportato dalla SFT 2.0. Amazon Nova
Set di convalida: la fornitura di un set di convalida potrebbe essere supportata tramite l'interfaccia utente ma non durante la formazione SFT.
Formati multimediali supportati
Immagini: PNG, JPEG, GIF
Video: MOV, MKV, MP4
Esempi di formati di dati
Modalità di ragionamento e non ragionamento
Comprensione del contenuto del ragionamento: il contenuto del ragionamento (chiamato anche chain-of-thought) cattura le fasi di pensiero intermedie del modello prima di generare una risposta finale. A assistant sua volta, usa il reasoningContent campo per includere queste tracce di ragionamento.
Come viene calcolata la perdita:
Con contenuto di ragionamento: la perdita di formazione include sia i token di ragionamento che i token di output finale
Senza contenuti di ragionamento: la perdita di formazione viene calcolata solo sui token di output finali
Puoi includere più turni di assistente reasoningContent in conversazioni a turni multipli.
Quando abilitare la modalità di ragionamento
Imposta reasoning_enabled: true nella configurazione di addestramento quando desideri che il modello generi token di riflessione prima di produrre gli output finali o se desideri migliorare le prestazioni in attività di ragionamento complesse.
Nota
È possibile abilitare la modalità di ragionamento indipendentemente dal fatto che i dati di allenamento contengano contenuti di ragionamento. Tuttavia, si consiglia di includere tracce di ragionamento nei dati di allenamento in modo che il modello possa imparare da questi esempi e migliorare la qualità del ragionamento.
Imposta reasoning_enabled: false quando ti alleni su attività semplici che non traggono vantaggio da passaggi di ragionamento espliciti o che desiderano ottimizzare la velocità e ridurre l'uso dei token.
Linee guida per la formattazione
Usa testo semplice per ragionare i contenuti.
Evita i tag di markup come
<thinking>e</thinking>a meno che non siano specificamente richiesti dalla tua attività.Assicurati che il contenuto del ragionamento sia chiaro e pertinente al processo di risoluzione dei problemi.
Generazione di dati di ragionamento
Se il tuo set di dati non contiene tracce di ragionamento, puoi crearle utilizzando un modello in grado di ragionare come. Fornisci le tue coppie di input-output al modello e acquisisci il relativo processo di ragionamento per creare un set di dati basato sul ragionamento.
Utilizzo di token di ragionamento per la formazione
Quando si allena con la modalità di ragionamento abilitata, il modello impara a separare il ragionamento interno dalla risposta finale. Il processo di formazione esegue le seguenti operazioni:
Organizza i dati in tre parti: input, ragionamento e risposta
Ottimizza l'utilizzo della previsione standard del token successivo (perdita derivante sia dai token di ragionamento che da quelli di risposta)
Incoraggia il modello a ragionare internamente prima di generare risposte
Contenuti di ragionamento efficaci
Un contenuto di ragionamento di alta qualità dovrebbe includere quanto segue:
Pensieri e analisi intermedi
Deduzioni logiche e fasi di inferenza
Step-by-step approcci per la risoluzione dei problemi
Connessioni esplicite tra fasi e conclusioni
Questo aiuta il modello a sviluppare la capacità di pensare prima di rispondere.
Linee guida per la preparazione dei dataset
La tabella seguente fornisce le linee guida per la preparazione del set di dati di allenamento.
| Linea guida | Description |
|---|---|
| Dimensioni e qualità |
|
| Diversità |
Includi diversi esempi che eseguono le seguenti operazioni:
|
| Formattazione dell'output |
Specificate chiaramente il formato di output desiderato nelle risposte dell'assistente. Gli esempi includono strutture JSON, tabelle, formato CSV o formati personalizzati specifici dell'applicazione. |
| Conversazioni a più turni |
|
| Lista di controllo della qualità |
|