Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ottimizzazione dei Amazon Nova modelli con messa a punto supervisionata
Amazon NovaI dati SFT 2.0 utilizzano lo stesso formato API Converse della versione Amazon Nova 1.0, con l'aggiunta di campi di contenuto opzionali di ragionamento. Per le specifiche complete del formato, consulta lo ReasoningContentBlockschema delle API di Converse.
Funzionalità supportate:
Tipi di input: testo, immagine o video nei blocchi di contenuto dell'utente
Contenuti dell'assistente: risposte di solo testo e contenuti di ragionamento
Composizione del set di dati: deve essere omogenea. Scegliete una delle seguenti opzioni: giri di solo testo, giri testo+immagine o testo+video
Importante
Non puoi mescolare immagini e video all'interno dello stesso set di dati o in turni diversi.
Limitazioni attuali:
Utilizzo degli strumenti: sebbene l'utilizzo degli strumenti sia supportato nel formato di input, attualmente non è supportato da Amazon Nova 2.0 SFT. L'aggiunta di sezioni relative agli strumenti potrebbe causare il fallimento del lavoro.
Contenuto di ragionamento multimodale: sebbene il formato Converse supporti contenuti di ragionamento basati su immagini, questo non è supportato dalla SFT 2.0. Amazon Nova
Set di convalida: la fornitura di un set di convalida potrebbe essere supportata tramite l'interfaccia utente ma non durante la formazione SFT.
Formati multimediali supportati:
Immagini: PNG, JPEG, GIF
Video: MOV, MKV, MP4
Esempi di formati di dati
Contenuto del ragionamento
Il contenuto del ragionamento (chiamato anche chain-of-thought) cattura le fasi di pensiero intermedie del modello prima di generare una risposta finale. A assistant sua volta, usa il reasoningContent campo per includere queste tracce di ragionamento.
Come viene calcolata la perdita:
Con contenuto di ragionamento: la perdita di formazione include sia i token di ragionamento che i token di output finale
Senza contenuti di ragionamento: la perdita di formazione viene calcolata solo sui token di output finali
Quando abilitare la modalità di ragionamento: imposta reasoning_enabled: true nella configurazione di addestramento se desideri che il modello generi token di pensiero prima di produrre i risultati finali o se desideri migliorare le prestazioni in attività di ragionamento complesse. Imposta reasoning_enabled: false quando ti alleni su attività semplici che non traggono vantaggio da passaggi di ragionamento espliciti.
Nota
Puoi abilitare la modalità di ragionamento indipendentemente dal fatto che i dati di allenamento contengano contenuti di ragionamento. Tuttavia, si consiglia di includere tracce di ragionamento nei dati di allenamento in modo che il modello possa imparare da questi esempi e migliorare la qualità del ragionamento.
Linee guida per la formattazione:
Usa testo semplice per ragionare i contenuti.
Evita i tag di markup come
<thinking>e</thinking>a meno che non siano specificamente richiesti dalla tua attività.Assicurati che il contenuto del ragionamento sia chiaro e pertinente al processo di risoluzione dei problemi.
Un contenuto di ragionamento efficace dovrebbe includere:
Pensieri e analisi intermedi
Deduzioni logiche e fasi di inferenza
Step-by-step approcci per la risoluzione dei problemi
Connessioni esplicite tra fasi e conclusioni
Se il tuo set di dati non contiene tracce di ragionamento, puoi crearle utilizzando un modello in grado di ragionare come Nova Premier. Fornisci le tue coppie di input-output al modello e acquisisci il relativo processo di ragionamento per creare un set di dati basato sul ragionamento.
Linee guida per la preparazione dei dataset
La tabella seguente fornisce linee guida per la preparazione del set di dati di allenamento.
| Linea guida | Description |
|---|---|
| Dimensioni e qualità |
|
| Diversità |
Includi diversi esempi che eseguono le seguenti operazioni:
|
| Formattazione dell'output |
Specificate chiaramente il formato di output desiderato nelle risposte dell'assistente. Gli esempi includono strutture JSON, tabelle, formato CSV o formati personalizzati specifici dell'applicazione. |
| Conversazioni a più turni |
|
| Lista di controllo della qualità |
|