Esempi di formati di dati Contenuto del ragionamento Linee guida per la preparazione dei dataset

Ottimizzazione dei Amazon Nova modelli con messa a punto supervisionata

Amazon NovaI dati SFT 2.0 utilizzano lo stesso formato API Converse della versione Amazon Nova 1.0, con l'aggiunta di campi di contenuto opzionali di ragionamento. Per le specifiche complete del formato, consulta lo ReasoningContentBlockschema delle API di Converse.

Funzionalità supportate:

Tipi di input: testo, immagine o video nei blocchi di contenuto dell'utente
Contenuti dell'assistente: risposte di solo testo e contenuti di ragionamento
Composizione del set di dati: deve essere omogenea. Scegliete una delle seguenti opzioni: giri di solo testo, giri testo+immagine o testo+video

Importante

Non puoi mescolare immagini e video all'interno dello stesso set di dati o in turni diversi.

Limitazioni attuali:

Utilizzo degli strumenti: sebbene l'utilizzo degli strumenti sia supportato nel formato di input, attualmente non è supportato da Amazon Nova 2.0 SFT. L'aggiunta di sezioni relative agli strumenti potrebbe causare il fallimento del lavoro.
Contenuto di ragionamento multimodale: sebbene il formato Converse supporti contenuti di ragionamento basati su immagini, questo non è supportato dalla SFT 2.0. Amazon Nova
Set di convalida: la fornitura di un set di convalida potrebbe essere supportata tramite l'interfaccia utente ma non durante la formazione SFT.

Formati multimediali supportati:

Immagini: PNG, JPEG, GIF
Video: MOV, MKV, MP4

Esempi di formati di dati

Text-only

Questo esempio mostra un formato base di solo testo compatibile con Amazon Nova 1.0.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "The closest country is New Zealand"
        }
      ]
    }
  ]
}

Text with reasoning

Questo esempio mostra il testo con contenuti di ragionamento facoltativi per la versione 2.0. Amazon Nova


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I need to use my world knowledge of geography to answer this question"
            }
          }
        },
        {
          "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea."
        }
      ]
    }
  ]
}

Nota

Attualmente, reasoningText è supportato solo all'internoreasoningContent. Il contenuto del ragionamento multimodale non è ancora disponibile.

Image + text

Questo esempio mostra come includere l'input di immagini nel testo.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "image": {
            "format": "jpeg",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-image.jpg",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "Which country is highlighted in the image?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge"
            }
          }
        },
        {
          "text": "The highlighted country is New Zealand"
        }
      ]
    }
  ]
}

Video + text

Questo esempio mostra come includere l'input video nel testo.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "video": {
            "format": "mp4",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-video.mp4",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "What is shown in this video?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will analyze the video content to identify key elements"
            }
          }
        },
        {
          "text": "The video shows a map with New Zealand highlighted"
        }
      ]
    }
  ]
}

Contenuto del ragionamento

Il contenuto del ragionamento (chiamato anche chain-of-thought) cattura le fasi di pensiero intermedie del modello prima di generare una risposta finale. A assistant sua volta, usa il reasoningContent campo per includere queste tracce di ragionamento.

Come viene calcolata la perdita:

Con contenuto di ragionamento: la perdita di formazione include sia i token di ragionamento che i token di output finale
Senza contenuti di ragionamento: la perdita di formazione viene calcolata solo sui token di output finali

Quando abilitare la modalità di ragionamento: imposta reasoning_enabled: true nella configurazione di addestramento se desideri che il modello generi token di pensiero prima di produrre i risultati finali o se desideri migliorare le prestazioni in attività di ragionamento complesse. Imposta reasoning_enabled: false quando ti alleni su attività semplici che non traggono vantaggio da passaggi di ragionamento espliciti.

Nota

Puoi abilitare la modalità di ragionamento indipendentemente dal fatto che i dati di allenamento contengano contenuti di ragionamento. Tuttavia, si consiglia di includere tracce di ragionamento nei dati di allenamento in modo che il modello possa imparare da questi esempi e migliorare la qualità del ragionamento.

Linee guida per la formattazione:

Usa testo semplice per ragionare i contenuti.
Evita i tag di markup come <thinking> e </thinking> a meno che non siano specificamente richiesti dalla tua attività.
Assicurati che il contenuto del ragionamento sia chiaro e pertinente al processo di risoluzione dei problemi.

Un contenuto di ragionamento efficace dovrebbe includere:

Pensieri e analisi intermedi
Deduzioni logiche e fasi di inferenza
Step-by-step approcci per la risoluzione dei problemi
Connessioni esplicite tra fasi e conclusioni

Se il tuo set di dati non contiene tracce di ragionamento, puoi crearle utilizzando un modello in grado di ragionare come Nova Premier. Fornisci le tue coppie di input-output al modello e acquisisci il relativo processo di ragionamento per creare un set di dati basato sul ragionamento.

Linee guida per la preparazione dei dataset

La tabella seguente fornisce linee guida per la preparazione del set di dati di allenamento.

Linee guida per la preparazione dei dataset
Linea guida	Description
Dimensioni e qualità	Dimensione consigliata: 2.000-10.000 campioni Campioni minimi: 200 Dai priorità alla qualità rispetto alla quantità. Assicurati che gli esempi siano accurati e ben annotati. Il set di dati dovrebbe rispecchiare fedelmente i casi d'uso in produzione.
Diversità	Includi diversi esempi che eseguono le seguenti operazioni: Copre l'intera gamma di input previsti Rappresenta diversi livelli di difficoltà Includi casi limite e varianti Evita l'eccessivo adattamento a modelli ristretti
Formattazione dell'output	Specificate chiaramente il formato di output desiderato nelle risposte dell'assistente. Gli esempi includono strutture JSON, tabelle, formato CSV o formati personalizzati specifici dell'applicazione.
Conversazioni a più turni	La perdita viene calcolata solo nei turni degli assistenti, non nei turni degli utenti. Ogni risposta dell'assistente deve essere formattata correttamente. Mantieni la coerenza tra i turni di conversazione.
Lista di controllo della qualità	Dimensioni sufficienti del set di dati (2.000-10.000 campioni) Diversi esempi che coprono tutti i casi d'uso Formattazione di output chiara e coerente Etichette e annotazioni accurate Rappresentante degli scenari di produzione Liberi da contraddizioni o ambiguità

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Prepara i dati per perfezionare i tuoi modelli

Iperparametri del modello personalizzato