Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
SFT su Nova 2.0
Amazon Nova Lite 2.0 offre funzionalità avanzate per la regolazione fine supervisionata, tra cui la modalità di ragionamento avanzato, una migliore comprensione multimodale e una gestione estesa del contesto. SFT su Nova 2.0 ti consente di adattare queste potenti funzionalità ai tuoi casi d'uso specifici, mantenendo al contempo le prestazioni superiori del modello in attività complesse.
Le caratteristiche principali di SFT su Nova 2.0 includono:
-
Supporto in modalità di ragionamento: addestra i modelli per generare tracce di ragionamento esplicite prima delle risposte finali per funzionalità analitiche avanzate.
-
Formazione multimodale avanzata: perfeziona la comprensione dei documenti (PDF), la comprensione dei video e le attività basate su immagini con una maggiore precisione.
-
Funzionalità di richiamo degli strumenti: addestrate i modelli a utilizzare efficacemente strumenti esterni e richiamare funzioni per flussi di lavoro complessi.
-
Supporto contestuale esteso: sfrutta finestre contestuali più lunghe con maggiore stabilità e precisione per applicazioni che richiedono un uso intensivo di documenti.
Argomenti
Selezione della modalità di ragionamento (solo Nova 2.0)
Amazon Nova 2.0 supporta la modalità di ragionamento per funzionalità analitiche avanzate:
-
Modalità di ragionamento (abilitata):
-
Impostata
reasoning_enabled: truenella configurazione di allenamento -
Modella i treni per generare tracce di ragionamento prima delle risposte finali
-
Migliora le prestazioni in attività di ragionamento complesse
-
-
Modalità non ragionata (disabilitata):
-
Imposta
reasoning_enabled: falseo ometti il parametro (impostazione predefinita) -
SFT standard senza ragionamento esplicito
-
Adatto per attività che non traggono vantaggio dal ragionamento step-by-step
-
Nota
-
Quando il ragionamento è abilitato, funziona con un elevato sforzo di ragionamento. Non esiste un'opzione di ragionamento basso per SFT.
-
Il contenuto di ragionamento multimodale non è supportato per SFT. La modalità di ragionamento si applica agli input di solo testo.
È consentito addestrare Amazon Nova su un set di dati non ragionevoli conreasoning_enabled:
true. Tuttavia, così facendo il modello potrebbe perdere le sue capacità di ragionamento, poiché Amazon Nova impara principalmente a generare le risposte presentate nei dati senza applicare il ragionamento.
Se si esegue l'addestramento di Amazon Nova su un set di dati non ragionante ma si desidera comunque utilizzare il ragionamento durante l'inferenza:
-
Disattiva il ragionamento durante l'allenamento ()
reasoning_enabled: false -
Abilita il ragionamento in un secondo momento durante l'inferenza
Sebbene questo approccio consenta il ragionamento in fase di inferenza, non garantisce prestazioni migliori rispetto all'inferenza senza ragionamento.
Procedura ottimale: abilita il ragionamento sia per l'addestramento che per l'inferenza quando si utilizzano set di dati di ragionamento e disabilitalo per entrambi quando si utilizzano set di dati non di ragionamento.
Strumento che richiama il formato dei dati
SFT supporta modelli di addestramento all'uso degli strumenti (chiamata di funzioni). Di seguito è riportato un esempio di formato di input per la chiamata degli strumenti:
Esempio di input:
{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are an expert in composing function calls." } ], "toolConfig": { "tools": [ { "toolSpec": { "name": "getItemCost", "description": "Retrieve the cost of an item from the catalog", "inputSchema": { "json": { "type": "object", "properties": { "item_name": { "type": "string", "description": "The name of the item to retrieve cost for" }, "item_id": { "type": "string", "description": "The ASIN of item to retrieve cost for" } }, "required": [ "item_id" ] } } } }, { "toolSpec": { "name": "getItemAvailability", "description": "Retrieve whether an item is available in a given location", "inputSchema": { "json": { "type": "object", "properties": { "zipcode": { "type": "string", "description": "The zipcode of the location to check in" }, "quantity": { "type": "integer", "description": "The number of items to check availability for" }, "item_id": { "type": "string", "description": "The ASIN of item to check availability for" } }, "required": [ "item_id", "zipcode" ] } } } } ] }, "messages": [ { "role": "user", "content": [ { "text": "I need to check whether there are twenty pieces of the following item available. Here is the item ASIN on Amazon: id-123. Please check for the zipcode 94086" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "The user wants to check how many pieces of the item with ASIN id-123 are available in the zipcode 94086" } } }, { "toolUse": { "toolUseId": "getItemAvailability_0", "name": "getItemAvailability", "input": { "zipcode": "94086", "quantity": 20, "item_id": "id-123" } } } ] }, { "role": "user", "content": [ { "toolResult": { "toolUseId": "getItemAvailability_0", "content": [ { "text": "[{\"name\": \"getItemAvailability\", \"results\": {\"availability\": true}}]" } ] } } ] }, { "role": "assistant", "content": [ { "text": "Yes, there are twenty pieces of item id-123 available at 94086. Would you like to place an order or know the total cost?" } ] } ] }
Considerazioni importanti per i dati di chiamata degli strumenti:
-
ToolUse deve comparire solo nei turni degli assistenti
-
ToolResult deve apparire solo nei turni degli utenti
-
ToolResult deve essere solo testo o JSON; altre modalità non sono attualmente supportate per i modelli Amazon Nova
-
L'InputSchema all'interno di ToolSpec deve essere un oggetto JSON Schema valido
-
Ciascuno ToolResult deve fare riferimento a un assistente valido toolUseId di un precedente ToolUse, e ognuno deve essere usato esattamente una volta per conversazione toolUseId
Formato dei dati di comprensione del documento
SFT supporta modelli di formazione sulle attività di comprensione dei documenti. Di seguito è riportato un esempio di formato di input:
Esempio di input
{ "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [ { "text": "What are the ways in which a customer can experience issues during checkout on Amazon?" }, { "document": { "format": "pdf", "source": { "s3Location": { "uri": "s3://my-bucket-name/path/to/documents/customer_service_debugging.pdf", "bucketOwner": "123456789012" } } } } ] }, { "role": "assistant", "content": [ { "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?" } ], "reasoning_content": [ { "text": "I need to find the relevant section in the document to answer the question.", "type": "text" } ] } ] }
Considerazioni importanti per la comprensione dei documenti:
-
Sono supportati solo i file PDF
-
La dimensione massima del documento è di 10 MB
-
Un esempio può contenere documenti e testo, ma non può combinare documenti con altre modalità (come immagini o video)
Comprensione video per SFT
SFT supporta modelli di ottimizzazione per le attività di comprensione video. Di seguito è riportato un esempio di formato di input:
Esempio di input
{ "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [ { "text": "What are the ways in which a customer can experience issues during checkout on Amazon?" }, { "video": { "format": "mp4", "source": { "s3Location": { "uri": "s3://my-bucket-name/path/to/videos/customer_service_debugging.mp4", "bucketOwner": "123456789012" } } } } ] }, { "role": "assistant", "content": [ { "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?" } ], "reasoning_content": [ { "text": "I need to find the relevant section in the video to answer the question.", "type": "text" } ] } ] }
Considerazioni importanti per la comprensione dei video:
-
I video possono pesare al massimo 50 MB
-
I video possono avere una durata massima di 15 minuti
-
È consentito un solo video per campione; non sono supportati più video nello stesso campione
-
Un campione può contenere video e testo, ma non può combinare video con altre modalità (come immagini o documenti)
Istruzioni per il caricamento dei dati
Carica i set di dati di formazione e convalida in un bucket S3. Specificate queste posizioni nel blocco della ricetta: run
## Run config run: ... data_s3_path: "s3://<bucket-name>/<training-directory>/<training-file>.jsonl"
Nota: sostituisci <bucket-name><training-directory>, <validation-directory><training-file>, e <validation-file> con percorsi S3 effettivi.
Nota: i set di dati di convalida non sono attualmente supportati per SFT con Amazon Nova 2.0. Se viene fornito un set di dati di convalida, questo verrà ignorato.
Creazione di un Fine-Tuning Job
Definisci il modello base utilizzando i model_name_or_path campi model_type e nel blocco: run
## Run config run: ... model_type: amazon.nova-2-lite-v1:0:256k model_name_or_path: nova-lite-2/prod ...
Guida agli iperparametri
Utilizza i seguenti iperparametri consigliati in base all'approccio di allenamento:
Allenamento di livello completo
-
Epoche: 1
-
Tasso di apprendimento (lr): 1e-5
-
Tasso minimo di apprendimento (min_lr): 1e-6
LoRa (adattamento a basso rango)
-
Epoche: 2
-
Tasso di apprendimento (lr): 5e-5
-
Tasso minimo di apprendimento (min_lr): 1e-6
Nota: modifica questi valori in base alle dimensioni del set di dati e alle prestazioni di convalida. Monitora le metriche di allenamento per evitare un sovradimensionamento.