Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
SFT en Nova 2.0
Amazon Nova Lite 2.0 ofrece capacidades mejoradas para realizar ajustes supervisados, como el modo de razonamiento avanzado, una mejor comprensión multimodal y un manejo ampliado del contexto. La tecnología SFT de Nova 2.0 le permite adaptar estas potentes capacidades a sus casos de uso específicos y, al mismo tiempo, mantener el rendimiento superior del modelo en tareas complejas.
Las principales características de SFT en Nova 2.0 incluyen:
-
Compatibilidad con el modo de razonamiento: entrene los modelos para generar pistas de razonamiento explícitas antes de las respuestas finales a fin de mejorar las capacidades analíticas.
-
Capacitación multimodal avanzada: perfeccione la comprensión de documentos (PDF), la comprensión mediante vídeo y las tareas basadas en imágenes con mayor precisión.
-
Capacidades de llamada de herramientas: entrene a los modelos para que utilicen de forma eficaz herramientas externas y funciones en flujos de trabajo complejos.
-
Soporte contextual ampliado: aproveche las ventanas contextuales más largas con mayor estabilidad y precisión para aplicaciones con un uso intensivo de documentos.
Temas
Selección del modo de razonamiento (solo en Nova 2.0)
Amazon Nova 2.0 admite el modo de razonamiento para mejorar las capacidades analíticas:
-
Modo de razonamiento (activado):
-
Establecido
reasoning_enabled: trueen la configuración de entrenamiento -
El modelo se entrena para generar trazas de razonamiento antes de las respuestas finales
-
Mejora el rendimiento en tareas de razonamiento complejas
-
-
Modo sin razonamiento (desactivado):
-
Defina
reasoning_enabled: falseu omita el parámetro (predeterminado) -
SFT estándar sin razonamiento explícito
-
Adecuado para tareas que no se benefician del razonamiento step-by-step
-
nota
-
Cuando el razonamiento está habilitado, funciona con un alto esfuerzo de razonamiento. No existe una opción de razonamiento bajo para la SFT.
-
El contenido de razonamiento multimodal no es compatible con la SFT. El modo de razonamiento se aplica a las entradas de solo texto.
Se permite entrenar a Amazon Nova en un conjunto de datos irracional conreasoning_enabled:
true. Sin embargo, hacerlo puede provocar que el modelo pierda sus capacidades de razonamiento, ya que Amazon Nova aprende principalmente a generar las respuestas presentadas en los datos sin aplicar el razonamiento.
Si entrenas a Amazon Nova en un conjunto de datos que no razona, pero aun así quieres usar el razonamiento durante la inferencia:
-
Desactiva el razonamiento durante el entrenamiento ()
reasoning_enabled: false -
Habilite el razonamiento más adelante durante la inferencia
Si bien este enfoque permite razonar en el momento de la inferencia, no garantiza un mejor rendimiento en comparación con la inferencia sin razonamiento.
Práctica recomendada: habilite el razonamiento tanto para el entrenamiento como para la inferencia cuando utilice conjuntos de datos de razonamiento y desactívelo para ambos cuando utilice conjuntos de datos que no razonan.
Formato de datos de llamadas a herramientas
SFT admite modelos de entrenamiento para usar herramientas (llamadas a funciones). A continuación se muestra un ejemplo de formato de entrada para la llamada a herramientas:
Ejemplo de entrada:
{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are an expert in composing function calls." } ], "toolConfig": { "tools": [ { "toolSpec": { "name": "getItemCost", "description": "Retrieve the cost of an item from the catalog", "inputSchema": { "json": { "type": "object", "properties": { "item_name": { "type": "string", "description": "The name of the item to retrieve cost for" }, "item_id": { "type": "string", "description": "The ASIN of item to retrieve cost for" } }, "required": [ "item_id" ] } } } }, { "toolSpec": { "name": "getItemAvailability", "description": "Retrieve whether an item is available in a given location", "inputSchema": { "json": { "type": "object", "properties": { "zipcode": { "type": "string", "description": "The zipcode of the location to check in" }, "quantity": { "type": "integer", "description": "The number of items to check availability for" }, "item_id": { "type": "string", "description": "The ASIN of item to check availability for" } }, "required": [ "item_id", "zipcode" ] } } } } ] }, "messages": [ { "role": "user", "content": [ { "text": "I need to check whether there are twenty pieces of the following item available. Here is the item ASIN on Amazon: id-123. Please check for the zipcode 94086" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "The user wants to check how many pieces of the item with ASIN id-123 are available in the zipcode 94086" } } }, { "toolUse": { "toolUseId": "getItemAvailability_0", "name": "getItemAvailability", "input": { "zipcode": "94086", "quantity": 20, "item_id": "id-123" } } } ] }, { "role": "user", "content": [ { "toolResult": { "toolUseId": "getItemAvailability_0", "content": [ { "text": "[{\"name\": \"getItemAvailability\", \"results\": {\"availability\": true}}]" } ] } } ] }, { "role": "assistant", "content": [ { "text": "Yes, there are twenty pieces of item id-123 available at 94086. Would you like to place an order or know the total cost?" } ] } ] }
Consideraciones importantes sobre los datos de llamadas a herramientas:
-
ToolUse debe aparecer únicamente en los turnos de los asistentes
-
ToolResult debe aparecer únicamente en los turnos de los usuarios
-
ToolResult debe ser solo texto o JSON; actualmente no se admiten otras modalidades para los modelos de Amazon Nova
-
El InputSchema del ToolSpec debe ser un objeto de esquema JSON válido
-
Cada uno ToolResult debe hacer referencia a un asistente válido toolUseId de uno anterior ToolUse, y cada uno debe toolUseId usarse exactamente una vez por conversación
Documento que comprenda el formato de datos
SFT apoya los modelos de formación sobre tareas de comprensión de documentos. A continuación se muestra un ejemplo de formato de entrada:
Ejemplo de entrada
{ "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [ { "text": "What are the ways in which a customer can experience issues during checkout on Amazon?" }, { "document": { "format": "pdf", "source": { "s3Location": { "uri": "s3://my-bucket-name/path/to/documents/customer_service_debugging.pdf", "bucketOwner": "123456789012" } } } } ] }, { "role": "assistant", "content": [ { "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?" } ], "reasoning_content": [ { "text": "I need to find the relevant section in the document to answer the question.", "type": "text" } ] } ] }
Consideraciones importantes para la comprensión de los documentos:
-
Solo se admiten archivos PDF
-
El tamaño máximo del documento es de 10 MB
-
Una muestra puede contener documentos y texto, pero no puede mezclar documentos con otras modalidades (como imágenes o vídeo)
Comprensión de vídeo para SFT
SFT admite modelos de ajuste fino para tareas de comprensión de vídeo. A continuación se muestra un ejemplo de formato de entrada:
Ejemplo de entrada
{ "schemaVersion": "bedrock-conversation-2024", "messages": [ { "role": "user", "content": [ { "text": "What are the ways in which a customer can experience issues during checkout on Amazon?" }, { "video": { "format": "mp4", "source": { "s3Location": { "uri": "s3://my-bucket-name/path/to/videos/customer_service_debugging.mp4", "bucketOwner": "123456789012" } } } } ] }, { "role": "assistant", "content": [ { "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?" } ], "reasoning_content": [ { "text": "I need to find the relevant section in the video to answer the question.", "type": "text" } ] } ] }
Consideraciones importantes para la comprensión del vídeo:
-
Los vídeos pueden ocupar un máximo de 50 MB
-
Los vídeos pueden durar hasta 15 minutos
-
Solo se permite un vídeo por muestra; no se admiten varios vídeos en la misma muestra
-
Una muestra puede contener vídeo y texto, pero no puede mezclar vídeo con otras modalidades (como imágenes o documentos)
Instrucciones de carga de datos
Cargue conjuntos de datos de entrenamiento y validación en un bucket de S3. Especifique estas ubicaciones en el run bloque de la receta:
## Run config run: ... data_s3_path: "s3://<bucket-name>/<training-directory>/<training-file>.jsonl"
Nota: Sustituya <bucket-name> <training-directory><validation-directory>,<training-file>, y por <validation-file> las rutas S3 reales.
Nota: Los conjuntos de datos de validación no son compatibles actualmente con SFT con Amazon Nova 2.0. Si se proporciona un conjunto de datos de validación, se ignorará.
Creación de un trabajo de ajuste
Defina el modelo base mediante los model_name_or_path campos model_type y del run bloque:
## Run config run: ... model_type: amazon.nova-2-lite-v1:0:256k model_name_or_path: nova-lite-2/prod ...
Guía de hiperparámetros
Utilice los siguientes hiperparámetros recomendados según el enfoque de entrenamiento:
Entrenamiento de rango completo
-
Épocas: 1
-
Tasa de aprendizaje (lr): 1e-5
-
Tasa mínima de aprendizaje (min_lr): 1e-6
LoRa (adaptación de rango bajo)
-
Épocas: 2
-
Tasa de aprendizaje (lr): 5e-5
-
Tasa mínima de aprendizaje (min_lr): 1e-6
Nota: Ajuste estos valores en función del tamaño del conjunto de datos y del rendimiento de la validación. Supervisa las métricas de entrenamiento para evitar el sobreajuste.