Selección del modo de razonamiento (solo en Nova 2.0)Formato de datos de llamadas a herramientas Documento que comprenda el formato de datos Comprensión de vídeo para SFT Instrucciones de carga de datos Creación de un trabajo de ajuste Guía de hiperparámetros

SFT en Nova 2.0

Amazon Nova Lite 2.0 ofrece capacidades mejoradas para realizar ajustes supervisados, como el modo de razonamiento avanzado, una mejor comprensión multimodal y un manejo ampliado del contexto. La tecnología SFT de Nova 2.0 le permite adaptar estas potentes capacidades a sus casos de uso específicos y, al mismo tiempo, mantener el rendimiento superior del modelo en tareas complejas.

Las principales características de SFT en Nova 2.0 incluyen:

Compatibilidad con el modo de razonamiento: entrene los modelos para generar pistas de razonamiento explícitas antes de las respuestas finales a fin de mejorar las capacidades analíticas.
Capacitación multimodal avanzada: perfeccione la comprensión de documentos (PDF), la comprensión mediante vídeo y las tareas basadas en imágenes con mayor precisión.
Capacidades de llamada de herramientas: entrene a los modelos para que utilicen de forma eficaz herramientas externas y funciones en flujos de trabajo complejos.
Soporte contextual ampliado: aproveche las ventanas contextuales más largas con mayor estabilidad y precisión para aplicaciones con un uso intensivo de documentos.

Temas

Selección del modo de razonamiento (solo en Nova 2.0)
Formato de datos de llamadas a herramientas
Documento que comprenda el formato de datos
Comprensión de vídeo para SFT
Instrucciones de carga de datos
Creación de un trabajo de ajuste
Guía de hiperparámetros

Selección del modo de razonamiento (solo en Nova 2.0)

Amazon Nova 2.0 admite el modo de razonamiento para mejorar las capacidades analíticas:

Modo de razonamiento (activado):
- Establecido reasoning_enabled: true en la configuración de entrenamiento
- El modelo se entrena para generar trazas de razonamiento antes de las respuestas finales
- Mejora el rendimiento en tareas de razonamiento complejas
Modo sin razonamiento (desactivado):
- Defina reasoning_enabled: false u omita el parámetro (predeterminado)
- SFT estándar sin razonamiento explícito
- Adecuado para tareas que no se benefician del razonamiento step-by-step

nota

Cuando el razonamiento está habilitado, funciona con un alto esfuerzo de razonamiento. No existe una opción de razonamiento bajo para la SFT.
El contenido de razonamiento multimodal no es compatible con la SFT. El modo de razonamiento se aplica a las entradas de solo texto.

Se permite entrenar a Amazon Nova en un conjunto de datos irracional conreasoning_enabled: true. Sin embargo, hacerlo puede provocar que el modelo pierda sus capacidades de razonamiento, ya que Amazon Nova aprende principalmente a generar las respuestas presentadas en los datos sin aplicar el razonamiento.

Si entrenas a Amazon Nova en un conjunto de datos que no razona, pero aun así quieres usar el razonamiento durante la inferencia:

Desactiva el razonamiento durante el entrenamiento () reasoning_enabled: false
Habilite el razonamiento más adelante durante la inferencia

Si bien este enfoque permite razonar en el momento de la inferencia, no garantiza un mejor rendimiento en comparación con la inferencia sin razonamiento.

Práctica recomendada: habilite el razonamiento tanto para el entrenamiento como para la inferencia cuando utilice conjuntos de datos de razonamiento y desactívelo para ambos cuando utilice conjuntos de datos que no razonan.

Formato de datos de llamadas a herramientas

SFT admite modelos de entrenamiento para usar herramientas (llamadas a funciones). A continuación se muestra un ejemplo de formato de entrada para la llamada a herramientas:

Ejemplo de entrada:


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are an expert in composing function calls."
    }
  ],
  "toolConfig": {
    "tools": [
      {
        "toolSpec": {
          "name": "getItemCost",
          "description": "Retrieve the cost of an item from the catalog",
          "inputSchema": {
            "json": {
              "type": "object",
              "properties": {
                "item_name": {
                  "type": "string",
                  "description": "The name of the item to retrieve cost for"
                },
                "item_id": {
                  "type": "string",
                  "description": "The ASIN of item to retrieve cost for"
                }
              },
              "required": [
                "item_id"
              ]
            }
          }
        }
      },
      {
        "toolSpec": {
          "name": "getItemAvailability",
          "description": "Retrieve whether an item is available in a given location",
          "inputSchema": {
            "json": {
              "type": "object",
              "properties": {
                "zipcode": {
                  "type": "string",
                  "description": "The zipcode of the location to check in"
                },
                "quantity": {
                  "type": "integer",
                  "description": "The number of items to check availability for"
                },
                "item_id": {
                  "type": "string",
                  "description": "The ASIN of item to check availability for"
                }
              },
              "required": [
                "item_id", "zipcode"
              ]
            }
          }
        }
      }
    ]
  },
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "I need to check whether there are twenty pieces of the following item available. Here is the item ASIN on Amazon: id-123. Please check for the zipcode 94086"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "The user wants to check how many pieces of the item with ASIN id-123 are available in the zipcode 94086"
            }
          }
        },
        {
          "toolUse": {
            "toolUseId": "getItemAvailability_0",
            "name": "getItemAvailability",
            "input": {
              "zipcode": "94086",
              "quantity": 20,
              "item_id": "id-123"
            }
          }
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "toolResult": {
            "toolUseId": "getItemAvailability_0",
            "content": [
              {
                "text": "[{\"name\": \"getItemAvailability\", \"results\": {\"availability\": true}}]"
              }
            ]
          }
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "Yes, there are twenty pieces of item id-123 available at 94086. Would you like to place an order or know the total cost?"
        }
      ]
    }
  ]
}

Consideraciones importantes sobre los datos de llamadas a herramientas:

ToolUse debe aparecer únicamente en los turnos de los asistentes
ToolResult debe aparecer únicamente en los turnos de los usuarios
ToolResult debe ser solo texto o JSON; actualmente no se admiten otras modalidades para los modelos de Amazon Nova
El InputSchema del ToolSpec debe ser un objeto de esquema JSON válido
Cada uno ToolResult debe hacer referencia a un asistente válido toolUseId de uno anterior ToolUse, y cada uno debe toolUseId usarse exactamente una vez por conversación

Documento que comprenda el formato de datos

SFT apoya los modelos de formación sobre tareas de comprensión de documentos. A continuación se muestra un ejemplo de formato de entrada:

Ejemplo de entrada


{
  "schemaVersion": "bedrock-conversation-2024",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What are the ways in which a customer can experience issues during checkout on Amazon?"
        },
        {
          "document": {
            "format": "pdf",
            "source": {
              "s3Location": {
                "uri": "s3://my-bucket-name/path/to/documents/customer_service_debugging.pdf",
                "bucketOwner": "123456789012"
              }
            }
          }
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?"
        }
      ],
      "reasoning_content": [
        {
          "text": "I need to find the relevant section in the document to answer the question.",
          "type": "text"
        }
      ]
    }
  ]
}

Consideraciones importantes para la comprensión de los documentos:

Solo se admiten archivos PDF
El tamaño máximo del documento es de 10 MB
Una muestra puede contener documentos y texto, pero no puede mezclar documentos con otras modalidades (como imágenes o vídeo)

Comprensión de vídeo para SFT

SFT admite modelos de ajuste fino para tareas de comprensión de vídeo. A continuación se muestra un ejemplo de formato de entrada:

Ejemplo de entrada


{
  "schemaVersion": "bedrock-conversation-2024",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What are the ways in which a customer can experience issues during checkout on Amazon?"
        },
        {
          "video": {
            "format": "mp4",
            "source": {
              "s3Location": {
                "uri": "s3://my-bucket-name/path/to/videos/customer_service_debugging.mp4",
                "bucketOwner": "123456789012"
              }
            }
          }
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "Customers can experience issues with 1. Data entry, 2. Payment methods, 3. Connectivity while placing the order. Which one would you like to dive into?"
        }
      ],
      "reasoning_content": [
        {
          "text": "I need to find the relevant section in the video to answer the question.",
          "type": "text"
        }
      ]
    }
  ]
}

Consideraciones importantes para la comprensión del vídeo:

Los vídeos pueden ocupar un máximo de 50 MB
Los vídeos pueden durar hasta 15 minutos
Solo se permite un vídeo por muestra; no se admiten varios vídeos en la misma muestra
Una muestra puede contener vídeo y texto, pero no puede mezclar vídeo con otras modalidades (como imágenes o documentos)

Instrucciones de carga de datos

Cargue conjuntos de datos de entrenamiento y validación en un bucket de S3. Especifique estas ubicaciones en el run bloque de la receta:


## Run config
run:
  ...
  data_s3_path: "s3://<bucket-name>/<training-directory>/<training-file>.jsonl"

Nota: Sustituya <bucket-name> <training-directory><validation-directory>,<training-file>, y por <validation-file> las rutas S3 reales.

Nota: Los conjuntos de datos de validación no son compatibles actualmente con SFT con Amazon Nova 2.0. Si se proporciona un conjunto de datos de validación, se ignorará.

Creación de un trabajo de ajuste

Defina el modelo base mediante los model_name_or_path campos model_type y del run bloque:


## Run config
run:
  ...
  model_type: amazon.nova-2-lite-v1:0:256k
  model_name_or_path: nova-lite-2/prod
  ...

Guía de hiperparámetros

Utilice los siguientes hiperparámetros recomendados según el enfoque de entrenamiento:

Entrenamiento de rango completo

Épocas: 1
Tasa de aprendizaje (lr): 1e-5
Tasa mínima de aprendizaje (min_lr): 1e-6

LoRa (adaptación de rango bajo)

Épocas: 2
Tasa de aprendizaje (lr): 5e-5
Tasa mínima de aprendizaje (min_lr): 1e-6

Nota: Ajuste estos valores en función del tamaño del conjunto de datos y del rendimiento de la validación. Supervisa las métricas de entrenamiento para evitar el sobreajuste.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

SFT en Nova 1.0

RFT activado SageMaker HyperPod