Solicitud y respuesta - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solicitud y respuesta

El cuerpo de la solicitud se pasa en el body campo de una solicitud a InvokeModelo InvokeModelWithResponseStream. El tamaño máximo de la carga útil que puede enviar en una solicitud es de 20 MB.

Para obtener más información, consulta https://docs.anthropic.com/claude/reference/messages_post.

aviso

Claude Sonnet 4.5 y Claude Haiku 4.5 solo admiten la especificación de uno de los parámetros temperature o top_p, pero no puede gestionar ambos. Esto no se aplica a los modelos anteriores.

Request

Anthropic Claude tiene los siguientes parámetros de inferencia para realizar una llamada de inferencia de Messages.

{ "anthropic_version": "bedrock-2023-05-31", "anthropic_beta": ["computer-use-2024-10-22"] "max_tokens": int, "system": string, "messages": [ { "role": string, "content": [ { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } }, { "type": "text", "text": "content text" } ] } ], "temperature": float, "top_p": float, "top_k": int, "tools": [ { "type": "custom", "name": string, "description": string, "input_schema": json }, { "type": "computer_20241022", "name": "computer", "display_height_px": int, "display_width_px": int, "display_number": 0 int }, { "type": "bash_20241022", "name": "bash" }, { "type": "text_editor_20241022", "name": "str_replace_editor" } ], "tool_choice": { "type" : string, "name" : string, }, "stop_sequences": [string] }

Los siguientes parámetros son obligatorios.

  • anthropic_version: (obligatorio) es la versión de Anthropic. El valor debe ser bedrock-2023-05-31.

  • max_tokens: (obligatorio) número máximo de tokens a generar antes de realizar paradas.

    Tenga en cuenta que es posible que los modelos Anthropic Claude dejen de generar tokens antes de alcanzar el valor de max_tokens. Los distintos modelos de Anthropic Claude tienen valores máximos diferentes para este parámetro. Para obtener más información, consulte Tabla comparativa de modelos.

  • messages: (obligatorio) son los mensajes de entrada.

    • role: es el rol del turno de conversación. Los valores válidos son user y assistant.

      Mínimo Máximo

      0

      2000

    • content (obligatorio): el contenido del turno de conversación como una matriz de objetos. Cada objeto contiene un campo type, en el que puede especificar uno de los siguientes valores:

      • text: si especifica este tipo, debe incluir un campo texto y especificar la petición de texto como su valor. Si otro objeto de la matriz es una imagen, esta petición de texto se aplica a las imágenes.

      • image: si especifica este tipo, debe incluir un campo origen que se asigne a un objeto con los siguientes campos:

        • type: (obligatorio) es el tipo de codificación de la imagen. Puede especificar base64.

        • media_type: (obligatorio) es el tipo de imagen. Puede especificar los siguientes formatos de imagen.

          • image/jpeg

          • image/png

          • image/webp

          • image/gif

        • data: (obligatorio) son los bytes de la imagen codificados en base64. El tamaño máximo es 3,75 MB. La altura y el ancho máximos de una imagen son 8000 píxeles.

Los siguientes son parámetros opcionales.

  • system: (opcional) es la petición del sistema para la solicitud.

    Una petición del sistema le permite proporcionar contexto e instrucciones a Anthropic Claude, por ejemplo, especificar un objetivo o rol en particular. Para obtener más información, consulte Prompt de sistema en la documentación de Anthropic.

    nota

    Puede utilizar las peticiones del sistema con Anthropic Claude versión 2.1 o superior.

  • anthropic_beta (opcional): el parámetro anthropic beta es una lista de cadenas de encabezados beta que se utilizan para indicar la suscripción a un conjunto concreto de características beta.

    nota

    La variante de 1 millón de tokens con una longitud de contexto de Claude Sonnet 4 está disponible en determinadas AWS regiones como un «servicio beta», tal como se define en las condiciones del servicio. AWS Está sujeto a su acuerdo con AWS él, a las condiciones del AWS servicio y al modelo de EULA aplicable. Consulte la página Precios de Amazon Bedrock para obtener más información sobre los precios para solicitudes de contexto más largas. Se aplican cuotas de servicio independientes (para obtener más información, consulte Service Quotas enConsola de administración de AWS).

    Entre los encabezados beta disponibles se incluyen los siguientes:

    Característica beta

    Encabezado Beta

    Notas

    Uso del equipo

    computer-use-2025-01-24

    Compatible con Claude 3.7 Sonnet.

    Uso de herramienta

    token-efficient-tools-2025-02-19

    Compatible con Claude 3.7 Sonnet y Claude 4+.

    Pensamiento intercalado

    Interleaved-thinking-2025-05-14

    Compatible con modelos Claude 4+.

    Permite hasta 128 000 tokens de salida

    output-128k-2025-02-19

    Compatible con Claude 3.7 Sonnet.

    Modo de desarrollador para pensamiento simple en modelos Claude 4+

    dev-full-thinking-2025-05-14

    Compatible con modelos Claude 4+ únicamente. Póngase en contacto con el equipo de la cuenta para acceder a esta versión beta.

    1 millón de tokens

    context-1m-2025-08-07

    Compatible con Claude Sonnet 4

    Administración del contexto

    context-management-2025-06-27

    Compatible con Claude Sonnet 4.5 y Claude Haiku 4.5

    Esfuerzo

    effort-2025-11-24

    Compatible con Claude Opus 4.5

    Herramienta de búsqueda

    tool-search-tool-2025-10-19

    Compatible con Claude Opus 4.5

    Ejemplos de uso de herramientas

    tool-examples-2025-10-29

    Compatible con Claude Opus 4.5

  • stop_sequence: (opcional) secuencias de texto personalizadas que hacen que el modelo deje de generarse. Los modelos Anthropic Claude normalmente se detienen cuando han completado su turno de forma natural; en este caso, el valor del campo de respuesta stop_reason es end_turn. Si desea que el modelo deje de generar cuando encuentre cadenas de texto personalizadas, puede usar el parámetro stop_sequences. Si el modelo encuentra una de las cadenas de texto personalizadas, el valor del campo de respuesta stop_reason es stop_sequence y el valor de stop_sequence contiene la secuencia de paradas correspondiente.

    El número máximo de entradas es 8191.

  • temperature: (opcional) la cantidad de asignación al azar que se inyecta en la respuesta.

    Predeterminado Mínimo Máximo

    1

    0

    1

  • top_p: (opcional) utilice el muestreo de núcleos.

    En el muestreo de núcleos, Anthropic Claude calcula la distribución acumulada entre todas las opciones de cada token subsiguiente en orden de probabilidad decreciente y la corta cuando alcanza una probabilidad determinada especificada por top_p. Al ajustar los parámetros de muestreo, modifique temperature o top_p. No modifique ambos al mismo tiempo.

    Predeterminado Mínimo Máximo

    0.999

    0

    1

  • top_k: (opcional) solo una muestra de las opciones K superior para cada token subsiguiente.

    Use top_k para eliminar las respuestas de baja probabilidad de cola larga.

    Predeterminado Mínimo Máximo

    Está deshabilitado de forma predeterminada.

    0

    500

  • tools: /(opcional) definiciones de las herramientas que puede utilizar el modelo.

    nota

    Requiere un modelo Anthropic Claude 3.

    Si incluye tools en su solicitud, es posible que el modelo devuelva bloques de contenido de tool_use que representen el uso de esas herramientas por parte del modelo. A continuación, puede ejecutar esas herramientas con la entrada de herramientas generada por el modelo y, si lo desea, devolver los resultados al modelo mediante bloques de contenido tool_result.

    Puede transferir los siguientes tipos de herramientas:

    Personalizada

    Definición de una herramienta personalizada.

    • type: (opcional) es el tipo de herramienta. Si está definido, utilice el valor custom.

    • name: es el nombre de la herramienta.

    • description: (opcional, pero muy recomendable) es la descripción de la herramienta.

    • input_schema: es el esquema JSON de la herramienta.

    Computadora

    Definición de la herramienta informática que se utiliza con la API de Computer Use.

    • type: el valor debe ser computer_20241022.

    • name: el valor debe ser computer.

    • (Obligatorio) display_height_px: es la altura de la pantalla que controla el modelo en píxeles.

      Predeterminado Mínimo Máximo

      Ninguno

      1

      Sin máximo

    • (Obligatorio) display_width_px: es el ancho de la pantalla que controla el modelo en píxeles.

      Predeterminado Mínimo Máximo

      Ninguno

      1

      Sin máximo

    • (Opcional) display_number: es el número de pantalla que se va a controlar (solo relevante para los entornos X11). Si se especifica, se proporcionará a la herramienta un número de pantalla en la definición de la herramienta.

      Predeterminado Mínimo Máximo

      Ninguno

      0

      N

    bash

    Definición de la herramienta Bash que se utiliza con la API de Computer Use.

    • type: (opcional) el valor debe ser bash_20241022.

    • name: el valor debe ser bash. La herramienta.

    editor de texto

    Definición de la herramienta de editor de texto que se utiliza con la API de Computer Use.

    • type: (opcional) el valor debe ser text_editor_20241022.

    • name: el valor debe ser str_replace_editor. La herramienta.

  • tool_choice: (opcional) especifica cómo debe utilizar el modelo las herramientas proporcionadas. El modelo puede usar una herramienta específica, cualquier herramienta disponible o decidir por sí mismo.

    nota

    Requiere un modelo Anthropic Claude 3.

    • type: es el tipo de herramienta elegido. Los valores posibles son any (usar cualquier herramienta disponible), auto (el modelo decide) y tool (usar la herramienta especificada).

    • name: (opcional) es el nombre de la herramienta que se va a utilizar. Obligatorio si lo especifica tool en el campo type.

Response

El modelo Anthropic Claude devuelve los siguientes campos para realizar una llamada de inferencia a Messages.

{ "id": string, "model": string, "type" : "message", "role" : "assistant", "content": [ { "type": string, "text": string, "image" :json, "id": string, "name":string, "input": json } ], "stop_reason": string, "stop_sequence": string, "usage": { "input_tokens": integer, "output_tokens": integer } }

Ejemplos de respuestas con nuevos valores de stop_reason:

// Example with refusal { "stop_reason": "refusal", "content": [ { "type": "text", "text": "I can't help with that request." } ] } // Example with tool_use { "stop_reason": "tool_use", "content": [ { "type": "tool_use", "id": "toolu_123", "name": "calculator", "input": {"expression": "2+2"} } ] } // Example with model_context_window_exceeded (Claude Sonnet 4.5) { "stop_reason": "model_context_window_exceeded", "content": [ { "type": "text", "text": "The response was truncated due to context window limits..." } ] }
  • id: es el identificador único de la respuesta. El formato y la longitud del ID pueden cambiar con el tiempo.

  • model: el ID del modelo Anthropic Claude que ha realizado la solicitud.

  • stop_reason: motivo por el que Anthropic Claude ha dejado de generar texto.

    • end_turn: el modelo ha alcanzado un punto de parada natural.

    • max_tokens: el texto generado ha superado el valor del campo de entrada max_tokens o ha superado el número máximo de tokens que admite el modelo.

    • stop_sequence: el modelo ha generado una de las secuencias de parada que ha especificado en el campo de entrada stop_sequences.

    • refusal: Claude se niega a generar una respuesta por motivos de seguridad

    • tool_use: Claude llama a una herramienta y espera que la ejecute

    • model_context_window_exceeded: el modelo detuvo la generación debido a que alcanzó el límite de la ventana de contexto.

      • Nuevo con Claude Sonnet 4.5

  • stop_sequence: es la secuencia de paradas que ha puesto fin a la generación.

  • type: es el tipo de respuesta. Este valor siempre es message.

  • role: es el rol conversacional del mensaje generado. Este valor siempre es assistant.

  • content: es el contenido generado por el modelo. Se devuelve en forma de matriz. Hay tres tipos de contenido: text, tool_use e image.

    • text: es una respuesta de texto.

      • type: el tipo de contenido. El valor es text.

      • text: si el valor de type es texto, contiene el texto del contenido.

    • tool_use: solicitud del modelo para usar una herramienta.

      • type: el tipo de contenido. El valor es tool_use.

      • id: es el ID de la herramienta que el modelo quiere usar.

      • name: contiene el nombre de la herramienta solicitada.

      • input: parámetros de entrada que se van a transferir a la herramienta.

    • Image: solicitud del modelo para usar una herramienta.

      • type: el tipo de contenido. El valor es image.

      • source: contiene la imagen. Para obtener más información, consulte Peticiones multimodales.

  • usage: contenedor del número de tokens proporcionados en la solicitud y el número de tokens que el modelo ha generado en la respuesta.

    • input_tokens: número de tokens de entrada en la solicitud.

    • output_tokens: número de tokens que el modelo ha generado en la respuesta.

    • stop_sequence: el modelo ha generado una de las secuencias de parada que ha especificado en el campo de entrada stop_sequences.

Parámetro de esfuerzo (beta)

El effort parámetro es una alternativa a pensar en presupuestos simbólicos para Claude Opus 4,5. Este parámetro indica la generosidad Claude con la que debería gastar los tokens para obtener el mejor resultado, ajustando el uso de los tokens en función del pensamiento, las llamadas a las herramientas y la comunicación con los usuarios. Se puede usar con o sin el modo de pensamiento extendido.

El parámetro de esfuerzo se puede configurar en:

  • high(predeterminado): Claude gasta tantos tokens como sea necesario para obtener el mejor resultado

  • medium— Uso equilibrado de los tokens

  • low— Uso conservador de los tokens

Para utilizar esta función, debe pasar el encabezado betaeffort-2025-11-24.

Ejemplo de solicitud:

{ "anthropic_version": "bedrock-2023-05-31", "anthropic_beta": [ "effort-2025-11-24" ], "max_tokens": 4096, "output_config": { "effort": "medium" }, "messages": [{ "role": "user", "content": "Analyze this complex dataset and provide insights" }] }