Solicitud y respuesta

El cuerpo de la solicitud se pasa en el body campo de una solicitud a InvokeModelo InvokeModelWithResponseStream.

nota

Se aplican restricciones a las siguientes operaciones: InvokeModelInvokeModelWithResponseStream,Converse, yConverseStream. Consulte las restricciones de la API para obtener más información.

aviso

Claude Sonnet 4.5y Claude Haiku 4.5 admiten la especificación del top_p parámetro temperature o, pero no de ambos. Esto no se aplica a los modelos anteriores.

Request

Anthropic Claude tiene los siguientes parámetros de inferencia para realizar una llamada de inferencia de Messages.


{
    "anthropic_version": "bedrock-2023-05-31", 
    "anthropic_beta": ["computer-use-2024-10-22"] 
    "max_tokens": int,
    "system": string | [{"type": "text", "text": string}],    
    "messages": [
        {
            "role": string,
            "content": [
                { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } },
                { "type": "text", "text": "content text" }
      ]
        }
    ],
    "temperature": float,
    "top_p": float,
    "top_k": int,
    "tools": [
        {
                "type": "custom",
                "name": string,
                "description": string,
                "input_schema": json
            
        },
        { 
            "type": "computer_20241022",  
            "name": "computer", 
            "display_height_px": int,
            "display_width_px": int,
            "display_number": 0 int
        },
        { 
            "type": "bash_20241022", 
            "name": "bash"
        },
        { 
            "type": "text_editor_20241022",
            "name": "str_replace_editor"
        }
        
    ],
    "tool_choice": {
        "type" :  string,
        "name" : string,
    },
    

 
    "stop_sequences": [string]
}

Los siguientes parámetros son obligatorios.

anthropic_version: (obligatorio) es la versión de Anthropic. El valor debe ser bedrock-2023-05-31.
max_tokens: (obligatorio) número máximo de tokens a generar antes de realizar paradas.

Tenga en cuenta que es posible que los modelos Anthropic Claude dejen de generar tokens antes de alcanzar el valor de max_tokens. Los distintos modelos de Anthropic Claude tienen valores máximos diferentes para este parámetro. Para obtener más información, consulte Tabla comparativa de modelos.

messages: (obligatorio) son los mensajes de entrada.

role: es el rol del turno de conversación. Los valores válidos son user y assistant.

Mínimo	Máximo
0	2000

content (obligatorio): el contenido del turno de conversación como una matriz de objetos. Cada objeto contiene un campo type, en el que puede especificar uno de los siguientes valores:
- text: si especifica este tipo, debe incluir un campo texto y especificar la petición de texto como su valor. Si otro objeto de la matriz es una imagen, esta petición de texto se aplica a las imágenes.
- image: si especifica este tipo, debe incluir un campo origen que se asigne a un objeto con los siguientes campos:
  - type: (obligatorio) es el tipo de codificación de la imagen. Puede especificar base64.
  - media_type: (obligatorio) es el tipo de imagen. Puede especificar los siguientes formatos de imagen.
    
    image/jpeg
    
    image/png
    
    image/webp
    
    image/gif
  - data: (obligatorio) son los bytes de la imagen codificados en base64. El tamaño máximo es 3,75 MB. La altura y el ancho máximos de una imagen son 8000 píxeles.

Los siguientes son parámetros opcionales.

system: (opcional) es la petición del sistema para la solicitud. Puede proporcionar el indicador del sistema como una cadena o como una matriz de bloques de contenido (por ejemplo,[{"type": "text", "text": "your prompt"}]).

Una petición del sistema le permite proporcionar contexto e instrucciones a Anthropic Claude, por ejemplo, especificar un objetivo o rol en particular. Para obtener más información, consulte Prompt de sistema en la documentación de Anthropic.

nota
Puede utilizar las peticiones del sistema con Anthropic Claude versión 2.1 o superior.

anthropic_beta (opcional): el parámetro anthropic beta es una lista de cadenas de encabezados beta que se utilizan para indicar la suscripción a un conjunto concreto de características beta.

nota

La variante de 1 millón de fichas con una longitud de contexto de Claude Sonnet 4 está disponible en determinadas AWS regiones como «servicio beta», tal como se define en las condiciones del AWS servicio. Está sujeto a su acuerdo con AWS él, a las condiciones del AWS servicio y al modelo de EULA aplicable. Consulte la página Precios de Amazon Bedrock para obtener más información sobre los precios para solicitudes de contexto más largas. En el caso de las solicitudes que superen los 200 000 tokens de entrada, la tasa de contexto largo se aplica a toda la solicitud, no solo a las que superen el umbral. Se aplican cuotas de servicio independientes (para obtener más información, consulte Service Quotas en Consola de administración de AWS).

Entre los encabezados beta disponibles se incluyen los siguientes:

Característica beta	Encabezado Beta	Notas
Uso del equipo	`computer-use-2025-01-24`	Compatible con Claude 3.7 Sonnet.
Uso de herramienta	`token-efficient-tools-2025-02-19`	Compatible con Claude 3.7 Sonnet y Claude 4+.
Pensamiento intercalado	`Interleaved-thinking-2025-05-14`	Compatible con modelos Claude 4+.
Permite hasta 128 000 tokens de salida	`output-128k-2025-02-19`	Compatible con Claude 3.7 Sonnet.
Modo de desarrollador para pensamiento simple en modelos Claude 4+	`dev-full-thinking-2025-05-14`	Compatible con modelos Claude 4+ únicamente. Póngase en contacto con el equipo de la cuenta para acceder a esta versión beta.
1 millón de tokens	`context-1m-2025-08-07`	Compatible con Claude Sonnet 4Claude Sonnet 4.6, yClaude Opus 4.6.
Administración del contexto	`context-management-2025-06-27`	Compatible con Claude Sonnet 4.5 y Claude Haiku 4.5
Esfuerzo	`effort-2025-11-24`	Compatible con Claude Opus 4.5
Herramienta de búsqueda	`tool-search-tool-2025-10-19`	Compatible con Claude Opus 4.5
Ejemplos de uso de herramientas	`tool-examples-2025-10-29`	Compatible con Claude Opus 4.5

stop_sequence: (opcional) secuencias de texto personalizadas que hacen que el modelo deje de generarse. Los modelos Anthropic Claude normalmente se detienen cuando han completado su turno de forma natural; en este caso, el valor del campo de respuesta stop_reason es end_turn. Si desea que el modelo deje de generar cuando encuentre cadenas de texto personalizadas, puede usar el parámetro stop_sequences. Si el modelo encuentra una de las cadenas de texto personalizadas, el valor del campo de respuesta stop_reason es stop_sequence y el valor de stop_sequence contiene la secuencia de paradas correspondiente.

El número máximo de entradas es 8191.

temperature: (opcional) la cantidad de asignación al azar que se inyecta en la respuesta.

Predeterminado	Mínimo	Máximo
1	0	1

top_p: (opcional) utilice el muestreo de núcleos.

En el muestreo de núcleos, Anthropic Claude calcula la distribución acumulada entre todas las opciones de cada token subsiguiente en orden de probabilidad decreciente y la corta cuando alcanza una probabilidad determinada especificada por top_p. Al ajustar los parámetros de muestreo, modifique temperature o top_p. No modifique ambos al mismo tiempo.

Predeterminado	Mínimo	Máximo
0.999	0	1

top_k: (opcional) solo una muestra de las opciones K superior para cada token subsiguiente.

Use top_k para eliminar las respuestas de baja probabilidad de cola larga.

Predeterminado	Mínimo	Máximo
Está deshabilitado de forma predeterminada.	0	500

tools: /(opcional) definiciones de las herramientas que puede utilizar el modelo.

nota

Requiere un modelo Anthropic Claude 3.

Si incluye tools en su solicitud, es posible que el modelo devuelva bloques de contenido de tool_use que representen el uso de esas herramientas por parte del modelo. A continuación, puede ejecutar esas herramientas con la entrada de herramientas generada por el modelo y, si lo desea, devolver los resultados al modelo mediante bloques de contenido tool_result.

Puede transferir los siguientes tipos de herramientas:

Personalizada

Definición de una herramienta personalizada.

type: (opcional) es el tipo de herramienta. Si está definido, utilice el valor custom.
name: es el nombre de la herramienta.
description: (opcional, pero muy recomendable) es la descripción de la herramienta.
input_schema: es el esquema JSON de la herramienta.

Computadora

Definición de la herramienta informática que se utiliza con la API de Computer Use.

type: el valor debe ser computer_20241022.
name: el valor debe ser computer.

(Obligatorio) display_height_px: es la altura de la pantalla que controla el modelo en píxeles.

Predeterminado	Mínimo	Máximo
Ninguno	1	Sin máximo

(Obligatorio) display_width_px: es el ancho de la pantalla que controla el modelo en píxeles.

Predeterminado	Mínimo	Máximo
Ninguno	1	Sin máximo

(Opcional) display_number: es el número de pantalla que se va a controlar (solo relevante para los entornos X11). Si se especifica, se proporcionará a la herramienta un número de pantalla en la definición de la herramienta.

Predeterminado	Mínimo	Máximo
Ninguno	0	N

bash

Definición de la herramienta Bash que se utiliza con la API de Computer Use.

type: (opcional) el valor debe ser bash_20241022.
name: el valor debe ser bash. La herramienta.

editor de texto

Definición de la herramienta de editor de texto que se utiliza con la API de Computer Use.

type: (opcional) el valor debe ser text_editor_20241022.
name: el valor debe ser str_replace_editor. La herramienta.

tool_choice: (opcional) especifica cómo debe utilizar el modelo las herramientas proporcionadas. El modelo puede usar una herramienta específica, cualquier herramienta disponible o decidir por sí mismo.

nota
Requiere un modelo Anthropic Claude 3.
- type: es el tipo de herramienta elegido. Los valores posibles son any (usar cualquier herramienta disponible), auto (el modelo decide) y tool (usar la herramienta especificada).
- name: (opcional) es el nombre de la herramienta que se va a utilizar. Obligatorio si lo especifica tool en el campo type.

Response

El modelo Anthropic Claude devuelve los siguientes campos para realizar una llamada de inferencia a Messages.


{
    "id": string,
    "model": string,
    "type" : "message",
    "role" : "assistant",
    "content": [
        {
            "type": string,
            "text": string,
            "image" :json,
            "id": string,
            "name":string,
            "input": json
        }
    ],
    "stop_reason": string,
    "stop_sequence": string,
    "usage": {
        "input_tokens": integer,
        "output_tokens": integer
    }
    
}

Ejemplos de respuestas con nuevos valores de stop_reason:


// Example with refusal
{
    "stop_reason": "refusal",
    "stop_details": {
        "type": "refusal",
        "category": "cyber",
        "explanation": "This request triggered restrictions on violative cyber content and was blocked under Anthropic's Usage Policy."
    },
    "content": [],
    "usage": {
        "input_tokens": 106,
        "output_tokens": 1
    }
}

// Example with tool_use
{
    "stop_reason": "tool_use",
    "content": [
        {
            "type": "tool_use",
            "id": "toolu_123",
            "name": "calculator",
            "input": {"expression": "2+2"}
        }
    ]
}

// Example with model_context_window_exceeded (Claude Sonnet 4.5)
{
    "stop_reason": "model_context_window_exceeded",
    "content": [
        {
            "type": "text",
            "text": "The response was truncated due to context window limits..."
        }
    ]
}

id: es el identificador único de la respuesta. El formato y la longitud del ID pueden cambiar con el tiempo.
model: el ID del modelo Anthropic Claude que ha realizado la solicitud.
stop_reason: motivo por el que Anthropic Claude ha dejado de generar texto.
- end_turn: el modelo ha alcanzado un punto de parada natural.
- max_tokens: el texto generado ha superado el valor del campo de entrada max_tokens o ha superado el número máximo de tokens que admite el modelo.
- stop_sequence: el modelo ha generado una de las secuencias de parada que ha especificado en el campo de entrada stop_sequences.
- rechazo: un clasificador de contenido bloqueó el modelo antes de completar su respuesta. La respuesta puede contener contenido parcial si el clasificador se activó a mitad de camino. Consulte stop_details para obtener información adicional acerca de la restricción. Esta razón de parada se produce a un ritmo considerablemente mayor en Claude Fable 5 debido a sus clasificadores de contenido de doble uso.
- tool_use: Claude llama a una herramienta y espera que la ejecute
- model_context_window_exceeded: el modelo detuvo la generación debido a que alcanzó el límite de la ventana de contexto.
  - Nuevo con Claude Sonnet 4.5
stop_sequence: es la secuencia de paradas que ha puesto fin a la generación.
stop_details (object | null): información adicional sobre por qué se detuvo la respuesta. Está presente cuando stop_reason está. "refusal" Puede ser nulo incluso en caso de rechazo.
- type (string): siempre que "refusal" está presente.
- categoría (cadena o nula): la categoría de contenido que activó la restricción (por ejemplo,"cyber","bio"). Es nulo cuando el rechazo no se corresponde con una categoría determinada.
- explicación (cadena o nula): Human-readable explicación de la restricción. No se garantiza que sea estable en todas las solicitudes; no las analice mediante programación.
nota
Ramificastop_reason, no adelante. stop_details El stop_details campo es informativo y puede ser nulo incluso cuando lo stop_reason es"refusal". Los rechazos también pueden producirse a mitad de la transmisión: el clasificador puede activarse después de que parte del contenido ya se haya reproducido en streaming. En el modo streaming, el rechazo se produce como message_delta evento finalstop_reason: "refusal"; cualquier bloque de contenido reproducido antes del rechazo es válido como salida parcial.
type: es el tipo de respuesta. Este valor siempre es message.
role: es el rol conversacional del mensaje generado. Este valor siempre es assistant.
content: es el contenido generado por el modelo. Se devuelve en forma de matriz. Hay tres tipos de contenido: text, tool_use e image.
- text: es una respuesta de texto.
  - type: el tipo de contenido. El valor es text.
  - text: si el valor de type es texto, contiene el texto del contenido.
- tool_use: solicitud del modelo para usar una herramienta.
  - type: el tipo de contenido. El valor es tool_use.
  - id: es el ID de la herramienta que el modelo quiere usar.
  - name: contiene el nombre de la herramienta solicitada.
  - input: parámetros de entrada que se van a transferir a la herramienta.
- Image: solicitud del modelo para usar una herramienta.
  - type: el tipo de contenido. El valor es image.
  - source: contiene la imagen. Para obtener más información, consulte Peticiones multimodales.
usage: contenedor del número de tokens proporcionados en la solicitud y el número de tokens que el modelo ha generado en la respuesta.
- input_tokens: número de tokens de entrada en la solicitud.
- output_tokens: número de tokens que el modelo ha generado en la respuesta.
- stop_sequence: el modelo ha generado una de las secuencias de parada que ha especificado en el campo de entrada stop_sequences.

Parámetro de esfuerzo (beta)

El effort parámetro es una alternativa a pensar en presupuestos simbólicos para Claude Opus 4,5. Este parámetro indica con Claude qué liberalidad debería gastar las fichas para obtener el mejor resultado, ajustando el uso de las fichas en función del pensamiento, las llamadas a las herramientas y la comunicación con los usuarios. Se puede usar con o sin el modo de pensamiento extendido.

El parámetro de esfuerzo se puede configurar en:

high(predeterminado): Claude gasta tantos tokens como sea necesario para obtener el mejor resultado
medium— Uso equilibrado de los tokens
low— Uso conservador de los tokens

Para utilizar esta función, debe pasar el encabezado betaeffort-2025-11-24.

Ejemplo de solicitud:


{
    "anthropic_version": "bedrock-2023-05-31",
    "anthropic_beta": [
        "effort-2025-11-24"
    ],
    "max_tokens": 4096,
    "output_config": {
        "effort": "medium"
    },
    "messages": [{
        "role": "user",
        "content": "Analyze this complex dataset and provide insights"
    }]
}

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Diferencias de la característica de pensamiento entre las versiones de los modelos

Ejemplos de código