Aspectos destacados de la estructura de la respuesta

A continuación se muestran los elementos clave de la estructura de la respuesta devuelta por las funciones Converse y InvokeModel que no transmiten de forma continua. Para obtener información sobre la estructura de respuesta completa, así como sobre las estructuras de solicitud y respuesta de las funciones de transmisión continua, consulte la documentación de la API.


{
    "ResponseMetadata": {
        "RequestId": string,
        "HTTPStatusCode": int,
        "HTTPHeaders": {
            "date": string,
            "content-type": "application/json",
            "content-length": string,
            "connection": "keep-alive",
            "x-amzn-requestid": string
        },
        "RetryAttempts": 0
    },
    "output": {
        "message": {
            "role": "assistant",
            "content": [
                { // Optional
                    "reasoningContent": {
                        "reasoningText": {
                            "text": string
                        }
                    }
                },
                { // Optional
                    "toolUse": {
                        "toolUseId": string,
                        "name": string,
                        "input": object
                    }
                },
                { // Optional
                    "text": string
                },
                { // Optional
                    "image": {
                        "format": "png",
                        "source": {
                            "bytes": {
                                "bytes": image // Binary array (Converse API) or Base64-encoded string (Invoke API)
                            }
                        }
                    }
                }
            ]
        }
    },
    "stopReason": string, // "end_turn" | "content_filtered" | "max_tokens" | "malformed_model_output" | "malformed_tool_use" | etc.
    "usage": {
        "inputTokens": int,
        "outputTokens": int,
        "totalTokens": int
    },
    "metrics": {
        "latencyMs": int
    }
}

A continuación, se muestran los elementos clave de la respuesta:

output: (obligatorio) contiene el mensaje de respuesta del modelo.
- message: (obligatorio) el mensaje de respuesta del asistente.
  - content: (obligatorio) Una matriz de uno o más bloques de contenido que pueden incluir lo siguiente:
    
    reasoningContent: (opcional) se devuelve si se ha activado el razonamiento. Contiene el texto del razonamiento, que siempre aparecerá como [REDACTED] en la respuesta.
    
    toolUse: (opcional) se devuelve si se ha llamado a una herramienta. Contiene el ID de uso de la herramienta, el nombre y los argumentos de entrada.
    
    text: (opcional) se devuelve si el modelo respondió con contenido de texto.
    
    image: (solo opcional) se devuelve si el modelo generó una imagen. El formato siempre será PNG para las imágenes generadas.
stopReason: (obligatorio) un valor enum que indica el motivo por el que el modelo dejó de generar el resultado. Los valores compatibles incluyen los siguientes:
- end_turn: se ha alcanzado el final lógico del turno.
- max_tokens: la salida alcanzó el límite de maxTokens establecido por el usuario o el límite máximo de tokens de salida del modelo.
- content_filtered: el resultado del modelo infringió la política de IA responsable de AWS.
- malformed_model_output: el modelo produjo un resultado no válido.
- malformed_tool_use: el modelo produjo un resultado de toolUse no válido.
- service_unavailable: no se pudo acceder a uno de los servicios de herramientas integradas.
- invalid_query: la consulta que el modelo envió a la herramienta Web Grounding integrada no era válida.
- max_tool_invocations: indica que se llamó a una herramienta integrada, pero no se obtuvo un resultado válido, incluso después de varios intentos.
usage: (obligatorio) información sobre el uso de los tokens, lo que incluye los tokens de entrada, los tokens de salida y el total de tokens.
metrics: (obligatorio) métricas de rendimiento, lo que incluye la latencia total de inferencia en milisegundos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Esquema de solicitud completo

Soporte multimodal