Aspectos destacados de la estructura de la respuesta - Amazon Nova

Aspectos destacados de la estructura de la respuesta

A continuación se muestran los elementos clave de la estructura de la respuesta devuelta por las funciones Converse y InvokeModel que no transmiten de forma continua. Para obtener información sobre la estructura de respuesta completa, así como sobre las estructuras de solicitud y respuesta de las funciones de transmisión continua, consulte la documentación de la API.

{ "ResponseMetadata": { "RequestId": string, "HTTPStatusCode": int, "HTTPHeaders": { "date": string, "content-type": "application/json", "content-length": string, "connection": "keep-alive", "x-amzn-requestid": string }, "RetryAttempts": 0 }, "output": { "message": { "role": "assistant", "content": [ { // Optional "reasoningContent": { "reasoningText": { "text": string } } }, { // Optional "toolUse": { "toolUseId": string, "name": string, "input": object } }, { // Optional "text": string }, { // Optional "image": { "format": "png", "source": { "bytes": { "bytes": image // Binary array (Converse API) or Base64-encoded string (Invoke API) } } } } ] } }, "stopReason": string, // "end_turn" | "content_filtered" | "max_tokens" | "malformed_model_output" | "malformed_tool_use" | etc. "usage": { "inputTokens": int, "outputTokens": int, "totalTokens": int }, "metrics": { "latencyMs": int } }

A continuación, se muestran los elementos clave de la respuesta:

  • output: (obligatorio) contiene el mensaje de respuesta del modelo.

    • message: (obligatorio) el mensaje de respuesta del asistente.

      • content: (obligatorio) Una matriz de uno o más bloques de contenido que pueden incluir lo siguiente:

        • reasoningContent: (opcional) se devuelve si se ha activado el razonamiento. Contiene el texto del razonamiento, que siempre aparecerá como [REDACTED] en la respuesta.

        • toolUse: (opcional) se devuelve si se ha llamado a una herramienta. Contiene el ID de uso de la herramienta, el nombre y los argumentos de entrada.

        • text: (opcional) se devuelve si el modelo respondió con contenido de texto.

        • image: (solo opcional) se devuelve si el modelo generó una imagen. El formato siempre será PNG para las imágenes generadas.

  • stopReason: (obligatorio) un valor enum que indica el motivo por el que el modelo dejó de generar el resultado. Los valores compatibles incluyen los siguientes:

    • end_turn: se ha alcanzado el final lógico del turno.

    • max_tokens: la salida alcanzó el límite de maxTokens establecido por el usuario o el límite máximo de tokens de salida del modelo.

    • content_filtered: el resultado del modelo infringió la política de IA responsable de AWS.

    • malformed_model_output: el modelo produjo un resultado no válido.

    • malformed_tool_use: el modelo produjo un resultado de toolUse no válido.

    • service_unavailable: no se pudo acceder a uno de los servicios de herramientas integradas.

    • invalid_query: la consulta que el modelo envió a la herramienta Web Grounding integrada no era válida.

    • max_tool_invocations: indica que se llamó a una herramienta integrada, pero no se obtuvo un resultado válido, incluso después de varios intentos.

  • usage: (obligatorio) información sobre el uso de los tokens, lo que incluye los tokens de entrada, los tokens de salida y el total de tokens.

  • metrics: (obligatorio) métricas de rendimiento, lo que incluye la latencia total de inferencia en milisegundos.