View a markdown version of this page

Técnicas de peticiones avanzadas - Amazon Nova

Técnicas de peticiones avanzadas

En estas secciones, se proporciona una guía avanzada sobre cómo mejorar la calidad de las peticiones y aprovechar características clave, como el pensamiento extendido.

Los modelos de Amazon Nova 2 ofrecen un modo de razonamiento opcional que mejora el enfoque del modelo para la resolución de problemas complejos al permitirle resolverlos de forma sistemática antes de responder. Aprovechar el modo de razonamiento del modelo es una forma eficaz de mejorar la precisión de las peticiones.

Cuándo se debe usar: se recomienda el modo de razonamiento para tareas complejas, como casos de uso con:

  • Múltiples pasos de razonamiento: demostraciones matemáticas, diseño de algoritmos, arquitectura de sistemas

  • Información de referencia cruzada: análisis de documentos, comparación de opciones, evaluación de compensaciones

  • Cálculos propensos a errores: modelos financieros, análisis de datos, depuración compleja

  • Planificación con restricciones: optimización de recursos, administración de dependencias, evaluación de riesgos

  • Clasificaciones complejas: categorización con varias etiquetas, taxonomías jerárquicas, límites de decisión matizados

  • Escenarios de llamada a herramientas: flujos de trabajo de API de varios pasos, optimización de consultas de bases de datos, integraciones coordinadas de sistemas

nota

Para obtener más información sobre el modo de razonamiento, consulte Uso del razonamiento.

En el caso de situaciones en las que el modelo tenga que evaluar varios enfoques para resolver el problema, pídale que adopte un enfoque descendente.

  • Los modelos de Amazon Nova 2 funcionan mejor cuando el modelo comienza con un panorama general y luego lo divide en subproblemas o pasos más pequeños y detallados.

  • Indique explícitamente al modelo que identifique primero el objetivo principal y, a continuación, lo descomponga en componentes manejables antes de analizar los detalles de cada parte.

  • Este enfoque estructurado ayuda al modelo a organizar su pensamiento y producir cadenas de razonamiento más coherentes.

Ejemplo:

{{User query}}. Start with the big picture and break it down into progressively smaller, more detailed subproblems or steps.

Si bien el modo de razonamiento proporciona una mayor precisión mediante la resolución sistemática de problemas, hay situaciones específicas en las que las peticiones de la cadena de pensamiento (CoT) en el modo sin razonamiento pueden satisfacer mejor sus necesidades.

Cuándo se debe usar:

  • Transparencia y auditabilidad: cuando desee ver, verificar o auditar el proceso de razonamiento del modelo, la CoT ofrece una visibilidad total de cada paso. Es fundamental para sectores regulados, decisiones de alto riesgo o cuando se quiere documentar la lógica detrás de una respuesta.

  • Estructuras de razonamiento personalizadas: utilice la CoT para aplicar metodologías o patrones de razonamiento específicos. Puede guiar al modelo para que siga los marcos de decisión de su organización, utilice enfoques de resolución de problemas específicos para un dominio o se garantice que los factores se tengan en cuenta en un orden específico.

  • Desarrollo y depuración de peticiones: durante la fase de ingeniería de peticiones, la CoT le permite entender cómo el modelo aborda los problemas, identifica dónde falla el razonamiento e itera las peticiones de forma más eficaz.

  • Enfoques híbridos: considere la posibilidad de utilizar la CoT durante el desarrollo para perfeccionar las peticiones y, a continuación, cambiar al modo de razonamiento para la implementación en producción una vez que confíe en el enfoque del modelo para su caso de uso específico.

nota

No todas las tareas requieren la CoT. Para tareas más sencillas, permita que el modelo utilice su propio proceso de razonamiento.

Orientación de la dirección de la CoT del modelo:

{{User query}} Please follow these steps: 1. {{Step 1}} 2. {{Step 2}} ...

Los modelos de Amazon Nova 2 tienen una longitud de contexto admitida de 1 millón de tokens y destacan en la comprensión del código y la respuesta a preguntas en documentos largos. Su rendimiento (lo que incluye el cumplimiento de peticiones y el uso de herramientas) puede disminuir ligeramente a medida que aumenta el tamaño del contexto.

Modo de uso:

  • Ponga los datos de formato largo al principio: coloque los documentos largos y las entradas cerca del comienzo de la petición. Colóquelos antes de la consulta, las instrucciones y los ejemplos.

  • Ponga las instrucciones al final: coloque las instrucciones al final de la petición. El modelo funciona mejor cuando se proporciona primero el contexto y las instrucciones se indican al final.

  • Estructure los marcadores de inicio y final del contenido del documento: utilice marcadores de inicio y final, como DOCUMENT {idx} START y DOCUMENT {idx} END, para indicar el inicio y el final de documentos largos, en los que {idx} representa el índice del documento específico.

Plantilla de de ejemplo de:

// Provide your long inputs at the top of your prompt BEGIN INPUT DOCUMENTS DOCUMENT 1 START {{Your document}} DOCUMENT 1 END END INPUT DOCUMENTS // Then specify your query and instructions BEGIN QUESTION {{User query}} END QUESTION BEGIN INSTRUCTIONS {{Instructions}} END INSTRUCTIONS

Le recomendamos que le proporcione al modelo información fiable relevante para la consulta de entrada. Esta información, junto con la consulta de entrada, a menudo forma parte del sistema denominado generación aumentada por recuperación (RAG).

  • En este proceso, se agrega algún documento o información contextual pertinente a la propia petición del usuario para que el modelo obtenga contenido fiable y genere una respuesta pertinente y precisa.

  • Indicar a Amazon Nova 2 que responda con un texto de referencia de un origen fiable puede guiarlo para redactar su respuesta en función del material proporcionado y garantizar que se base en información precisa y pertinente, lo que mejora la fiabilidad y la credibilidad del contenido generado.

  • Utilizar un texto de referencia puede ayudar a evitar las alucinaciones, lo que mejora la calidad general y la fiabilidad de las respuestas. Para minimizar las alucinaciones, le recomendamos que mencione DO NOT USE INFORMATION THAT IS NOT IN REFERENCE TEXTS! de forma explícita en las instrucciones del modelo.

Plantilla de petición

System: In this session, the model has access to search results and a user's question, your job is to answer the user's question using only information from the search results. Model Instructions: - DO NOT USE INFORMATION THAT IS NOT IN SEARCH RESULTS! User: {Query} Resource: Search Results: {Reference texts}

En este ejemplo, se muestra cómo se puede evitar que el modelo alucine al basar el contexto.

Sistema:

In this session, the model has access to search results and a user's question, your job is to answer the user's question using only information from the search results. Model Instructions:- DO NOT USE INFORMATION THAT IS NOT IN SEARCH RESULTS!

Usuario:

What were the economic impacts of the COVID-19 pandemic on the United States in 2020? Resource: Search Results: In 2020, the United States experienced significant economic impacts due to the COVID-19 pandemic. The U.S. economy contracted by 3.5% in 2020, according to the Bureau of Economic Analysis. Unemployment rates surged to 14.7% in April 2020, the highest since the Great Depression, before gradually declining. Small businesses faced severe challenges, with millions of firms closing permanently. Additionally, consumer spending dropped sharply as people reduced non-essential expenditures and saved more. Government intervention played a critical role in mitigating these impacts through stimulus packages and support programs, such as the Paycheck Protection Program (PPP) for small businesses and direct payments to individuals. Despite these measures, the economic recovery remained uneven across different sectors and regions.

Uso de marcadores de citas como base

Para tareas con documentos largos, le recomendamos que indique al modelo de Amazon Nova 2 que fundamente sus respuestas con citas de las secciones pertinentes de los documentos antes de continuar con la tarea.

Este enfoque ayuda al modelo a centrarse en la información más pertinente y a evitar que se distraiga con contenido superfluo. Cuando solicite que el modelo fundamente su respuesta, las secciones que se pueden citar deben estar numeradas. Por ejemplo, Passage %[1]%, Passage %[2]%, etc.

ejemplo Petición con marcadores de citas
You are an AI financial assistant. Your task is to find patterns and insights from multi-year financial documents Passage %[1]% {{Your document}} Passage %[2]% {{Your document}} ## Task: Analyze my LLC's reports across multiple years to identify significant performance trends, segment growth patterns and strategic shifts. ## Context information: - You have access to my LLC's annual financial reports (10-K) for multiple fiscal years in PDF format - These reports contain comprehensive financial data including income statements, balance sheets, cash flow statements and management discussions - The analysis should focus on year-over-year comparisons to identify meaningful trends - I operate two business segments, one in Massachusetts and one in New York Based on the provided Context, extract key financial metrics from each year's reports phrases from the documents. Place citations as inline markers (e.g., %[1]%, %[2]%, etc.) directly within the relevant parts of the response text. Do not include a separate citation section after the response. ## Response Schema: %% (Extracted Financial Metrics) %% (Extracted Financial Metrics) %% (Extracted Financial Metrics) ...

Después de extraer la información clave en función de la tarea del usuario, puede utilizar las métricas financieras extraídas para responder a las preguntas pertinentes, como se muestra a continuación:

ejemplo Análisis de seguimiento con métricas extraídas
## Task Analyze my LLC's financial reports across multiple years to identify significant performance trends, segment growth patterns and strategic shifts. {{extracted financial metrics}} ## Model Instructions: - Organize data chronologically to identify meaningful trends - DO compare segment performance across the five-year period - DO identify significant strategic shifts or investments mentioned in management discussions - DO NOT make speculative predictions beyond what is supported by the data - ALWAYS note any changes in accounting practices or reporting methodologies that might affect year-over-year comparisons ## Response style and format requirements: - Respond in markdown - Structure the analysis with clear headings and subheadings - Present key financial metrics in tabular format showing all five years side-by-side - Include percentage changes year-over-year for all major metrics - Create a section dedicated to visualizing the most significant trends (with descriptions of what would be shown in charts) - Limit the executive summary to 250 words maximum - Format segment analysis as separate sections with consistent metrics across all segments - MUST include a Key Insights bullet-pointed list at the end of each major section

Uso del Anclaje web de Nova

En lugar de pedir directamente citas para que el modelo se base en el texto de apoyo, los modelos de Amazon Nova 2 proporcionan una herramienta de anclaje web interna que se puede utilizar. Al habilitar la opción, los modelos de Amazon Nova 2 consultarán directamente la web y los gráficos de conocimiento de Amazon y basarán la respuesta final con citas.

Para obtener más información sobre cómo aprovechar el Anclaje web de Amazon Nova, puede consultar la guía del usuario del Anclaje web de Amazon Nova.

Para garantizar formatos de salida coherentes y estructurados, puede utilizar salidas estructuradas, lo que incluye formatos como XML, JSON, Markdown o el uso de la funcionalidad de uso de la herramienta.

  • Este enfoque permite que los casos sistemas descendentes comprendan y analicen de manera más eficaz las salidas generadas por el modelo.

  • Al proporcionar instrucciones explícitas al modelo, las respuestas se generan de una manera que se ajusta a un esquema predefinido.

Por ejemplo, si el analizador descendente espera convenciones de nomenclatura específicas para las claves de un objeto JSON, debe especificar el esquema de la respuesta al final de la petición. Además, si prefiere que las respuestas estén en formato JSON sin ningún texto de preámbulo, indíqueselo al modelo. Es decir, indique explícitamente: Genere solo la salida JSON. NO elabore ningún preámbulo. para garantizar una salida limpia.

sugerencia
  • Observamos que la mejor forma de cumplir con los requisitos de formato de los datos es cuando se definen en el propio esquema en lugar de mediante el uso de ejemplares (por ejemplo, si se especifican las fechas en formato AAAA/MM/DD).

  • Para obtener salidas JSON sencillas con un máximo de 10 claves, puede encontrar el esquema a continuación. Para esquemas más complejos, le recomendamos que defina su esquema mediante una herramienta. El uso de la herramienta aprovecha una técnica llamada decodificación restringida que aumentará la adherencia del modelo a estos esquemas complejos.

Esquemas de formato común

A continuación se muestran ejemplos de esquemas de formato común.

JSON
JSON_format = """Write your response following the JSON format below: ```json { "key1": "value1", "key2": "value2", key3: [{ "key3_1": "value_3_1 written in YYYY/MM/DD format", "key3_2": "value_3_2 day of the week written in full form", ...}``` """
XML
XML_format = """Write your response following the XML format below: <output> <task>"task1"</task> <subtask> <task1_result> ( task 1 result )</task1_result> <task2_result> ( task 2 result )</task2_result> <task3_result> ( task 3 result )</task3_result> </subtask> <task>"task2"</task> <subtask> <task1_result> ( task 1 result )</task1_result> <task2_result> ( task 2 result )</task2_result> <task3_result> ( task 3 result )</task3_result> </subtask> </output> """
Markdown
markdown_schema = """Write your response following the markdown format below: ## Introduction ( 2-3 line intro) ## Design Guidance (Bulleted list of design guidance) ## Step by Step Instructions on Execution ( Bulleted list of instructions with each with bold title. ## Conclusion ( conclusion ) """

Relleno previo del contenido del asistente

Si está produciendo una salida estructurada en un modo sin razonamiento, puede desplazar la respuesta del modelo si rellena previamente el contenido del asistente.

El relleno previo mejora la coherencia del formato de salida en el modo sin razonamiento. Le permite dirigir las acciones del modelo, omitir los preámbulos y aplicar formatos de salida específicos, como JSON y XML. Por ejemplo, si rellena previamente el contenido del asistente con { o ```json, esa entrada guía al modelo para generar el objeto JSON sin información adicional.

sugerencia

Si lo que busca es extraer JSON de forma explícita, un patrón habitual consiste en rellenarlo previamente con ```json y agregar una secuencia de detención en ```. Esto garantiza que el modelo genere un objeto JSON que se pueda analizar mediante programación.

ejemplo Relleno previo del contenido del asistente

En los siguientes ejemplos de código, se muestra cómo prellenar con la API:

import boto3 import json # Create a Bedrock Runtime client. client = boto3.client( "bedrock-runtime", region_name="us-east-1" ) request_body = { "system": [ {"text": "You write JSON objects based on the given instructions"} ], "messages": [ { "role": "user", "content": [{"text": "Provide details about the best selling full-frame cameras in past three years. Answer in JSON format with keys like name, brand, price and a summary."}] }, { "role": "assistant", "content": [{"text": " Here is the JSON response: ```json"}] } ], "inferenceConfig": { "maxTokens": 1000, } } # Invoke the model and extract the response body. response = client.invoke_model( modelId="amazon.nova-2-lite-v1:0", body=json.dumps(request_body) ) model_response = json.loads(response["body"].read())

Especificación de una herramienta para usarla en esquemas complejos

Otro enfoque consiste en utilizar herramientas para forzar un esquema específico para la respuesta del modelo mediante la inclusión del esquema JSON de Pydantic en la sección de esquema de uso de herramientas. Puede especificar la elección de herramienta según el esquema proporcionado y la respuesta de Amazon Nova se estructurará en función de la herramienta seleccionada. Para obtener más información sobre cómo aprovechar el uso de herramientas, consulte Uso de herramientas.

Ejemplos

Al añadir la sección del esquema de salida con el esquema apropiado, el modelo prefiere ajustarse a ese esquema. Sin embargo, la salida del modelo no es determinista y puede diferir del esquema de salida.

Unspecific Prompt

Usuario:

Provide details about the best selling full-frame cameras in past three years. Answer in JSON format with keys like name, brand, price and a summary.

Asistente:

```json [ { "name": "Sony Alpha A7R IV", "brand": "Sony", "price": "Approximately $3,500", "summary": "The Sony Alpha A7R IV is renowned for its exceptional image quality, thanks to a 61-megapixel full-frame sensor. It also features 4K video recording and a robust build, making it a favorite among professional photographers and videographers." }, { "name": "Canon EOS R5", "brand": "Canon", "price": "Approximately $3,900", "summary": "The Canon EOS R5 combines high-resolution imaging with advanced video capabilities. It houses a 45-megapixel sensor, 8K video recording, and impressive autofocus performance, appealing to both photography and filmmaking professionals." }, { "name": "Nikon Z7 II", "brand": "Nikon", "price": "Approximately $2,800", "summary": "The Nikon Z7 II offers a 45.7-megapixel full-frame sensor and is praised for its high resolution and excellent dynamic range. It also supports 4K video recording and features a versatile Z-mount lens system, making it a strong contender in the full-frame market." }, { "name": "Fujifilm GFX 100S", "brand": "Fujifilm", "price": "Approximately $7,000", "summary": "While not a traditional full-frame camera, the Fujifilm GFX 100S stands out with its 102-megapixel medium format sensor. It is lauded for its stunning detail and color reproduction, though it comes at a higher price point and is aimed at specialized users." } ] ```
Specific Prompt

Usuario:

Provide details about the best selling full-frame cameras in past three years. You MUST answer in JSON format only. Write your response following the the format below: [{ “name”: “name goes here”, “brand”: “brand goes here”, “price”: “price goes here“, "summary": "summary goes here" }]

Asistente:

[ { "name": "Nikon D850", "brand": "Nikon", "price": "$3,296.95", "summary": "The Nikon D850 is a professional full-frame DSLR camera known for its exceptional image quality, 45.7-megapixel resolution, 7 fps continuous shooting, and 4K video capabilities." }, { "name": "Canon EOS 5D Mark IV", "brand": "Canon", "price": "$3,499.00", "summary": "The Canon EOS 5D Mark IV is a popular full-frame DSLR appreciated for its 30.4-megapixel sensor, 4K video recording, robust build quality, and reliable autofocus system." }, { "name": "Sony A7R III", "brand": "Sony", "price": "$3,198.00", "summary": "The Sony A7R III is a high-resolution full-frame mirrorless camera renowned for its 42.4-megapixel sensor, excellent low-light performance, and versatile lens compatibility." }, { "name": "Fujifilm GFX 100S", "brand": "Fujifilm", "price": "$5,999.99", "summary": "The Fujifilm GFX 100S is a medium format mirrorless camera that stands out for its 102-megapixel sensor, high dynamic range, and exceptional color reproduction." }, { "name": "Sony A7 III", "brand": "Sony", "price": "$1,998.00", "summary": "The Sony A7 III is a full-frame mirrorless camera popular among enthusiasts and professionals for its 24.2-megapixel sensor, fast autofocus, and 4K video capabilities." } ]

Otro enfoque consiste en prellenar la respuesta del modelo incluyendo el texto inicial deseado en el mensaje del asistente. En este caso, la respuesta del modelo de Amazon Nova continuará desde donde termina el mensaje del asistente.

Consejo: el relleno previo solo es válido cuando el razonamiento no está activado.

Usuario:

Provide details about the best selling full-frame cameras in past three years. Your response should be in JSON format, with the following keys: name, brand, year, price, summary.

Asistente (relleno previo):

```json

Asistente:

{ "cameras": [ { "name": "Sony Alpha A7 III", "brand": "Sony", "year": 2018, "price": "$1999", "summary": "The Sony Alpha A7 III is a highly acclaimed full-frame mirrorless camera known for its excellent image quality, advanced autofocus system, and 4K video capabilities." }, { "name": "Canon EOS R5", "brand": "Canon", "year": 2020, "price": "$3899", "summary": "The Canon EOS R5 is a top-tier full-frame mirrorless camera that offers stunning 45MP images, 8K video recording, and exceptional performance in various lighting conditions." }, { "name": "Nikon Z7 II", "brand": "Nikon", "year": 2020, "price": "$2999", "summary": "The Nikon Z7 II is a flagship full-frame mirrorless camera with a 45.7MP sensor, superb image quality, and advanced video recording features." }, { "name": "Fujifilm GFX 100S", "brand": "Fujifilm", "year": 2020, "price": "$7999", "summary": "The Fujifilm GFX 100S is a medium format mirrorless camera known for its impressive 102MP sensor, beautiful film simulations, and versatile lens options." }, { "name": "Sony Alpha A7R IV", "brand": "Sony", "year": 2019, "price": "$3499", "summary": "The Sony Alpha A7R IV features a 61MP sensor, excellent low-light performance, and advanced video capabilities, making it a favorite among professional photographers." } ] } ```

Como alternativa al uso de la técnica de relleno previo para obtener una salida estructurada, puede combinar la funcionalidad de las herramientas de Nova con toolChoice. En este ejemplo, el modelo generará una llamada a la herramienta que se adhiera al esquema JSON proporcionado y que llame a la herramienta específica indicada en el formato JSON completo definido. Para obtener orientación adicional, consulte Sistemas avanzados.

Usuario:

From the below provided Query, extract the relevent entities Query: John works in BUILDING-0987 and have been incharge of product id 23564#. His performance have been excellent in past year and is up for a raise. Use the extract_ner tool.

ToolConfig:

{ "tools": [ { "toolSpec": { "name": "extract_ner", "description": "Extract all the named entities. based on provided input", "inputSchema": { "json": { "type": "object", "properties": { "entities": { "type": "array", "items": { "type": "object", "properties": { "name": { "type": "string", "description": "The extracted entity name. This should be a name of a person, place, animal or thing" }, "location": { "type": "string", "description": "The extracted location name. This is a site name or a building name like SITE-001 or BUILDING-003" }, "product": { "type": "string", "description": "The extrcted product code, this is generally a 6 digit alphanumeric code such as 45623#, 234567" } }, "required": [ "name", "location", "product" ] } } }, "required": [ "entities" ] } } } }], "toolChoice": { "tool": { "name": "extract_ner" } } }

Los modelos de Amazon Nova 2 se han entrenado en más de 200 idiomas y se han optimizado para 15 idiomas.

Peticiones de traducción precisas

Para aprovechar esta capacidad para traducciones de formato corto (unas pocas frases), puede pedir al modelo que traduzca el texto al idioma de destino especificado.

ejemplo Peticiones de traducción
Translate the following text into {target language}. Please output only the translated text with no prefix or introduction: {text}
Translate the following sentence from {source_language} to {target language}: {text}
{text} How do you say this sentence in {target_language}

Aplicación de convenciones de redacción coherentes

En los lenguajes basados en caracteres, los modelos de Amazon Nova 2 pueden utilizar el conjunto de caracteres del idioma de origen. Puede utilizar la siguiente petición para aplicar una salida coherente.

ejemplo Aplicación de convenciones de redacción
When translating, ensure to use the correct orthography / script / writing convention of the target language, not the source language's characters

Sistemas agénticos

Establecimiento de los parámetros de inferencia correctos

La llamada a herramientas requiere una salida estructurada muy específica del modelo y se mejora mediante el uso de los siguientes parámetros de inferencia:

  • Modo sin razonamiento. Temperatura: 0,7 y Top P: 0,9

  • Modo de razonamiento. Temperatura: 1 y Top P: 0,9

Consideración de los requisitos de latencia

sugerencia

Los modelos de Amazon Nova 2 pueden llamar a herramientas con el razonamiento activado y desactivado. Sin embargo, los modos de razonamiento tienen un impacto significativo en la latencia.

En el caso de aplicaciones sensibles a la latencia, se debe optimizar el modo de razonamiento desactivado y, en la medida de lo posible, simplificar las llamadas a herramientas necesarias. Divida los flujos de trabajo de varios pasos en pasos discretos para reducir la dependencia del modelo de regurgitar parámetros innecesarios.

Uso de un lenguaje intencionado para las instrucciones de llamada a herramientas

Nombres de herramientas: hacer referencia a las herramientas en la petición del sistema es habitual en los sistemas de llamadas a herramientas para indicar al modelo cuándo llamar a una herramienta. Cuando haga referencia a herramientas en la petición, le recomendamos que utilice el nombre de la herramienta en lugar de referencias o ejemplos en formato xml o Python.

Use the 'run_shell_command' tool for running shell commands
Call run_shell_command() to run shell commands

Aprovechamiento de los comandos de “pensamiento”

Para todos los casos de uso en los que pensar sea beneficioso para la llamada a herramientas, te recomendamos que aproveche el modo de razonamiento en lugar de hacer peticiones al modelo para que “piense en etiquetas” o que utilice una herramienta de “pensamiento”.

Los modelos de Amazon Nova 2 están entrenados ampliamente para el modo de razonamiento y producirán los resultados óptimos cuando se utilicen en el modo de razonamiento para la cadena de pensamiento.

Orden de las llamadas a herramientas

En los casos de uso que puedan requerir el uso simultáneo de llamadas a herramientas integradas y nativas, el modelo se inclina por llamar primero a las herramientas integradas.

No indique al modelo que actúe de forma diferente en la petición. En su lugar, téngalo en cuenta al diseñar el flujo de trabajo.

Por ejemplo, si no desea que el modelo utilice herramientas integradas, no las incluya en el flujo de trabajo para que el modelo no se incline por ellas.

Creación de esquemas de herramientas de calidad

Los esquemas de herramientas son uno de los lugares clave en los que puede usar la ingeniería de peticiones para sistemas de llamada a herramientas de forma eficaz. Sin embargo, es importante tener en cuenta lo que se captura en el propio esquema de la herramienta, cómo se describe semánticamente cada elemento del esquema y cómo la petición del sistema hace referencia a las herramientas y los elementos del esquema en las instrucciones del sistema.

Los modelos de Amazon Nova 2 están optimizados para ofrecer descripciones concisas en los esquemas de la herramienta. Sea breve.

Directrices de esquema de la herramienta frente a petición del sistema:

Incluya lo siguiente en el esquema de la herramienta:

  • Funcionalidad básica: qué hace la herramienta (se recomiendan entre 20 y 50 palabras)

  • Especificaciones de los parámetros: descripciones claras de cada parámetro (alrededor de 10 palabras por parámetro)

  • Formatos esperados: tipos de datos (como enum, int, float), campos obligatorios y rangos de valores válidos

Incluya lo siguiente en la petición del sistema:

  • Dedique una sección #Tool Usage a la lógica de orquestación (cuándo y por qué se deben utilizar herramientas específicas) y a las reglas empresariales (lógica condicional, requisitos de secuenciación y dependencias).

  • Estrategias de gestión de errores: agregue una sección #Error Handling and Troubleshooting con instrucciones sobre cómo responder a fallos o a salidas inesperadas

  • Formato de salida: agregue detalles sobre cómo se presenta al usuario

You are a software engineering issue root cause analysis agent. You are tasked with reviewing a customer issue and examining the repository to identify a plan to resolve the issue. # Core Mandates - **DO NOT** update the original issue that was posted by the user. You only add *additional* comments to the reported issue if necessary # Primary Workflows 1. **Understand:** Analyze the user's request and explore the codebase thoroughly using **get_file_contents** to grasp file structures and conventions. 2. **Plan:** Create a coherent, evidence-based plan for resolving the task and share it with the user following the format below # Tool Usage - **Read the Issue:** Always start by using the **read_issue** tool to get the details about the requested issue - **File Paths:** Always end the file path with "/" if you are searching a directory using the **get_file_contents** tools - **Parallelism:** Execute multiple independent tool calls in parallel when feasible # Error Handling and Troubleshooting - **File Exploration:** If you get an error that a file doesn't exist, try searching at the directory level first to validate the file path # Output Formatting Return your plan in markdown in the following format ## Issue <Your root cause analysis of the issue> ## Resolution Plan <your step by step plan of how to solve the issue>

Creación de subagentes

Considere la posibilidad de crear subagentes especializados en lugar de un solo agente con muchas herramientas cuando se encuentre con lo siguiente:

  • El número de herramientas supera las 20: los conjuntos de herramientas grandes se vuelven difíciles de administrar y aumentan los errores de selección

  • Dominios funcionales distintos: las herramientas se agrupan de forma natural en categorías separadas (por ejemplo, la recuperación de datos, el procesamiento o la elaboración de informes)

  • Esquemas complejos: cuando la profundidad de los parámetros supera los 3 o 4 niveles o las herramientas tienen interdependencias complejas

  • Duración de la conversación: los flujos de trabajo que suelen superar los 15 o 20 turnos pueden beneficiarse de la ayuda de subagentes especializados

  • Degradación del rendimiento: si observa una disminución de la precisión en la selección de herramientas o un aumento de la latencia

sugerencia

Los servidores MCP vienen con herramientas y esquemas que no puede controlar. Incluya solo las herramientas necesarias para que su flujo de trabajo complete la tarea requerida.

Uso de herramientas para entradas multimodales

En el caso de las tareas multimodales, no hemos observado ninguna mejora en la precisión al aprovechar las herramientas para tareas estructuradas (como la extracción o la generación de marcas de tiempo).

En su lugar, le recomendamos que consulte las secciones pertinentes de la sección Peticiones de entradas multimodales para obtener información sobre cómo activar correctamente el modelo con las plantillas proporcionadas.

Siguientes pasos