View a markdown version of this page

¿Qué es la ingeniería de peticiones? - Amazon Nova

¿Qué es la ingeniería de peticiones?

La ingeniería de peticiones es la práctica de optimizar la entrada de texto en un modelo de lenguaje de gran tamaño (LLM) para mejorar el resultado y obtener las respuestas deseadas. Las peticiones ayudan a los LLM a realizar una amplia variedad de tareas, como la clasificación, la respuesta a preguntas, la generación de códigos, la redacción creativa y mucho más. La calidad de las peticiones que proporcione a los LLM puede afectar a la calidad de las respuestas del modelo. En esta sección se proporciona toda la información necesaria para comenzar con la ingeniería de peticiones. También incluye herramientas que le permitirán encontrar el mejor formato de petición posible para su caso de uso cuando utilice un LLM en Amazon Bedrock.

La eficacia de las peticiones depende de la calidad de la información proporcionada y de la elaboración de la propia petición. Las peticiones pueden incluir instrucciones, preguntas, detalles contextuales, entradas y ejemplos para guiar eficazmente el modelo y mejorar la calidad de los resultados. En este documento, se describen las estrategias y tácticas para optimizar el rendimiento de la familia de modelos de Amazon Nova 2 Sonic. Los métodos presentados en este documento pueden emplearse en varias combinaciones para amplificar su eficacia. Le animamos a que experimente para identificar los enfoques más adecuados para sus necesidades específicas.

Introducción a la ingeniería de peticiones

Antes de empezar con la ingeniería de peticiones, le recomendamos que cuente con los siguientes elementos para que pueda desarrollar de forma iterativa la petición óptima para su caso de uso:

Definición del caso de uso

Defina su caso de uso en cuatro dimensiones:

  • Tarea: defina qué quiere que haga el modelo. Esto determina la técnica de petición correcta.

  • Rol: defina el rol que el modelo debe adoptar para llevar a cabo la tarea. Los modelos de Amazon Nova admiten tres roles (sistema, usuario o asistente).

  • Estilo de respuesta: defina la estructura o el estilo de respuesta que debe seguir el modelo en función de la audiencia, como JSON, Markdown o conversacional.

  • Instrucciones: defina el conjunto de instrucciones que el modelo debe seguir para cumplir con los criterios de éxito.

Establecimiento de los criterios de éxito

Defina los criterios de éxito o las métricas de evaluación. Puede proporcionar una lista de criterios o proporcionar métricas de evaluación específicas, como la longitud, la puntuación BLEU, ROUGE, el formato, la realidad y la fidelidad.

Redacción de una petición

Cree una petición inicial que incorpore la tarea, el rol, el estilo de respuesta e instrucciones. Itere en función de los resultados.

La eficacia de las peticiones depende de la calidad de la información que proporcione.