¿Qué es la ingeniería de peticiones?

La ingeniería de peticiones se refiere a la práctica de crear y optimizar las peticiones de entrada mediante la selección de palabras, frases, oraciones, signos de puntuación y caracteres separadores adecuados para utilizar eficazmente los LLM en una amplia variedad de aplicaciones. En otras palabras, la ingeniería rápida es el arte de comunicarse con un LLM. High-quality las indicaciones condicionan al LLM para generar las respuestas deseadas o mejores. La guía detallada que se proporciona en este documento se aplica a todos los LLM de Amazon Bedrock.

El mejor enfoque de ingeniería de peticiones para su caso de uso depende tanto de la tarea como de los datos. Entre las tareas habituales que admiten los LLM en Amazon Bedrock se incluyen las siguientes:

Clasificación: la petición incluye una pregunta con varias opciones posibles de respuesta, y el modelo debe responder con la opción correcta. Un ejemplo de uso de clasificación es el análisis de sentimientos: la entrada es un pasaje de texto y el modelo debe clasificar el sentimiento del texto, por ejemplo, si es positivo o negativo, o inofensivo o tóxico.
Question-answer, sin contexto: el modelo debe responder a la pregunta con su conocimiento interno sin ningún contexto o documento.
Question-answer, con contexto: el usuario proporciona un texto de entrada con una pregunta y el modelo debe responder a la pregunta en función de la información proporcionada en el texto de entrada.
Resumen: la petición es un pasaje de texto y el modelo debe responder con un pasaje más corto que capture los puntos principales de la entrada.
Open-ended generación de texto: si se le solicita, el modelo debe responder con un pasaje del texto original que coincida con la descripción. Esto también incluye la generación de texto creativo, como cuentos, poemas o guiones de películas.
Generación de código: el modelo debe generar código en función de las especificaciones del usuario. Por ejemplo, una petición podría solicitar la generación de código de texto a SQL o Python.
Matemáticas: la entrada describe un problema que requiere un razonamiento matemático en algún nivel, que puede ser numérico, lógico, geométrico o de otro tipo.
Razonamiento o pensamiento lógico: el modelo debe hacer una serie de deducciones lógicas.
Extracción de entidades: la extracción de entidades puede extraer entidades en función de la pregunta de entrada proporcionada. Puede extraer entidades específicas del texto o de la entrada en función de su petición.
Chain-of-thought razonamiento: Razone paso a paso cómo se obtiene una respuesta en función de su mensaje.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Conceptos de ingeniería de peticiones

Enrutamiento de peticiones inteligente