Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
¿Qué es la ingeniería de peticiones?
La ingeniería rápida se refiere a la práctica de crear y optimizar las indicaciones de entrada mediante la selección de las palabras, frases, oraciones, signos de puntuación y caracteres separadores adecuados LLMs para utilizarlos de forma eficaz en una amplia variedad de aplicaciones. En otras palabras, la ingeniería de peticiones es el arte de comunicarse con un LLM. Las peticiones de alta calidad condicionan al LLM para generar las respuestas deseadas o mejores. La guía detallada que se proporciona en este documento se aplica a todos los componentes LLMs de Amazon Bedrock.
El mejor enfoque de ingeniería de peticiones para su caso de uso depende tanto de la tarea como de los datos. Entre las tareas habituales compatibles con LLMs Amazon Bedrock se incluyen las siguientes:
-
Clasificación: la petición incluye una pregunta con varias opciones posibles de respuesta, y el modelo debe responder con la opción correcta. Un ejemplo de uso de clasificación es el análisis de sentimientos: la entrada es un pasaje de texto y el modelo debe clasificar el sentimiento del texto, por ejemplo, si es positivo o negativo, o inofensivo o tóxico.
-
Pregunta-respuesta, sin contexto: el modelo debe responder a la pregunta con su conocimiento interno sin ningún contexto ni documento.
-
Pregunta-respuesta, con contexto: el usuario proporciona un texto de entrada con una pregunta y el modelo debe responder a la pregunta en función de la información proporcionada en el texto de entrada.
-
Resumen: la petición es un pasaje de texto y el modelo debe responder con un pasaje más corto que capture los puntos principales de la entrada.
-
Generación de texto abierto: ante una petición, el modelo debe responder con un pasaje del texto original que coincida con la descripción. Esto también incluye la generación de texto creativo, como cuentos, poemas o guiones de películas.
-
Generación de código: el modelo debe generar código en función de las especificaciones del usuario. Por ejemplo, un mensaje podría solicitar text-to-SQL la generación de código Python.
-
Matemáticas: la entrada describe un problema que requiere un razonamiento matemático en algún nivel, que puede ser numérico, lógico, geométrico o de otro tipo.
-
Razonamiento o pensamiento lógico: el modelo debe hacer una serie de deducciones lógicas.
-
Extracción de entidades: la extracción de entidades puede extraer entidades en función de la pregunta de entrada proporcionada. Puede extraer entidades específicas del texto o de la entrada en función de su petición.
-
Chain-of-thought razonamiento: step-by-step razona cómo se obtiene una respuesta en función de tu pregunta.