Configuración de sus indicaciones

El asistente del panel de implementación incluye un paso de configuración rápida que le permite personalizar la experiencia y la plantilla que guiarán las interacciones entre los usuarios y el modelo de IA. La configuración adecuada de estos ajustes es crucial para obtener respuestas precisas y relevantes del asistente de IA.

Esta sección controla la experiencia y el comportamiento generales del mensaje de la IA.

Longitud máxima de la plantilla de mensaje: esta configuración determina la longitud máxima (en caracteres) de la plantilla de mensaje. Un valor más alto permite proporcionar más contexto al modelo de IA, lo que podría generar respuestas más precisas. Sin embargo, las indicaciones excesivamente largas también pueden generar ruido y afectar negativamente al rendimiento. Para los modelos Amazon Bedrock, los valores predeterminados de la longitud máxima de la plantilla de solicitud (en caracteres) se calculan utilizando los límites de token del modelo subyacente. Si edita y cambia el nombre de un modelo en Bedrock, aparece resaltado el botón «Restablecer los valores predeterminados», que puede utilizarse para adoptar los valores predeterminados del modelo recién seleccionado. Para los modelos de Amazon SageMaker AI, se proporcionan valores predeterminados razonables, pero se recomienda comprobar el modelo subyacente y elegir la longitud máxima de la plantilla de solicitud e introducir las longitudes de texto en consecuencia. Consulte la sección Consejos para gestionar los límites de los tokens de los modelos para obtener más información.
Longitud máxima del texto de entrada: esta configuración limita la longitud máxima (en caracteres) del texto introducido por el usuario. Las entradas más largas pueden contener información irrelevante, lo que aumenta el riesgo de obtener respuestas irrelevantes o inexactas del modelo de IA.
Edición de mensajes de usuario: esta opción permite activar o desactivar la posibilidad de que los usuarios modifiquen la plantilla de mensajes a través de la interfaz de usuario del chat. La desactivación de esta función puede ayudar a mantener la coherencia y evitar cambios no deseados en el mensaje.

Plantilla de solicitud

Esta sección le permite definir la plantilla de solicitud real que utilizará el modelo de IA. La plantilla de mensajes suele seguir una estructura que incluye marcadores de posición para varios componentes, como la entrada del usuario, los pasajes de referencia y el historial de chat.

Plantilla de mensaje: es el área de texto principal donde puedes escribir o pegar la plantilla de mensaje que desees. La plantilla debe diseñarse para proporcionar el contexto y las instrucciones necesarios para el modelo de IA. Por lo general, incluye los siguientes marcadores de posición:
- {input}: Este marcador de posición es obligatorio para las implementaciones de Sagemaker AI y se sustituirá por la entrada o consulta del usuario.
- {history}: Este marcador de posición es obligatorio para las implementaciones de Sagemaker AI y se sustituirá por el historial de chat de la conversación actual.
- {context}: Este marcador de posición es obligatorio para las implementaciones de RAG y se sustituirá por los extractos del documento obtenidos de la base de conocimientos configurada.
¿Reformular la pregunta? : Esta opción (disponible solo para las implementaciones de RAG) determina si la consulta de entrada original del usuario debe reformularse o desambiguarse antes de pasarla al modelo de IA. Reformular la consulta a veces puede ayudar al modelo a comprender mejor la intención del usuario, lo que podría generar respuestas más precisas.

Al configurar la plantilla y la experiencia del mensaje, es fundamental lograr un equilibrio entre proporcionar suficiente contexto e instrucciones al modelo de IA y, al mismo tiempo, evitar información excesivamente larga o irrelevante que pueda provocar ruido o problemas de rendimiento.

Configuración avanzada de los mensajes

Esta sección le permite controlar cómo se presenta el historial de conversaciones en el modelo de IA.

Tamaño del historial final: esta configuración determina el número de mensajes anteriores que se deben incluir en el mensaje final. Si se establece este valor en cero, no se incorporará ningún historial ni en la plantilla de mensaje ni en la plantilla de mensaje de desambiguación. Tenga en cuenta que, incluso si se establece en cero, es necesario que exista un marcador de posición de {historial} en las plantillas de mensajes. En tiempo de ejecución, se reemplazará por una cadena vacía.
- Nota: Se recomienda proporcionar un número par para este valor. Si se proporciona un número impar, solo se devolverá la respuesta de la IA de una interacción emparejada.
Prefijo humano: es el prefijo que se utiliza para identificar los mensajes enviados por el usuario en el historial de conversaciones.
Prefijo de IA: es el prefijo que se utiliza para identificar los mensajes devueltos por el modelo de IA en el historial de conversaciones.

Configuración del aviso de desambiguación

Esta sección le permite configurar el comportamiento y la plantilla para eliminar la ambigüedad de las entradas de los usuarios antes de enviarlas a la base de conocimientos configurada.

Habilitar la desambiguación: esta opción determina si las entradas del usuario deben desambiguarse antes de enviarlas a la base de conocimientos.
Plantilla de mensaje de desambiguación: esta es la plantilla de mensaje que se utiliza para eliminar la ambigüedad de las entradas de los usuarios cuando se conecta a una base de conocimientos. El resultado generado a partir de este mensaje se utilizará como consulta enviada a la base de conocimientos. Al deshabilitar la desambiguación, la consulta sin procesar del usuario se enviaría a la base de conocimientos sin cambios.

Por ejemplo, con la desambiguación habilitada, una consulta de seguimiento del usuario sobre «¿Cuánto cuesta?» podría desambiguarse y convertirse en «¿Cuánto cuesta renovar mi matrícula?» , lo que permite una mejor consulta de búsqueda.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Configuración avanzada de la base de conocimientos

Utilizando el caso de uso de Text implementado