Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Implementación de un caso de uso de Text independiente
Siga las step-by-step instrucciones de esta sección para configurar e implementar la solución en su cuenta.
Tiempo de implementación: aproximadamente de 10 a 30 minutos
-
Inicie sesión en la consola de administración de AWS
y seleccione el botón para lanzar la CloudFront plantilla que desea implementar. -
La plantilla se lanza en la región Este de EE. UU. (Norte de Virginia) de forma predeterminada. Para lanzar la solución en una región de AWS diferente, utilice el selector de regiones de la barra de navegación de la consola.
Nota: Esta solución utiliza Amazon Kendra y Amazon Bedrock, que actualmente no están disponibles en todas las regiones de AWS. Si utiliza estas funciones, debe lanzar esta solución en una región de AWS en la que estén disponibles estos servicios. Para obtener la disponibilidad más reciente por región, consulte la lista de servicios regionales de AWS
. -
En la página Crear pila *, compruebe que la URL de la plantilla correcta esté en el cuadro de texto *URL de Amazon S3 *y seleccione *Siguiente.
-
En la página *Especifique los detalles de la pila *, asigne un nombre a la pila de soluciones. Para obtener información sobre las limitaciones de nombres de caracteres, consulte los límites de IAM y STS en la Guía del usuario de AWS Identity and Access Management.
-
En Parámetros, revise los parámetros de esta plantilla de solución y modifíquelos según sea necesario. Esta solución utiliza los siguientes valores predeterminados.
UseCaseUUID (Identificador único universal)
<_Requires input_>36 caracteres UUIDv4 para identificar este caso de uso implementado en una aplicación.
UseCaseConfigRecordKey
<_Requires input_>Clave correspondiente al registro que contiene las configuraciones requeridas por el proveedor de chat Lambda en tiempo de ejecución. El registro de la tabla debe tener un atributo clave que coincida con este valor y un atributo de configuración que contenga la configuración deseada. La plataforma de despliegue rellenará este registro si está en uso. Para las implementaciones independientes de este caso de uso, se requiere una entrada creada manualmente en la tabla definida en UseCaseConfigTableName.
UseCaseConfigTableName
<_Requires input_>La pila leerá la configuración de la tabla con este nombre en la clave UseCaseConfigRecordKey
ExistingRestApiId
(Entrada opcional)
ID de API REST de API Gateway existente que se debe utilizar. Si no se proporciona, se creará una nueva API REST de API Gateway. Por lo general, se proporciona cuando se implementa desde el panel de implementación.
Nota: El uso de APIs Existing puede ayudar a reducir la duplicación de recursos y a simplificar la administración APIs cuando se necesitan implementar varios casos de uso independientes. Al suministrar los existentes APIs para un caso de uso independiente, usted es responsable de asegurarse de que la API esté configurada con las rutas requeridas con los modelos esperados. Es necesario configurar una ruta /details preconfigurada (que recopila los detalles del caso de uso durante el chat) y, opcionalmente, una ruta /feedback (si FeedbackEnabledestá configurada para
Yespermitir la recopilación de comentarios para las respuestas del chat de LLM). Además, y también se ExistingApiRootResourceIddebe proporcionar ExistingCognitoUserPoolId. ExistingCognitoGroupPolicyTableNameExistingApiRootResourceId
(Entrada opcional)
ID de recurso raíz de la API REST de API Gateway existente que se va a utilizar. El ID de recurso raíz de la API REST se puede obtener en la consola de AWS seleccionando el recurso raíz (/) en la sección «Recursos» de la API. A continuación, el ID del recurso se mostrará en el panel de detalles del recurso. También puedes ejecutar una llamada a la API de descripción en tu API REST para buscar el ID del recurso raíz.
FeedbackEnabled
NoSi se establece en No, la pila de casos de uso implementada no tendrá acceso a la función de comentarios.
ExistingModelInfoTableName
(Entrada opcional)
Nombre de tabla de DynamoDB para la tabla que contiene la información del modelo y los valores predeterminados. Lo utiliza la plataforma de despliegue. Si se omite, se creará una nueva tabla para alojar los valores predeterminados del modelo.
DefaultUserEmail
placeholder@example.comCorreo electrónico del usuario predeterminado para este caso de uso. Se crea un usuario de Amazon Cognito para este correo electrónico para acceder al caso de uso. Si no se proporciona, no se crearán el grupo ni el usuario de Cognito. También puede utilizarlos
placeholder@example.compara crear el grupo, pero no el usuario. Consulte la configuración manual del grupo de usuarios para obtener información sobre cómo configurar el grupo de usuarios.ExistingCognitoUserPoolId
(Entrada opcional)
UserPoolIdde un grupo de usuarios de Amazon Cognito existente con el que se autenticará este caso de uso. Por lo general, se proporciona cuando se implementa desde el panel de implementación, pero se puede omitir al implementar esta pila de casos de uso de forma independiente.
CognitoDomainPrefix
(Entrada opcional)
Introduzca un valor si desea proporcionar un dominio para el cliente del grupo de usuarios de Cognito. Si no proporciona un valor, la implementación generará uno.
ExistingCognitoUserPoolClient
(Entrada opcional)
Proporcione un cliente de grupo de usuarios (App Client) para usar uno existente. Si no proporciona un cliente de grupo de usuarios, se creará uno nuevo. Este parámetro solo se puede proporcionar si se proporciona un ID de grupo de usuarios existente.
ExistingCognitoGroupPolicyTableName
(Entrada opcional)
Nombre de la tabla de DynamoDB que contiene las políticas del grupo de usuarios. Lo utiliza el autorizador personalizado de la API del caso de uso. Por lo general, puede proporcionar una entrada al implementar desde la plataforma de implementación, pero puede omitirla cuando implementa esta pila de casos de uso de forma independiente.
RAGEnabled
trueSi se establece en true, la pila de casos de uso implementada utiliza el índice de Amazon Kendra proporcionado, creado para proporcionar la funcionalidad RAG. Si se establece en
false, el usuario interactúa directamente con el LLM.KnowledgeBaseType
Bedrock
Tipo de base de conocimientos que se utilizará para RAG. Configúrelo solo si lo RAGEnabled es
true. Puede ser Bedrock o Kendra.Nota: Solo es relevante si RAGEnabledes cierto.
ExistingKendraIndexId
(Entrada opcional)
ID de índice de un índice de Kendra existente que se utilizará en el caso de uso. Si no se proporciona ninguno y KnowledgeBaseTypees Kendra, se creará un nuevo índice para usted.
Nota: Solo es relevante si RAGEnabledes
truey KnowledgeBaseTypeesKendra.NewKendraIndexName
(Entrada opcional)
Nombre del nuevo índice de Kendra que se va a crear para este caso de uso. Solo se aplica si no ExistingKendraIndexIdse proporciona.
Nota: Solo es relevante si RAGEnabledes verdadera y KnowledgeBaseTypees Kendra.
NewKendraQueryCapacityUnits
0
Unidades de capacidad de consulta adicionales para el nuevo índice de Amazon Kendra que se va a crear para este caso de uso. Solo se aplica si no ExistingKendraIndexIdse suministra, consulte CapacityUnitsConfiguration.
Nota: Solo es relevante si RAGEnabledes
truey KnowledgeBaseTypeesKendra.NewKendraStorageCapacityUnits
0Unidades de capacidad de almacenamiento adicionales para el nuevo índice de Amazon Kendra que se va a crear para este caso de uso. Solo se aplica si no ExistingKendraIndexIdse suministra, consulte CapacityUnitsConfiguration.
Nota: Solo es relevante si RAGEnabledes
truey KnowledgeBaseTypeesKendra.NewKendraIndexEdition
(Entrada opcional)
La edición de Amazon Kendra que se utilizará en el nuevo índice de Amazon Kendra que se creará para este caso de uso. Solo se aplica si no ExistingKendraIndexIdse suministra, consulte Amazon Kendra Editions.
Nota: Solo es relevante si RAGEnabledes
truey KnowledgeBaseTypeesKendra.BedrockKnowledgeBaseId
(Entrada opcional)
ID de la base de conocimientos básica que se utilizará en un caso de uso de RAG. No se puede proporcionar si se proporciona ExistingKendraIndexIdo NewKendraIndexNamese proporciona.
Nota: Solo es relevante si RAGEnabledes
truey KnowledgeBaseTypeesBedrock.VpcEnabled
No¿Deberían implementarse los recursos de la pila en una VPC?
CreateNewVpc
NoSeleccione
Yesesta opción si desea que la solución cree una nueva VPC para usted y se utilice en este caso de uso.Nota: Solo es relevante si lo VpcEnabledes
Yes.IPAMPoolId
(Entrada opcional)
Si desea asignar el rango CIDR mediante el administrador de direcciones IP de Amazon VPC, proporcione el ID del grupo de IPAM que va a utilizar.
Nota: Solo es relevante si VpcEnabledes y es
Yes. CreateNewVpcNoExistingVpcId
(Entrada opcional)
ID de VPC de una VPC existente que se utilizará en el caso de uso.
Nota: Solo es relevante si VpcEnabledes
Yesy CreateNewVpces.NoExistingPrivateSubnetIds
(Entrada opcional)
Lista separada por comas de subredes IDs de subredes privadas existentes que se utilizarán para implementar la función Lambda.
Nota: Solo es relevante si VpcEnabledes y es.
YesCreateNewVpcNoExistingSecurityGroupIds
(Entrada opcional)
Lista separada por comas de los grupos de seguridad de la VPC existente que se utilizarán para configurar las funciones de Lambda.
Nota: Solo es relevante si VpcEnabledes y es
Yes. CreateNewVpcNoVpcAzs
(Entrada opcional)
Lista separada por comas de AZs en la que se crean las subredes del VPCs
Nota: Solo es relevante si VpcEnabledes
Yesy CreateNewVpces.NoUseInferenceProfile
NoSi el modelo configurado es Bedrock, puede indicar si está utilizando el perfil de inferencia de Bedrock. Esto garantizará que las políticas de IAM requeridas se configuren durante el despliegue del stack. Para obtener más información, consulte el siguiente archivo -region-inference.html https://docs.aws.amazon.com/bedrock/ latest/userguide/cross
Implemente la interfaz
Sí
Seleccione la opción de implementar la interfaz de usuario de la interfaz de usuario para esta implementación. Si selecciona No, solo se creará la infraestructura que alojará el procesamiento APIs, la autenticación y el APIs backend.
-
Elija Siguiente.
-
En la página Configurar opciones de pila, elija Siguiente.
-
En la página Revisar, revise y confirme la configuración. Seleccione la casilla para confirmar que la plantilla creará los recursos de AWS Identity and Access Management (IAM).
-
Elija Create stack (Crear pila) para implementar la pila.
Puede ver el estado de la pila en la CloudFormation consola de AWS en la columna Estado. Debería recibir el estado CREATE_COMPLETE en un plazo aproximado de 10 a 30 minutos.