View a markdown version of this page

Implantando um caso de uso de texto independente - Criador de aplicações de IA generativa na AWS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Implantando um caso de uso de texto independente

Siga as step-by-step instruções nesta seção para configurar e implantar a solução em sua conta.

Tempo de implantação: aproximadamente 10 a 30 minutos

  1. Faça login no AWS Management Console e selecione o botão para iniciar o CloudFront modelo que você deseja implantar.

    BedrockChat.modelo Launch solution

    SageMakerChat.modelo

    Launch solution

  2. Por padrão, esse modelo é iniciado na região Leste dos EUA (Norte da Virgínia). Para iniciar a solução em outra região da AWS, use o seletor de Região na barra de navegação do console.

    Observação: essa solução usa o Amazon Kendra e o Amazon Bedrock, que atualmente não estão disponíveis em todas as regiões da AWS. Se estiver usando esses recursos, você deve iniciar essa solução em uma região da AWS onde esses serviços estejam disponíveis. Para obter a disponibilidade mais atual por região, consulte a Lista de serviços regionais da AWS.

  3. Na página Criar pilha *, verifique se o URL do modelo correto está na caixa de texto *URL do Amazon S3 *e escolha *Avançar.

  4. Na página *Especificar detalhes da pilha*, atribua um nome à sua pilha de soluções. Para obter informações sobre limitações de nomes de caracteres, consulte Limites do IAM e do STS no Guia do usuário do AWS Identity and Access Management.

  5. Em Parâmetros, revise os parâmetros do modelo dessa solução e modifique-os conforme requerido. Esta solução usa os seguintes valores padrão.

    UseCaseUUID

    <_Requires input_>

    36 caracteres UUIDv4 para identificar esse caso de uso implantado em um aplicativo.

    UseCaseConfigRecordKey

    <_Requires input_>

    Chave correspondente ao registro contendo as configurações exigidas pelo provedor de bate-papo Lambda em tempo de execução. O registro na tabela deve ter um atributo-chave correspondente a esse valor e um atributo de configuração contendo a configuração desejada. Esse registro será preenchido pela plataforma de implantação se estiver em uso. Para implantações autônomas desse caso de uso, é necessária uma entrada criada manualmente na tabela UseCaseConfigTableNamedefinida em.

    UseCaseConfigTableName

    <_Requires input_>

    A pilha lerá a configuração da tabela com esse nome na chave UseCaseConfigRecordKey

    ExistingRestApiId

    (Entrada opcional)

    ID da API REST da API Gateway existente a ser usada. Se não for fornecida, uma nova API REST do API Gateway será criada. Normalmente fornecido durante a implantação a partir do painel de implantação.

    Observação: usar o APIs Existing pode ajudar a reduzir a duplicação de recursos e simplificar o gerenciamento de APIs quando você precisa implantar vários casos de uso autônomos. Ao fornecer o existente APIs para um caso de uso independente, você é responsável por garantir que a API seja configurada com as rotas necessárias com os modelos esperados. Uma rota /details pré-configurada necessária (busca detalhes do caso de uso durante o bate-papo) e, opcionalmente, uma rota /feedback (se FeedbackEnabledestiver definida como para permitir a coleta de feedback Yes para respostas de bate-papo do LLM) deve ser configurada. Além disso ExistingApiRootResourceId,, ExistingCognitoUserPoolIde também ExistingCognitoGroupPolicyTableNamedeve ser fornecido.

    ExistingApiRootResourceId

    (Entrada opcional)

    ID de recurso raiz da API Gateway REST existente a ser usado. O ID do recurso raiz da API REST pode ser obtido no console da AWS selecionando o recurso raiz (/) na seção “Recursos” da API. A ID do recurso será então exibida no painel de detalhes do recurso. Como alternativa, você pode executar uma chamada de descrição da API em sua API REST para encontrar o ID do recurso raiz.

    FeedbackEnabled

    No

    Se definido como Não, a pilha de casos de uso implantada não terá acesso ao recurso de feedback.

    ExistingModelInfoTableName

    (Entrada opcional)

    Nome da tabela do DynamoDB para a tabela que contém informações e padrões do modelo. Usado pela plataforma de implantação. Se omitida, uma nova tabela será criada para abrigar os padrões do modelo.

    DefaultUserEmail

    placeholder@example.com

    E-mail do usuário padrão para esse caso de uso. Um usuário do Amazon Cognito para esse e-mail é criado para acessar o caso de uso. Se não for fornecido, o Grupo e o Usuário do Cognito não serão criados. Você também pode usar placeholder@example.com para criar o Grupo, mas não o Usuário. Consulte Configuração manual do grupo de usuários para obter informações sobre como configurar seu grupo de usuários.

    ExistingCognitoUserPoolId

    (Entrada opcional)

    UserPoolIdde um grupo de usuários existente do Amazon Cognito com o qual esse caso de uso será autenticado. Normalmente é fornecido durante a implantação a partir do painel de implantação, mas pode ser omitido ao implantar essa pilha de casos de uso de forma independente.

    CognitoDomainPrefix

    (Entrada opcional)

    Insira um valor se quiser fornecer um domínio para o Cognito User Pool Client. Se você não fornecer um valor, a implantação gerará um.

    ExistingCognitoUserPoolClient

    (Entrada opcional)

    Forneça um cliente de grupo de usuários (App Client) para usar um existente. Se você não fornecer um cliente de grupo de usuários, um novo será criado. Esse parâmetro só pode ser fornecido se um ID de grupo de usuários existente for fornecido.

    ExistingCognitoGroupPolicyTableName

    (Entrada opcional)

    Nome da tabela do DynamoDB contendo políticas de grupos de usuários. Isso é usado pelo autorizador personalizado na API do caso de uso. Normalmente, você pode fornecer uma entrada ao implantar a partir da plataforma de implantação, mas pode ser omitida ao implantar essa pilha de casos de uso de forma independente.

    RAGEnabled

    true

    Se definida como verdadeira, a pilha de casos de uso implantada usa o índice Amazon Kendra fornecido, criado para fornecer a funcionalidade RAG. Se definido comofalse, o usuário interage diretamente com o LLM.

    KnowledgeBaseType

    Bedrock

    Tipo de base de conhecimento a ser usado para RAG. Defina apenas se RAGEnabled estivertrue. Pode ser Bedrock ou Kendra.

    Nota: Só é relevante se RAGEnabledfor verdade.

    ExistingKendraIndexId

    (Entrada opcional)

    ID do índice de um índice Kendra existente a ser usado para o caso de uso. Se nenhum for fornecido e KnowledgeBaseTypefor Kendra, um novo índice será criado para você.

    Nota: Só é relevante se RAGEnabledé true e KnowledgeBaseTypeéKendra.

    NewKendraIndexName

    (Entrada opcional)

    Nome do novo índice Kendra a ser criado para esse caso de uso. Só se aplica se não ExistingKendraIndexIdfor fornecido.

    Nota: Só é relevante se RAGEnabledfor verdade e KnowledgeBaseTypefor Kendra.

    NewKendraQueryCapacityUnits

    0

    Unidades adicionais de capacidade de consulta para o novo índice Amazon Kendra a serem criadas para esse caso de uso. Só se aplica se não ExistingKendraIndexIdfor fornecido, consulte CapacityUnitsConfiguration.

    Nota: Só é relevante se RAGEnabledé true e KnowledgeBaseTypeéKendra.

    NewKendraStorageCapacityUnits

    0

    Unidades adicionais de capacidade de armazenamento para o novo índice Amazon Kendra a serem criadas para esse caso de uso. Só se aplica se não ExistingKendraIndexIdfor fornecido, consulte CapacityUnitsConfiguration.

    Nota: Só é relevante se RAGEnabledé true e KnowledgeBaseTypeéKendra.

    NewKendraIndexEdition

    (Entrada opcional)

    A edição do Amazon Kendra a ser usada para o novo índice Amazon Kendra a ser criado para esse caso de uso. Só se aplica se não ExistingKendraIndexIdfor fornecido, consulte as edições Amazon Kendra.

    Nota: Só é relevante se RAGEnabledé true e KnowledgeBaseTypeéKendra.

    BedrockKnowledgeBaseId

    (Entrada opcional)

    ID da base de conhecimento fundamental a ser usada em um caso de uso do RAG. Não podem ser fornecidos se ExistingKendraIndexIdou NewKendraIndexNameforem fornecidos.

    Nota: Só é relevante se RAGEnabledé true e KnowledgeBaseTypeéBedrock.

    VpcEnabled

    No

    Os recursos das pilhas devem ser implantados em uma VPC.

    CreateNewVpc

    No

    SelecioneYes, se quiser que a solução crie uma nova VPC para você e seja usada para esse caso de uso.

    Nota: Só é relevante se VpcEnabledforYes.

    IPAMPoolId

    (Entrada opcional)

    Se você quiser atribuir o intervalo CIDR usando o Amazon VPC IP Address Manager, forneça o ID do pool IPAM a ser usado.

    Nota: Só é relevante se VpcEnabledé Yes e CreateNewVpcéNo.

    ExistingVpcId

    (Entrada opcional)

    ID da VPC de uma VPC existente a ser usada para o caso de uso.

    Nota: Só é relevante se VpcEnabledé Yes e CreateNewVpcéNo.

    ExistingPrivateSubnetIds

    (Entrada opcional)

    Lista separada por vírgula IDs de sub-redes privadas existentes a serem usadas para implantar a função Lambda.

    Nota: Só é relevante se VpcEnabledé Yes e CreateNewVpcéNo.

    ExistingSecurityGroupIds

    (Entrada opcional)

    Lista separada por vírgulas de grupos de segurança da VPC existente a ser usada para configurar funções Lambda.

    Nota: Só é relevante se VpcEnabledé Yes e CreateNewVpcéNo.

    VpcAzs

    (Entrada opcional)

    Lista separada por vírgula AZs de onde as sub-redes do são criadas VPCs

    Nota: Só é relevante se VpcEnabledé Yes e CreateNewVpcéNo.

    UseInferenceProfile

    No

    Se o modelo configurado for Bedrock, você poderá indicar se está usando o Bedrock Inference Profile. Isso garantirá que as políticas de IAM necessárias sejam configuradas durante a implantação da pilha. Para obter mais detalhes, consulte o seguinte https://docs.aws.amazon.com/bedrock/ latest/userguide/cross -region-inference.html

    Implantar UI

    Sim

    Selecione a opção para implantar a interface de usuário de front-end para essa implantação. Selecionar Não criará apenas a infraestrutura para hospedar o APIs, a autenticação do e o APIs processamento de back-end.

  6. Escolha Avançar.

  7. Na página Configurar opções de pilha, selecione Avançar.

  8. Na página Revisar, verifique e confirme as configurações. Selecione a caixa confirmando que o modelo criará recursos do AWS Identity and Access Management (IAM).

  9. Selecione Create stack (Criar pilha) para implantar a pilha.

Você pode ver o status da pilha no CloudFormation console da AWS na coluna Status. Você deve receber o status CREATE_COMPLETE em aproximadamente 10 a 30 minutos.