

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Uso da solução
<a name="use-the-solution"></a>

## Acessando a interface do usuário
<a name="accessing-the-ui"></a>

Durante o processo de implantação da pilha (tanto para o painel de implantação quanto para os casos de uso), um e-mail é enviado para o endereço de e-mail configurado. O e-mail contém as credenciais temporárias do usuário que ele pode usar para se inscrever e acessar a interface da web.

**nota**  
O DevOps usuário com acesso ao AWS Management Console deve fornecer ao usuário administrador a CloudFront URL da interface do usuário do painel de implantação quando a pilha for concluída.

Para os casos de uso, o usuário administrador com acesso à interface do usuário do painel de implantação deve fornecer ao usuário comercial a CloudFront URL da interface do usuário do caso de uso quando a implantação for concluída.

Uma vez logado, o usuário pode interagir com a solução UIs, seja no painel de implantação, no caso de administradores, ou no caso de uso, no caso de usuários corporativos.

## Como atualizar uma implantação
<a name="how-to-update-a-deployment"></a>

Quando estiver na página inicial do painel de implantação (ou na página de detalhes de uma implantação), você pode editar a configuração usada por uma implantação. Você só pode editar implantações que estejam nos status CREATE\$1COMPLETE ou UPDATE\$1COMPLETE.

Com exceção do nome do caso de uso, todas as outras opções são editáveis para uma implantação. Basta alterar os valores que você deseja editar e reimplantar.

Dependendo do escopo das edições feitas, o tempo de redistribuição variará. Pode levar alguns segundos se configurações simples tiverem sido alteradas (por exemplo, parâmetros do modelo), até mais de 30 minutos se opções maiores relacionadas à infraestrutura tiverem sido alteradas (exemplo, solicitação para criar o índice Amazon Kendra para o caso de uso de texto RAG).

Depois que a edição for concluída com sucesso, o status do aplicativo relatará um status UPDATE\$1COMPLETE. No momento, você pode acessar a interface implantada por meio da CloudFront URL e interagir com a implantação modificada.

**nota**  
Talvez seja mais fácil executar várias implantações side-by-side se você quiser comparar configurações diferentes ou LLMs. Use o recurso **Clone** para usar rapidamente uma configuração existente para iniciar uma nova implantação.

## Como clonar uma implantação
<a name="how-to-clone-a-deployment"></a>

Quando estiver na página inicial do painel de Implantações (ou na página de detalhes de uma implantação), você pode clonar a configuração usada por uma implantação. A clonagem de uma implantação inicia o assistente **Deploy new use case**, mas com a maioria dos campos pré-preenchidos com os mesmos valores.

Essa é uma operação conveniente para ajudá-lo a duplicar rapidamente implantações com configurações alteradas, reviver uma implantação excluída ou comparar várias implantações LLMs idênticas.

## Como excluir uma implantação
<a name="how-to-delete-a-deployment"></a>

Quando estiver na página inicial do painel de Implantações (ou na página de detalhes de uma implantação), você poderá excluí-la quando não precisar mais da implantação. A exclusão de uma implantação invoca uma operação de exclusão de CloudFormation pilha e desprovisiona os recursos para a implantação.

Por padrão, uma implantação excluída ainda permanece no painel para ativar a funcionalidade de clonagem. Para remover completamente uma implantação do painel para que ela deixe de ser rastreada na interface do usuário, escolha **Excluir permanentemente** na janela de confirmação de exclusão.

**Importante**  
Alguns recursos são deixados para trás durante a exclusão da pilha e devem ser excluídos manualmente. Consulte a seção [Desinstalação manual](uninstall-the-solution.md#manual-uninstall-sub-topics) para obter detalhes sobre quais recursos são retidos e como limpá-los.

## Usando o Amazon SageMaker AI como um provedor de LLM
<a name="using-amazon-sagemaker-ai-as-an-llm-provider"></a>

A partir da versão 1.3.0, o [Amazon SageMaker AI](https://aws.amazon.com/sagemaker/) está disponível como provedor de modelos para casos de uso de texto. Esse recurso permite que você use um endpoint de inferência de SageMaker IA já existente na conta da AWS na solução. Aqui estão algumas maneiras de começar.

**Importante**  
A solução não gerencia o ciclo de vida de seus endpoints de SageMaker IA. Você é responsável por excluir os endpoints de SageMaker IA quando eles não forem mais necessários para parar de incorrer em cobranças adicionais.

### Criação de um endpoint de SageMaker IA
<a name="creating-a-sagemaker-endpoint"></a>

Você pode usar o [Amazon SageMaker AI JumpStart](https://aws.amazon.com/sagemaker/jumpstart/) para implantar rapidamente um endpoint.

Você também pode usar um endpoint de SageMaker IA baseado em geração de texto e implantar usando o serviço básico SageMaker de IA. Consulte a [ JumpStart documentação de SageMaker IA](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html) para obter um guia passo a passo sobre [como implantar um modelo](https://docs.aws.amazon.com/sagemaker/latest/dg/jumpstart-deploy.html) para inferência.

**nota**  
 models/LLMs As bases geralmente são muito grandes e geralmente podem exigir o uso de grandes instâncias de computação acelerada. Muitas dessas instâncias maiores podem não estar disponíveis por padrão em sua conta da AWS. Consulte as [cotas de SageMaker IA](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html#limits_sagemaker) padrão e certifique-se de [solicitar um aumento de cota](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html) antes da implantação para evitar falhas comuns de implantação.

#### Use o endpoint de SageMaker IA para criar uma implantação de caso de uso de texto
<a name="use-endpoint-to-create-a-text-use-case-deployment"></a>

Para implantar um novo caso de uso de texto usando um endpoint de SageMaker IA para inferência:

1.  [Crie um novo caso de uso](step-2-deploy-use-case.md) por meio do assistente do painel de implantação e preencha os formulários até chegar à página de seleção de modelos.

1. Na página Modelos, selecione **SageMaker AI** como fornecedora de modelos. Isso gerará um formulário personalizado que exige três partes principais de entrada do usuário:
   + O nome do endpoint de SageMaker IA que você deseja usar. DevOps os usuários podem obter isso no console da AWS. Observe que o endpoint deve estar na mesma conta e região em que a solução está implantada.

      **Localização do nome do endpoint no console da AWS**   
![\[imagem 15\]](http://docs.aws.amazon.com/pt_br/solutions/latest/generative-ai-application-builder-on-aws/images/image15.png)
   + O esquema da carga de entrada esperada pelo endpoint. Para oferecer suporte ao maior conjunto de endpoints, os usuários administradores precisam informar à solução como o endpoint espera que a entrada seja formatada. No assistente de seleção de modelo, forneça o esquema JSON para a solução ser enviada ao endpoint. Você pode adicionar espaços reservados para injetar valores estáticos e dinâmicos na carga útil da solicitação. As opções disponíveis são:
     + Espaços reservados obrigatórios:\$1 < <prompt\$1 >\$1\$1 > serão substituídos dinamicamente pela entrada completa (por exemplo, histórico, contexto e entrada do usuário de acordo com o modelo de prompt) a ser enviada ao endpoint de SageMaker IA em tempo de execução.
     + Espaços reservados opcionais:\$1 < <temperature\$1 >\$1\$1 > \$1,\$1 \$1, bem como quaisquer parâmetros definidos nos parâmetros avançados do modelo, podem ser fornecidos ao endpoint. Qualquer string contendo um espaço reservado entre\$1 <\$1 < and\$1 >\$1 > (por exemplo,\$1 <\$1 <max\$1new\$1tokens\$1 >\$1 >) será substituída pelo valor do parâmetro de modelo avançado com o mesmo nome.

        **Exemplo de esquema de entrada - definindo campos obrigatórios, aviso e temperatura, junto com um parâmetro avançado personalizado, max\$1new\$1tokens. O caminho de saída deve ser fornecido como uma JSONPath string válida**   
![\[imagem 16\]](http://docs.aws.amazon.com/pt_br/solutions/latest/generative-ai-application-builder-on-aws/images/image16.png)

1. A localização da resposta de string LLMs gerada na carga de saída. Isso deve ser fornecido como uma JSONPath expressão para indicar onde se espera que a resposta de texto final mostrada aos usuários seja acessada de dentro do objeto de retorno e da resposta do endpoint.

    **Exemplo de adição de parâmetros de modelo avançados para uso no esquema de entrada de SageMaker IA (consulte a Figura 2 para ver as opções/configurações anteriores)**   
![\[imagem 17\]](http://docs.aws.amazon.com/pt_br/solutions/latest/generative-ai-application-builder-on-aws/images/image17.png)

**nota**  
SageMaker Agora, a IA oferece suporte à hospedagem de vários modelos no mesmo endpoint, e essa é a configuração padrão ao implantar um endpoint na versão atual do SageMaker AI Studio (não no Studio Classic).  
Se seu endpoint estiver configurado dessa forma, você deverá adicionar **InferenceComponentName**à seção de parâmetros avançados do modelo, um valor correspondente ao nome do modelo que você deseja usar.