As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurando seus prompts
O assistente do painel de implantação tem uma etapa de configuração imediata que permite que você personalize a experiência imediata e o modelo que orientará as interações entre os usuários e o modelo de IA. Definir adequadamente essas configurações é crucial para obter respostas precisas e relevantes do assistente de IA.
Esta seção controla a experiência geral e o comportamento do prompt de IA.
-
Tamanho máximo do modelo de solicitação: essa configuração determina o tamanho máximo (em caracteres) do modelo de solicitação. Um valor mais alto permite que mais contexto seja fornecido ao modelo de IA, potencialmente levando a respostas mais precisas. No entanto, avisos excessivamente longos também podem introduzir ruído e afetar negativamente o desempenho. Para modelos Amazon Bedrock, os valores padrão para o tamanho máximo do modelo de solicitação (em caracteres) são calculados usando os limites do token do modelo subjacente. Se você editar e alterar o nome de um modelo no Bedrock, o botão “Redefinir para o padrão” será destacado e poderá ser usado para adotar os padrões do modelo recém-selecionado. Para modelos de SageMaker IA da Amazon, valores padrão razoáveis são fornecidos, mas é recomendável que você verifique seu modelo subjacente e escolha o tamanho máximo do modelo de solicitação e os comprimentos de texto de entrada de acordo. Consulte a seção Dicas para gerenciar os limites de tokens do modelo para obter mais informações.
-
Tamanho máximo do texto de entrada: essa configuração limita o tamanho máximo (em caracteres) do texto de entrada do usuário. Entradas mais longas podem conter informações irrelevantes, aumentando o risco de obter respostas irrelevantes ou imprecisas do modelo de IA.
-
Edição do prompt do usuário: essa opção permite que você ative ou desative a capacidade de os usuários modificarem o modelo do prompt por meio da interface do usuário do Chat. Desativar esse recurso pode ajudar a manter a consistência e evitar alterações não intencionais no prompt.
Modelo de prompt
Esta seção permite que você defina o modelo de prompt real que será usado pelo modelo de IA. O modelo de prompt normalmente segue uma estrutura que inclui espaços reservados para vários componentes, como a entrada do usuário, passagens de referência e histórico de bate-papo.
-
Modelo de prompt: essa é a área de texto principal na qual você pode escrever ou colar o modelo de prompt desejado. O modelo deve ser criado para fornecer o contexto e as instruções necessários para o modelo de IA. Normalmente, inclui os seguintes espaços reservados:
-
{input}: esse espaço reservado é obrigatório para implantações do Sagemaker AI e será substituído pela entrada ou consulta do usuário. -
{history}: Esse espaço reservado é obrigatório para implantações do Sagemaker AI e será substituído pelo histórico de bate-papo da conversa atual. -
{context}: Esse espaço reservado é obrigatório para implantações do RAG e será substituído pelos trechos do documento obtidos da base de conhecimento configurada.
-
-
Reformular a pergunta? : essa opção (disponível somente para implantações de RAG) determina se a consulta de entrada original do usuário deve ser reformulada ou desambiguada antes de ser passada para o modelo de IA. Às vezes, reformular a consulta pode ajudar o modelo a entender melhor a intenção do usuário, o que pode levar a respostas mais precisas.
Ao configurar o modelo e a experiência do prompt, é essencial encontrar um equilíbrio entre fornecer contexto e instruções suficientes ao modelo de IA e, ao mesmo tempo, evitar informações excessivamente longas ou irrelevantes que possam causar problemas de ruído ou desempenho.
Configurações avançadas de prompt
Esta seção permite controlar como o histórico de conversas é apresentado ao modelo de IA.
-
Tamanho do histórico final: essa configuração determina o número de mensagens anteriores que devem ser incluídas no prompt final. Definir esse valor como zero resultaria em nenhum histórico sendo injetado no modelo de prompt ou no modelo de prompt de desambiguação. Observação: mesmo quando definido como zero, ainda é necessário que exista um espaço reservado {history} nos modelos de prompt. Em tempo de execução, ele será substituído por uma string vazia.
-
Nota: É recomendável fornecer um número par para esse valor. Fornecer um número ímpar resultaria no retorno apenas da resposta de IA de uma interação pareada.
-
-
Prefixo humano: é o prefixo usado para identificar as mensagens enviadas pelo usuário no histórico de conversas.
-
Prefixo de IA: é o prefixo usado para identificar mensagens retornadas pelo modelo de IA no histórico de conversas.
Configuração do prompt de desambiguação
Esta seção permite configurar o comportamento e o modelo para eliminar a ambiguidade das entradas do usuário antes de enviá-las para a base de conhecimento configurada.
-
Ativar desambiguação: essa opção determina se as entradas do usuário devem ser desambiguadas antes de serem enviadas para a base de conhecimento.
-
Modelo de aviso de desambiguação: Esse é o modelo de aviso usado para eliminar a ambiguação das entradas do usuário quando conectado a uma base de conhecimento. A saída gerada a partir desse prompt será usada como a consulta enviada à base de conhecimento. A desativação da desambiguação resultaria no envio inalterado da consulta bruta do usuário para a base de conhecimento.
Por exemplo, com a desambiguação ativada, um usuário de acompanhamento pergunta “Quanto custa?” pode ser desambiguado para “Quanto custa renovar minha placa?” , levando a uma melhor consulta de pesquisa.