As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usar um modelo reclassificador no Amazon Bedrock
É possível usar um modelo reclassificador diretamente ou ao recuperar resultados durante consultas à base de conhecimento. Escolha a guia correspondente ao método de sua preferência e siga as etapas:
- Console
-
Não é possível usar um modelo reclassificador diretamente no Console de gerenciamento da AWS, mas você pode usá-lo ao consultar sua base de conhecimento fazendo o seguinte:
-
Ao consultar uma base de conhecimento, abra o painel Configurações escolhendo o ícone
. -
Expanda a seção Reclassificação.
-
Escolha Selecionar modelo e escolha um modelo reclassificador.
-
Se seu perfil de serviço das Bases de Conhecimento do Amazon Bedrock não tiver permissões para usar o modelo reclassificador, selecione Atualizar perfil de serviço para modificar o perfil com as permissões adequadas.
-
(Opcional) Na seção Opções adicionais de reclassificação, modifique as opções necessárias.
-
Insira um prompt e selecione Executar. A resposta é o resultado obtido após a aplicação do modelo reclassificador.
Para obter instruções mais detalhadas sobre como realizar consultas à base de conhecimento, consulte Consultar uma base de conhecimento e recuperar dados e Consultar uma base de conhecimento e gerar respostas com base nos dados recuperados.
-
- API
-
Para obter instruções sobre como usar um modelo reclassificador durante a consulta à base de conhecimento, consulte Consultar uma base de conhecimento e recuperar dados e Consultar uma base de conhecimento e gerar respostas com base nos dados recuperados.
Para usar um modelo reclassificador diretamente com a API do Amazon Bedrock, envie uma solicitação Rerank com um endpoint de runtime do recurso Agentes para Amazon Bedrock.
Os seguintes campos são obrigatórios:
Campo Descrição básica queries Uma matriz de um único objeto RerankQuery. Especifique TEXTcomotypee inclua a consulta no campotextQuery.fontes Uma matriz de objetos RerankSource para enviar ao modelo reclassificador. Para cada RerankSource, especifiqueINLINEcomotypee inclua um objeto RerankDocument no campoinlineDocumentSource. Consulte abaixo para obter detalhesRerankDocument.rerankingConfiguration Inclui o nome do recurso da Amazon (ARN) do modelo reclassificador a ser usado, o número de resultados a serem obtidos após a reclassificação e, opcionalmente, as configurações de inferência do modelo. Especifique as configurações adicionais do modelo como pares de chave-valor. Para ter mais informações, consulte Rerank no site de documentação da Cohere. Os seguintes campos são opcionais:
Campo Caso de uso nextToken Um token exibido em uma resposta anterior que você pode incluir para fornecer o próximo lote de resultados. O formato do objeto
RerankSourceque você inclui depende do formato do documento. Para ver o formato dos diferentes tipos deRerankSource, escolha a guia que corresponde ao formato do documento:StringJSON object- String
Se o documento for uma string, especifique o valor do campo
typedo objeto RerankDocument comoTEXTe inclua o documento no campotext. Por exemplo:{ "inlineDocumentSource": { "textDocument": { "text": "string" }, "type": "TEXT" }, "type": "INLINE" }- JSON object
Se o documento for um objeto JSON, especifique o valor do campo
typeno objeto RerankDocument comoJSONe inclua o documento no campojsonDocument. Por exemplo:{ "inlineDocumentSource": { "jsonDocument": JSON value, "type": "JSON" }, "type": "INLINE" }
A resposta à sua solicitação
Rerankexibe uma lista de objetos RerankResult no camporesults. Cada objeto contém os seguintes campos:-
document: inclui informações sobre o documento que você enviou. -
relevanceScore: uma pontuação de relevância para o documento, atribuída pelo modelo reclassificador. -
index: indica a classificação do documento em relação aos outros documentos na lista. Quanto menor a pontuação, maior a classificação.
Se houver muitos resultados para exibir, a resposta exibirá um valor no campo
nextToken. Nesse caso, para ver o próximo lote de resultados, inclua esse token em uma solicitação subsequente.