Saiba mais sobre os casos de uso para diferentes métodos de inferência do modelo.

É possível executar a inferência de modelos diretamente das seguintes maneiras:

Método	Caso de uso
Playgrounds do console do Amazon Bedrock	Execute inferências em uma interface gráfica fácil de usar. Conveniente para exploração.
Converse ou ConverseStream	Implemente aplicações conversacionais com uma API unificada para entrada de modelo.
InvokeModel ou InvokeModelWithResponseStream	Envie um único prompt e gere uma resposta de forma síncrona. Útil para gerar respostas em tempo real ou para consultas de pesquisa.
StartAsyncInvoke	Envie um único prompt e gere uma resposta de forma assíncrona. Útil para gerar respostas em grande escala.
CreateModelInvocationJob	Prepare um conjunto de dados de prompts e gere respostas em lote.
API de respostas	Use a API de respostas para aplicativos modernos e agentes que exigem o uso de ferramentas integradas (pesquisa, interpretador de código), entradas multimodais e conversas com estado.
Conclusões de bate-papo	Use a API Chat Completions para tarefas leves, sem estado e focadas em texto, nas quais você precisa de controle total sobre o gerenciamento do histórico de bate-papo e menor latência.

Os seguintes recursos do Amazon Bedrock também usam a inferência de modelos como uma etapa em um fluxo de trabalho maior:

A avaliação do modelo usa o processo de invocação do modelo para avaliar o desempenho de diferentes modelos após o envio de uma CreateEvaluationJobsolicitação.
As bases de conhecimento usam a invocação do modelo ao usar a API RetrieveAndGenerate para gerar uma resposta com base nos resultados recuperados de uma base de conhecimento.
Os agentes usam a invocação do modelo para gerar respostas em vários estágios durante uma solicitação InvokeAgent.
Os fluxos incluem recursos do Amazon Bedrock, como prompts, bases de conhecimento e agentes, que usam a invocação de modelo.

Depois de testar diferentes modelos básicos com diferentes prompts e parâmetros de inferência, você pode configurar seu aplicativo para chamá-los APIs com as especificações desejadas.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Inferência: gerar respostas

Como a inferência funciona