

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Use um perfil de inferência na invocação de modelos
<a name="inference-profiles-use"></a>

Você pode usar um perfil de inferência entre regiões em vez de um modelo de base para encaminhar solicitações a várias regiões. Para monitorar os custos e o uso de um modelo, em uma ou várias regiões, é possível usar um perfil de inferência de aplicação. Para saber como usar um perfil de inferência ao executar a inferência do modelo, escolha a guia correspondente ao método de sua preferência e siga as etapas:

------
#### [ Console ]

Para usar um perfil de inferência com um recurso compatível, faça o seguinte:

1. Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console do Amazon Bedrock. Em seguida, abra o console do Amazon Bedrock em [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock).

1. Navegue até a página do recurso para o qual você deseja usar um perfil de inferência. Por exemplo, selecione **Playground chat/texto** no painel de navegação à esquerda.

1. Escolha **Selecionar modelo** e selecione o modelo. Por exemplo, escolha **Amazon** e depois **Nova Premier**.

1. Em **Inferência**, selecione **Perfis de inferência** no menu suspenso.

1. Selecione o perfil de inferência a ser usado (por exemplo, **US Nova Premier**) e escolha **Aplicar**.

------
#### [ API ]

É possível usar um perfil de inferência ao executar inferência em qualquer região incluída nele com as seguintes operações de API:
+ [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) ou [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html): para usar um perfil de inferência na invocação de modelos, siga as etapas em [Envie uma única solicitação com InvokeModel](inference-invoke.md) e especifique o nome do recurso da Amazon (ARN) ou o perfil de inferência no campo `modelId`. Para obter um exemplo, consulte [Usar um perfil de inferência na invocação de modelos](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html#API_runtime_InvokeModel_Example_5).
+ [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) ou [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html): para usar um perfil de inferência na invocação de modelos com a API Converse, siga as etapas em [Realizar uma conversa com as operações de API Converse](conversation-inference.md) e especifique o ARN ou o perfil de inferência no campo `modelId`. Para obter um exemplo, consulte [Usar um perfil de inferência em uma conversa](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html#API_runtime_Converse_Example_5).
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html): para usar um perfil de inferência ao gerar respostas nos resultados da consulta de uma base de conhecimento, siga as etapas na guia da API em [Testar a base de conhecimento com consultas e respostas](knowledge-base-test.md) e especifique o ARN ou o perfil de inferência no campo `modelArn`. Para obter mais informações, consulte [Usar um perfil de inferência para gerar uma resposta](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html#API_agent-runtime_RetrieveAndGenerate_Example_3).
+ [CreateEvaluationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateEvaluationJob.html): para enviar um perfil de inferência à avaliação de modelo, siga as etapas na guia da API em [Iniciar um trabalho automático de avaliação de modelo no Amazon Bedrock](model-evaluation-jobs-management-create.md) e especifique o ARN do perfil de inferência no campo `modelIdentifier`.
+ [CreatePrompt](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreatePrompt.html): para usar um perfil de inferência ao gerar uma resposta para um prompt criado no Gerenciamento de Prompts, siga as etapas na guia de API em [Criar um prompt usando o Gerenciamento de Prompts](prompt-management-create.md) e especifique o ARN do perfil de inferência no campo `modelId`.
+ [CreateFlow](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateFlow.html): para usar um perfil de inferência ao gerar uma resposta para um prompt em linha que você define em um nó de prompt em um fluxo, siga as etapas na guia de API em [Criar e planejar um fluxo no Amazon Bedrock](flows-create.md). Ao definir o [nó de prompt](flows-nodes.md#flows-nodes-prompt), especifique o ARN do perfil de inferência no campo `modelId`.
+ [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html): para usar um perfil de inferência ao analisar informações não textuais em uma fonte de dados, siga as etapas na seção de API em [Opções de análise para a fonte de dados](kb-advanced-parsing.md) e especifique o ARN do perfil de inferência no campo `modelArn`.

**nota**  
Se você estiver usando um perfil de inferência entre regiões (definido pelo sistema), poderá usar o respectivo ARN ou ID.

------