Use um perfil de inferência na invocação de modelos - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use um perfil de inferência na invocação de modelos

Você pode usar um perfil de inferência entre regiões em vez de um modelo de base para encaminhar solicitações a várias regiões. Para monitorar os custos e o uso de um modelo, em uma ou várias regiões, é possível usar um perfil de inferência de aplicação. Para saber como usar um perfil de inferência ao executar a inferência do modelo, escolha a guia correspondente ao método de sua preferência e siga as etapas:

Console

Para usar um perfil de inferência com um recurso compatível, faça o seguinte:

  1. Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console do Amazon Bedrock. Em seguida, abra o console do Amazon Bedrock em https://console.aws.amazon.com/bedrock/.

  2. Navegue até a página do recurso para o qual você deseja usar um perfil de inferência. Por exemplo, selecione Playground chat/texto no painel de navegação à esquerda.

  3. Escolha Selecionar modelo e selecione o modelo. Por exemplo, escolha Amazon e depois Nova Premier.

  4. Em Inferência, selecione Perfis de inferência no menu suspenso.

  5. Selecione o perfil de inferência a ser usado (por exemplo, US Nova Premier) e escolha Aplicar.

API

É possível usar um perfil de inferência ao executar inferência em qualquer região incluída nele com as seguintes operações de API:

nota

Se você estiver usando um perfil de inferência entre regiões (definido pelo sistema), poderá usar o respectivo ARN ou ID.