Use um perfil de inferência na invocação de modelos - Amazon Bedrock

Use um perfil de inferência na invocação de modelos

Você pode usar um perfil de inferência entre regiões em vez de um modelo de base para encaminhar solicitações a várias regiões. Para monitorar os custos e o uso de um modelo, em uma ou várias regiões, é possível usar um perfil de inferência de aplicação. Para saber como usar um perfil de inferência ao executar a inferência do modelo, escolha a guia correspondente ao método de sua preferência e siga as etapas:

Console

Para usar um perfil de inferência com um recurso compatível, faça o seguinte:

  1. Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console do Amazon Bedrock. Em seguida, abra o console do Amazon Bedrock em https://console.aws.amazon.com/bedrock/.

  2. Navegue até a página do recurso para o qual você deseja usar um perfil de inferência. Por exemplo, selecione Playground chat/texto no painel de navegação à esquerda.

  3. Escolha Selecionar modelo e selecione o modelo. Por exemplo, escolha Amazon e depois Nova Premier.

  4. Em Inferência, selecione Perfis de inferência no menu suspenso.

  5. Selecione o perfil de inferência a ser usado (por exemplo, US Nova Premier) e escolha Aplicar.

API

É possível usar um perfil de inferência ao executar inferência em qualquer região incluída nele com as seguintes operações de API:

nota

Se você estiver usando um perfil de inferência entre regiões (definido pelo sistema), poderá usar o respectivo ARN ou ID.