Use um perfil de inferência na invocação de modelos - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use um perfil de inferência na invocação de modelos

Você pode usar um perfil de inferência entre regiões no lugar de um modelo básico para encaminhar solicitações para várias regiões. Para monitorar os custos e o uso de um modelo, em uma ou várias regiões, você pode usar um perfil de inferência de aplicativos. Para saber como usar um perfil de inferência ao executar a inferência de modelo, escolha a guia do seu método preferido e siga as etapas:

Console

Para usar um perfil de inferência com um recurso que o suporte, faça o seguinte:

  1. Faça login no AWS Management Console com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock/.

  2. Navegue até a página do recurso para o qual você deseja usar um perfil de inferência. Por exemplo, selecione Playground de bate-papo/texto no painel de navegação esquerdo.

  3. Escolha Selecionar modelo e, em seguida, escolha o modelo. Por exemplo, escolha Amazon e depois Nova Premier.

  4. Em Inferência, selecione Perfis de inferência no menu suspenso.

  5. Selecione o perfil de inferência a ser usado (por exemplo, US Nova Premier) e escolha Aplicar.

API

É possível usar um perfil de inferência ao executar inferência em qualquer região incluída nele com as seguintes operações de API:

nota

Se você estiver usando um perfil de inferência entre regiões (definido pelo sistema), poderá usar o ARN ou o ID do perfil de inferência.