View a markdown version of this page

Regiões e modelos que compatíveis com perfis de inferência - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Regiões e modelos que compatíveis com perfis de inferência

Para obter uma lista de códigos e endpoints de região compatíveis com o Amazon Bedrock, consulte Amazon Bedrock endpoints and quotas. Este tópico descreve os perfis de inferência predefinidos que você pode usar e as regiões e modelos que permitem perfis de inferência de aplicação.

Perfis de inferência entre regiões permitidos

É possível realizar inferência entre regiões com perfis de inferência entre regiões (definidos pelo sistema). A inferência entre regiões permite que você gerencie perfeitamente picos de tráfego não planejados, utilizando computação em diferentes regiões. Regiões da AWS Com a inferência entre regiões, é possível distribuir o tráfego entre várias Regiões da AWS.

Os perfis de inferência entre regiões (definidos pelo sistema) são nomeados de acordo com o modelo com os quais são compatíveis e são definidos pelas regiões com as quais são compatíveis. Para entender como um perfil de inferência entre regiões lida com suas solicitações, analise as seguintes definições:

  • Região de origem: a região na qual você faz a solicitação de API que especifica o perfil de inferência.

  • Região de destino: uma região em que o serviço Amazon Bedrock pode encaminhar a solicitação de sua região de origem.

Quando você invoca um perfil de inferência entre regiões no Amazon Bedrock, sua solicitação se origina de uma região de origem e é automaticamente encaminhada a uma das regiões de destino definidas nesse perfil, otimizando o desempenho. As regiões de destino para perfis de inferência globais entre regiões incluem todas as regiões comerciais.

nota

As regiões de destino em um perfil de inferência entre regiões podem incluir regiões opcionais, que são regiões que você deve habilitar explicitamente no Conta da AWS nível da organização. Para saber mais, consulte Ativar ou desativar Regiões da AWS em sua conta. Ao usar um perfil de inferência entre regiões, sua solicitação de inferência pode ser encaminhada a qualquer uma das regiões de destino no perfil, mesmo que você não tenha optado por essas regiões em sua conta.

As políticas de controle de serviços (SCPs) e AWS Identity and Access Management (IAM) trabalham juntas para controlar onde a inferência entre regiões é permitida. Usando SCPs, você pode controlar quais regiões o Amazon Bedrock pode usar para inferência e, usando políticas do IAM, você pode definir quais usuários ou funções têm permissão para executar inferência. Se alguma região de destino em um perfil de inferência entre regiões estiver bloqueada no seu SCPs, a solicitação falhará mesmo que outras regiões continuem permitidas. Para garantir uma operação eficiente com inferência entre regiões, você pode atualizar suas políticas SCPs e as do IAM para permitir todas as ações de inferência necessárias do Amazon Bedrock (por exemplo, bedrock:InvokeModel* oubedrock:CreateModelInvocationJob) em todas as regiões de destino incluídas no perfil de inferência escolhido. Para saber mais, consulte Enabling Amazon Bedrock cross-Region inference in multi-account environments.

nota

Alguns perfis de inferência são roteados para diferentes regiões de destino, dependendo da região de origem da qual você os chama. Por exemplo, se você chamar o us.anthropic.claude-3-haiku-20240307-v1:0 do Leste dos EUA (Ohio), ele poderá encaminhar solicitações à us-east-1, us-east-2 ou us-west-2, mas, se você chamá-lo do Oeste dos EUA (Oregon), ele poderá encaminhar solicitações somente à us-east-1 e us-west-2.

Para verificar as regiões de origem e de destino de um perfil de inferência, você pode realizar um dos seguintes procedimentos:

nota

O perfil global de inferência entre regiões para um modelo específico pode mudar com o tempo, à medida que AWS adiciona mais regiões comerciais nas quais suas solicitações podem ser processadas. No entanto, se um perfil de inferência estiver vinculado a uma região geográfica (como EUA, UE ou APAC), sua lista de regiões de destino nunca será alterada. AWS pode criar novos perfis de inferência que incorporem novas regiões. Você pode atualizar seus sistemas para usar esses perfis de inferência alterando a IDs configuração para os novos.

O perfil global de inferência entre regiões só é compatível com o modelo Claude Sonnet 4 da Anthropic das regiões a seguir: Oeste dos EUA (Oregon), Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Europa (Irlanda) e Ásia-Pacífico (Tóquio). As regiões de destino para o perfil de inferência global incluem todas as Regiões da AWS comerciais.

Para ver quais modelos oferecem suporte aos perfis de inferência geográfica e global, visite rapidamente os modelos e escolha o modelo em que você está interessado.

Regiões e modelos compatíveis com perfis de inferência de aplicação

Perfis de inferência de aplicativos podem ser criados para todos os modelos da seguinte Regiões da AWS forma:

  • ap-northeast-1

  • ap-northeast-2

  • ap-south-1

  • ap-southeast-1

  • ap-southeast-2

  • ca-central-1

  • eu-central-1

  • eu-west-1

  • eu-west-2

  • eu-west-3

  • sa-east-1

  • us-east-1

  • us-east-2

  • us-gov-east-1

  • us-west-2

Perfis de inferência de aplicativos podem ser criados a partir da maioria dos modelos compatíveis com o Amazon Bedrock. Alguns modelos, como modelos de incorporação, não oferecem suporte a perfis de inferência. Para verificar se um modelo específico oferece suporte a perfis de inferência, consulte os modelos em um piscar de olhos.