Perfis de inferência entre regiões permitidos Regiões e modelos compatíveis com perfis de inferência de aplicação

Regiões e modelos que compatíveis com perfis de inferência

Para obter uma lista de códigos e endpoints de região compatíveis com o Amazon Bedrock, consulte Amazon Bedrock endpoints and quotas. Este tópico descreve os perfis de inferência predefinidos que você pode usar e as regiões e modelos que permitem perfis de inferência de aplicação.

nota

Procurando IDs de perfil de inferência para um modelo específico? Os IDs do perfil de inferência e a disponibilidade regional de cada modelo agora estão documentados na página de detalhes do modelo. Visite rapidamente os modelos e escolha o modelo em que você está interessado.

Tópicos

Perfis de inferência entre regiões permitidos
Regiões e modelos compatíveis com perfis de inferência de aplicação

Perfis de inferência entre regiões permitidos

Você pode realizar inferência entre regiões com perfis de inferência entre regiões (definidos pelo sistema). Cross-Region a inferência permite que você gerencie perfeitamente picos de tráfego não planejados usando computação em diferentes. Regiões da AWS Com a inferência entre regiões, é possível distribuir o tráfego entre várias Regiões da AWS.

Cross-Region Os perfis de inferência (definidos pelo sistema) são nomeados de acordo com o modelo que eles suportam e definidos pelas regiões que eles suportam. Para entender como um perfil de inferência entre regiões lida com suas solicitações, analise as seguintes definições:

Região de origem: a região na qual você faz a solicitação de API que especifica o perfil de inferência.
Região de destino: uma região em que o serviço Amazon Bedrock pode encaminhar a solicitação de sua região de origem.

Quando você invoca um perfil de inferência entre regiões no Amazon Bedrock, sua solicitação se origina de uma região de origem e é automaticamente encaminhada a uma das regiões de destino definidas nesse perfil, otimizando o desempenho. As regiões de destino para perfis de inferência globais entre regiões incluem todas as regiões comerciais.

nota

As regiões de destino em um perfil de inferência entre regiões podem incluir regiões opcionais, que são regiões que você deve habilitar explicitamente no Conta da AWS nível da organização. Para saber mais, consulte Ativar ou desativar Regiões da AWS em sua conta. Ao usar um perfil de inferência entre regiões, sua solicitação de inferência pode ser encaminhada a qualquer uma das regiões de destino no perfil, mesmo que você não tenha optado por essas regiões em sua conta. Suas solicitações de entrada e resultados de saída podem ser armazenados nas regiões opcionais para fins de detecção de abusos.

As políticas de controle de serviços (SCPs) e AWS Identity and Access Management (IAM) trabalham juntas para controlar onde a inferência entre regiões é permitida. Usando SCPs, você pode controlar quais regiões o Amazon Bedrock pode usar para inferência e, usando políticas do IAM, você pode definir quais usuários ou perfis têm permissão para executar inferências. Se alguma região de destino em um perfil de inferência entre regiões estiver bloqueada em suas SCPs, a solicitação falhará mesmo que a permissão de outras regiões se mantenha. Para garantir uma operação eficiente com a inferência entre regiões, você pode atualizar suas políticas de SCPs e IAM para permitir todas as ações de inferência necessárias do Amazon Bedrock (por exemplo, bedrock:InvokeModel* oubedrock:CreateModelInvocationJob) em todas as regiões de destino incluídas no perfil de inferência escolhido. Para saber mais, consulte Enabling Amazon Bedrock cross-Region inference in multi-account environments.

nota

Alguns perfis de inferência são roteados para diferentes regiões de destino, dependendo da região de origem da qual você os chama. Por exemplo, se você chamar o us.anthropic.claude-3-haiku-20240307-v1:0 do Leste dos EUA (Ohio), ele poderá encaminhar solicitações à us-east-1, us-east-2 ou us-west-2, mas, se você chamá-lo do Oeste dos EUA (Oregon), ele poderá encaminhar solicitações somente à us-east-1 e us-west-2.

Para verificar as regiões de origem e de destino de um perfil de inferência, você pode realizar um dos seguintes procedimentos:

Expanda a seção correspondente na lista de perfis de inferência entre regiões compatíveis.
Envie uma GetInferenceProfilesolicitação com um endpoint do plano de controle Amazon Bedrock de uma região de origem e especifique o Amazon Resource Name (ARN) ou o ID do perfil de inferência no campo. inferenceProfileIdentifier O campo models na resposta é associado a uma lista de ARNs de modelo, na qual você pode identificar cada região de destino.

nota

O perfil global de inferência entre regiões para um modelo específico pode mudar com o tempo, à medida que AWS adiciona mais regiões comerciais nas quais suas solicitações podem ser processadas. No entanto, se um perfil de inferência estiver vinculado a uma região geográfica (como EUA, UE ou APAC), sua lista de regiões de destino nunca será alterada. AWS pode criar novos perfis de inferência que incorporem novas regiões. É possível atualizar seus sistemas para usar esses perfis de inferência alterando os IDs em sua configuração para os novos.

Atualmente, o perfil de inferência global entre regiões só é suportado no Anthropic Claude Sonnet 4 modelo para as seguintes regiões de origem: Oeste dos EUA (Oregon), Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Europa (Irlanda) e Ásia-Pacífico (Tóquio). As regiões de destino para o perfil de inferência global incluem todas as Regiões da AWS comerciais.

Importante

Os IDs de perfil de inferência entre regiões, regiões de origem suportadas, regiões de destino e escopo geográfico (global, EUA ou UE) de cada modelo estão documentados na página de detalhes do modelo. Para encontrar essas informações, visite rapidamente os modelos e escolha o modelo em que você está interessado. Na página do modelo, procure a tabela de disponibilidade regional — ela mostra quais regiões oferecem suporte aos In-Region perfis de inferência geográfica e global, e a seção IDs do perfil de inferência lista os IDs exatos a serem usados nas chamadas de API.

Se você precisar comparar as opções de residência de dados em vários modelos para o planejamento de conformidade, revise a tabela de disponibilidade regional na página de cada modelo para confirmar que o perfil de inferência do modelo escolhido encaminha as solicitações somente para regiões que atendam aos seus requisitos.

Regiões e modelos compatíveis com perfis de inferência de aplicação

Perfis de inferência de aplicativos podem ser criados para todos os modelos da seguinte Regiões da AWS forma:

ap-northeast-1
ap-northeast-2
ap-south-1
ap-southeast-1
ap-southeast-2
ca-central-1
eu-central-1
eu-west-1
eu-west-2
eu-west-3
sa-east-1
us-east-1
us-east-2
us-gov-east-1
us-west-2

Perfis de inferência de aplicativos podem ser criados a partir da maioria dos modelos compatíveis com o Amazon Bedrock. Alguns modelos, como modelos de incorporação, não oferecem suporte a perfis de inferência. Para verificar se um modelo específico oferece suporte a perfis de inferência, consulte os modelos em um piscar de olhos.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Perfis de inferência

Pré-requisitos