Aumentar o throughput com inferência entre regiões - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Aumentar o throughput com inferência entre regiões

Com a inferência entre regiões, você pode escolher um perfil de inferência entre regiões vinculado a uma área geográfica específica (como EUA ou UE) ou escolher um perfil de inferência global. Quando você escolhe um perfil de inferência vinculado a uma geografia específica, o Amazon Bedrock seleciona automaticamente o comercial ideal Região da AWS dentro dessa geografia para processar sua solicitação de inferência. Com perfis de inferência globais, o Amazon Bedrock seleciona automaticamente a Região da AWS comercial ideal para processar a solicitação, o que otimiza os recursos disponíveis e aumenta o throughput do modelo.

Os dois tipos de inferência entre regiões funcionam por meio de perfis de inferência, que definem um modelo básico (FM) e Regiões da AWS para o qual as solicitações podem ser encaminhadas. Ao executar a inferência de modelos no modo sob demanda, as solicitações podem ser restringidas por cotas de serviço ou em horários de pico de uso. A inferência entre regiões permite que você gerencie perfeitamente picos de tráfego não planejados, utilizando computação em diferentes regiões. Regiões da AWS

Você também pode aumentar o throughput de um modelo comprando throughput provisionado. Atualmente, os perfis de inferência não comportam throughput provisionado.

Para ver as regiões e os modelos com os quais você pode usar perfis de inferência para executar inferência entre regiões, consulte Regiões e modelos que compatíveis com perfis de inferência.

Escolha entre inferência geográfica e global entre regiões

O Amazon Bedrock fornece dois tipos de perfis de inferência entre regiões, cada um projetado para diferentes casos de uso e requisitos de conformidade:

Recurso Inferência geográfica entre regiões Inferência global entre regiões Recomendação
Residência de dados Dentro dos limites geográficos (EUA, UE, APAC, etc.) Qualquer região AWS comercial suportada em todo o mundo Escolha Geographic para requisitos de conformidade
Throughput Maior do que uma única região Maior disponível Escolha Global para obter o máximo desempenho
Custo Preço padrão Aproximadamente 10% de economia Escolha Global para otimização de custos
Requisitos de SCP Permitir todas as regiões de destino no perfil Permitir "aws:RequestedRegion": "unspecified" Configure com base em suas políticas organizacionais
Mais adequado para Organizações com regulamentos de residência de dados Organizações que priorizam custo e desempenho Avalie suas necessidades de conformidade e desempenho

Escolha a inferência geográfica entre regiões quando você tiver requisitos de residência de dados e precisar garantir que o processamento de dados permaneça dentro de limites geográficos específicos. Escolha a inferência global entre regiões quando quiser o máximo de produtividade e economia de custos sem restrições geográficas.

Considerações gerais

Observe as seguintes informações sobre inferência entre regiões:

  • Não há custo adicional de roteamento para usar a inferência entre regiões. O preço é calculado com base na região na qual você chama um perfil de inferência. Para obter mais informações sobre preços, consulte Preços do Amazon Bedrock.

  • A inferência entre regiões pode encaminhar solicitações para as Regiões da AWS quais não estão habilitadas manualmente em seu. Conta da AWS A ativação manual de regiões não é necessária para que a inferência entre regiões funcione.

  • Todos os dados transmitidos durante as operações entre regiões permanecem na AWS rede e não atravessam a Internet pública. Os dados são criptografados em trânsito entre elesRegiões da AWS.

  • Todas as solicitações de inferência entre regiões são registradas CloudTrail na sua região de origem. Procure o additionalEventData.inferenceRegion campo para identificar onde as solicitações foram processadas.

  • AWSOs serviços desenvolvidos pelo Amazon Bedrock também podem usar o CRIS. Consulte a documentação do serviço específico para obter detalhes.