As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Aumentar o throughput com inferência entre regiões
Com a inferência entre regiões, você pode escolher um perfil de inferência entre regiões vinculado a uma área geográfica específica (como EUA ou UE) ou escolher um perfil de inferência global. Quando você escolhe um perfil de inferência vinculado a uma geografia específica, o Amazon Bedrock seleciona automaticamente o comercial ideal Região da AWS dentro dessa geografia para processar sua solicitação de inferência. Com perfis de inferência globais, o Amazon Bedrock seleciona automaticamente a Região da AWS comercial ideal para processar a solicitação, o que otimiza os recursos disponíveis e aumenta o throughput do modelo.
Os dois tipos de inferência entre regiões funcionam por meio de perfis de inferência, que definem um modelo básico (FM) e Regiões da AWS para o qual as solicitações podem ser encaminhadas. Ao executar a inferência de modelos no modo sob demanda, as solicitações podem ser restringidas por cotas de serviço ou em horários de pico de uso. A inferência entre regiões permite que você gerencie perfeitamente picos de tráfego não planejados, utilizando computação em diferentes regiões. Regiões da AWS
Você também pode aumentar o throughput de um modelo comprando throughput provisionado. Atualmente, os perfis de inferência não comportam throughput provisionado.
Para ver as regiões e os modelos com os quais você pode usar perfis de inferência para executar inferência entre regiões, consulte Regiões e modelos que compatíveis com perfis de inferência.
Tópicos
Escolha entre inferência geográfica e global entre regiões
O Amazon Bedrock fornece dois tipos de perfis de inferência entre regiões, cada um projetado para diferentes casos de uso e requisitos de conformidade:
| Recurso | Inferência geográfica entre regiões | Inferência global entre regiões | Recomendação |
|---|---|---|---|
| Residência de dados | Dentro dos limites geográficos (EUA, UE, APAC, etc.) | Qualquer região AWS comercial suportada em todo o mundo | Escolha Geographic para requisitos de conformidade |
| Throughput | Maior do que uma única região | Maior disponível | Escolha Global para obter o máximo desempenho |
| Custo | Preço padrão | Aproximadamente 10% de economia | Escolha Global para otimização de custos |
| Requisitos de SCP | Permitir todas as regiões de destino no perfil | Permitir "aws:RequestedRegion": "unspecified" |
Configure com base em suas políticas organizacionais |
| Mais adequado para | Organizações com regulamentos de residência de dados | Organizações que priorizam custo e desempenho | Avalie suas necessidades de conformidade e desempenho |
Escolha a inferência geográfica entre regiões quando você tiver requisitos de residência de dados e precisar garantir que o processamento de dados permaneça dentro de limites geográficos específicos. Escolha a inferência global entre regiões quando quiser o máximo de produtividade e economia de custos sem restrições geográficas.
Considerações gerais
Observe as seguintes informações sobre inferência entre regiões:
-
Não há custo adicional de roteamento para usar a inferência entre regiões. O preço é calculado com base na região na qual você chama um perfil de inferência. Para obter mais informações sobre preços, consulte Preços do Amazon Bedrock
. -
A inferência entre regiões pode encaminhar solicitações para as Regiões da AWS quais não estão habilitadas manualmente em seu. Conta da AWS A ativação manual de regiões não é necessária para que a inferência entre regiões funcione.
-
Todos os dados transmitidos durante as operações entre regiões permanecem na AWS rede e não atravessam a Internet pública. Os dados são criptografados em trânsito entre elesRegiões da AWS.
-
Todas as solicitações de inferência entre regiões são registradas CloudTrail na sua região de origem. Procure o
additionalEventData.inferenceRegioncampo para identificar onde as solicitações foram processadas. -
AWSOs serviços desenvolvidos pelo Amazon Bedrock também podem usar o CRIS. Consulte a documentação do serviço específico para obter detalhes.