Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Inferencia geográfica entre regiones
La inferencia geográfica entre regiones mantiene el procesamiento de datos dentro de límites geográficos específicos (EE. UU., UE, APAC, etc.) y, al mismo tiempo, proporciona un mayor rendimiento que la inferencia de una sola región. Esta opción es ideal para organizaciones con requisitos de residencia de datos y normas de conformidad.
Consideraciones sobre la inferencia geográfica entre regiones
Tenga en cuenta la siguiente información sobre la inferencia geográfica entre regiones:
-
Cross-Region Las solicitudes de inferencia a un perfil de inferencia vinculado a una zona geográfica (p. ej., EE. UU., la UE y APAC) se mantienen dentro de las zonas geográficas en las Regiones de AWS que se encuentran originalmente los datos. Por ejemplo, una solicitud realizada en los EE. UU. se guarda dentro de los Regiones de AWS EE. UU. Aunque los datos solo permanecen almacenados en la región de origen, las peticiones de entrada y los resultados de salida pueden llevarse fuera de la región de origen durante la inferencia entre regiones. Todos los datos se transmitirán cifrados a través de la red segura de Amazon.
-
Para ver las cuotas predeterminadas de rendimiento entre regiones cuando se utilizan perfiles de inferencia vinculados a una región geográfica (como EE. UU., UE y APAC), consulte el Cross-region modelo de solicitudes de inferencia por minuto para $ {Model} y el modelo de tokens de inferencia por minuto para valores de $ {Cross-region Model} en las cuotas de servicio de Amazon Bedrock en la Referencia general.AWS
Requisitos de la política de IAM para la inferencia geográfica entre regiones
Para permitir que un usuario o rol de IAM invoque un perfil de inferencia geográfica entre regiones, debe permitir el acceso a los siguientes recursos:
-
El perfil de inferencia interregional específico de una región geográfica (estos perfiles tienen prefijos geográficos como,,)
useuapac -
El modelo básico en la región de origen
-
El modelo básico en todas las regiones de destino que figuran en el perfil geográfico
El siguiente ejemplo de política otorga los permisos necesarios para utilizar el modelo básico de Claude Sonnet 4.5 con un perfil de inferencia geográfica interregional para EE. UU., donde se encuentra la región de origen us-east-1 y las regiones de destinous-east-1, us-east-2 y: us-west-2
{ "Version": "2012-10-17", "Statement": [ { "Sid": "GrantGeoCrisInferenceProfileAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" ] }, { "Sid": "GrantGeoCrisModelAccess", "Effect": "Allow", "Action": "bedrock:InvokeModel", "Resource": [ "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0" ], "Condition": { "StringEquals": { "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0" } } } ] }
La primera declaración concede a la bedrock:InvokeModel API acceso al perfil de inferencia geográfica entre regiones para las solicitudes que se originen en la región solicitante. La segunda declaración otorga acceso mediante bedrock:InvokeModel API al modelo básico tanto en la región solicitante como en todas las regiones de destino que figuran en el perfil de inferencia.
Requisitos de la política de control de servicios para la inferencia geográfica entre regiones
Muchas organizaciones implementan controles de acceso regionales a través de políticas de control de servicios en AWS Organizations para garantizar la seguridad y el cumplimiento. Si la política de seguridad de su organización utiliza los SCP para bloquear las regiones no utilizadas, debe asegurarse de que sus condiciones de Region-specific SCP permitan el acceso a todas las regiones de destino que figuran en el perfil de inferencia geográfica interregional de su región de origen.
Para realizar una inferencia geográfica entre regiones, debe comprender la relación entre la región de origen (donde realiza la llamada a la API) y las regiones de destino (a las que se pueden enrutar las solicitudes). Consulta la documentación del perfil de inferencia para identificar todas las regiones de destino de tu región de origen y, a continuación, asegúrate de que tus SCP permiten el acceso a todas esas regiones de destino.
Por ejemplo, si llamas desde us-east-1 (región de origen) con el perfil geográfico estadounidense Anthropic Claude Sonnet 4.5, las solicitudes se pueden dirigir a us-east-1, us-east-2 y us-west-2 (regiones de destino). Si un SCP restringe el acceso solo a us-east-1, la inferencia entre regiones fallará al intentar enrutar a us-east-2 o us-west-2. Por lo tanto, debes incluir las tres regiones de destino en tu SCP, independientemente de la región desde la que llames.
Al configurar los SCP para la exclusión de regiones, recuerde que bloquear cualquier región de destino en el perfil de inferencia impedirá que la inferencia entre regiones funcione correctamente, incluso si se sigue accediendo a la región de origen. Para conocer los requisitos de SCP para la inferencia global entre regiones, consulte. Requisitos de la política de control de servicios para la inferencia global entre regiones
Para mejorar la seguridad, considere la posibilidad de utilizar la bedrock:InferenceProfileArn condición para limitar el acceso a perfiles de inferencia específicos. Esto le permite conceder acceso a las regiones requeridas y, al mismo tiempo, restringir los perfiles de inferencia que se pueden utilizar.
Utilice la inferencia geográfica entre regiones
Para utilizar la inferencia geográfica entre regiones, debe incluir un perfil de inferencia al ejecutar la inferencia del modelo de las siguientes maneras:
-
On-demand inferencia de modelo: especifique el ID del perfil de inferencia
modelIdal enviar una solicitud InvokeModel, InvokeModelWithResponseStreamuna conversación o una. ConverseStream Un perfil de inferencia define una o más regiones a las que puede enrutar las solicitudes de inferencia que se originan en la región de origen. El uso de la inferencia entre regiones aumenta el rendimiento y mejora la velocidad y el rendimiento al enrutar dinámicamente las solicitudes de invocación del modelo entre las regiones definidas en el perfil de inferencia. Factores de enrutamiento en el tráfico de usuarios, la demanda y el uso de los recursos. Para obtener más información, consulte Realizar solicitudes de inferencia -
Inferencia por lotes: envíe las solicitudes de forma asíncrona con la inferencia por lotes especificando el ID del perfil de inferencia al enviar una solicitud.
modelIdCreateModelInvocationJob El uso de un perfil de inferencia le permite utilizar el procesamiento en varios Regiones de AWS y lograr tiempos de procesamiento más rápidos para sus trabajos por lotes. Una vez finalizado el trabajo, podrá recuperar los archivos de salida del bucket de Amazon S3 en la región de origen. -
Agentes: especifique el ID del perfil de inferencia en el campo
foundationModelde una solicitud CreateAgent. Para obtener más información, consulte Creación y configuración de agentes manualmente. -
Generación de respuestas de la base de conocimiento: puede utilizar la inferencia entre regiones al generar una respuesta después de consultar una base de conocimiento. Para obtener más información, consulte Prueba de la base de conocimientos mediante consultas y respuestas.
-
Evaluación del modelo: puede enviar un perfil de inferencia como modelo para evaluarlo al enviar un trabajo de evaluación del modelo. Para obtener más información, consulte Evaluación del rendimiento de los recursos de Amazon Bedrock.
-
Administración de peticiones: puede utilizar la inferencia entre regiones al generar una respuesta para una petición que haya creado en Administración de peticiones. Para obtener más información, consulte Creación y almacenamiento de peticiones reutilizables con la administración de peticiones en Amazon Bedrock
-
Flujos de peticiones: puede utilizar la inferencia entre regiones al generar una respuesta para una petición insertada en un nodo de petición de un flujo de peticiones. Para obtener más información, consulte Creación de un flujo de trabajo de IA generativa de extremo a extremo con Flujos de Amazon Bedrock.
Para aprender a usar un perfil de inferencia para enviar solicitudes de invocación de modelos entre regiones, consulte Uso de un perfil de inferencia en la invocación del modelo.
Para obtener más información sobre la inferencia entre regiones, consulte Getting started with cross-region inference in Amazon Bedrock
Para obtener información detallada sobre la inferencia global entre regiones, incluida la configuración de la IAM y la gestión de las cuotas de servicio, consulte. Inferencia global interregional