View a markdown version of this page

Regiones y modelos compatibles con los perfiles de inferencia - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Regiones y modelos compatibles con los perfiles de inferencia

Para obtener una lista de los códigos de región y los puntos de conexión compatibles con Amazon Bedrock, consulte Amazon Bedrock endpoints and quotas. En este tema se describen los perfiles de inferencia predefinidos que puede utilizar y las regiones y los modelos que admiten perfiles de inferencia de aplicación.

Perfiles de inferencia entre regiones admitidos

Puede realizar la inferencia entre regiones con perfiles de inferencia entre regiones (definidos por el sistema). La inferencia entre regiones le permite gestionar sin problemas las ráfagas de tráfico no planificadas mediante el uso de la computación en diferentes áreas. Regiones de AWS Con la inferencia entre regiones, puede distribuir el tráfico entre varias Regiones de AWS.

Los perfiles de inferencia entre regiones (definidos por el sistema) se nombran por el modelo que admiten y se definen por las regiones que admiten. Para saber cómo un perfil de inferencia entre regiones gestiona sus solicitudes, consulte las siguientes definiciones:

  • Región de origen: la región desde la que realiza la solicitud de API que especifica el perfil de inferencia.

  • Región de destino: una región a la que el servicio de Amazon Bedrock puede enrutar la solicitud de la región de origen.

Cuando invoca un perfil de inferencia entre regiones en Amazon Bedrock, su solicitud se origina en una región de origen y se enruta automáticamente a una de las regiones de destino definidas en ese perfil, lo que optimiza el rendimiento. Las regiones de destino de los perfiles de inferencia global entre regiones incluyen todas las regiones comerciales.

nota

Las regiones de destino de un perfil de inferencia entre regiones pueden incluir regiones opcionales, que son regiones que debe habilitar de forma explícita a nivel de organización. Cuenta de AWS Para obtener más información, consulta Cómo activar o desactivar tu cuenta Regiones de AWS. Si utiliza un perfil de inferencia entre regiones, su solicitud de inferencia se puede enrutar a cualquiera de las regiones de destino del perfil, incluso si no ha optado por utilizar dichas regiones en su cuenta.

Las políticas de control de servicios (SCPs) y las políticas AWS Identity and Access Management (IAM) funcionan en conjunto para controlar dónde se permite la inferencia entre regiones. Con SCPs ellas, puede controlar qué regiones puede utilizar Amazon Bedrock para la inferencia y, mediante las políticas de IAM, puede definir qué usuarios o roles tienen permiso para ejecutar la inferencia. Si alguna región de destino de un perfil de inferencia entre regiones está bloqueada en su perfil SCPs, la solicitud fallará aunque se sigan permitiendo otras regiones. Para garantizar un funcionamiento eficiente con la inferencia entre regiones, puede actualizar sus políticas SCPs y las de IAM para permitir todas las acciones de inferencia requeridas de Amazon Bedrock (por ejemplo, bedrock:InvokeModel* obedrock:CreateModelInvocationJob) en todas las regiones de destino incluidas en el perfil de inferencia elegido. Para obtener más información, consulte Activación de la inferencia entre regiones de Amazon Bedrock en entornos de varias cuentas.

nota

Algunos perfiles de inferencia se enrutan a distintas regiones de destino en función de la región de origen desde la que se llamen. Por ejemplo, si llama a us.anthropic.claude-3-haiku-20240307-v1:0 desde Este de EE. UU (Ohio), puede enrutar las solicitudes a us-east-1, us-east-2 ous-west-2, pero si realiza la llamada desde Oeste de EE. UU. (Oregón), solo puede enrutar las solicitudes a us-east-1 y us-west-2.

Para comprobar si las regiones de origen y destino tienen un perfil de inferencia, puede seguir uno de estos pasos:

nota

El perfil de inferencia global entre regiones para un modelo específico puede cambiar con el tiempo, ya que AWS agrega más regiones comerciales en las que se pueden procesar sus solicitudes. Sin embargo, si un perfil de inferencia está vinculado a una región geográfica (como EE. UU., la UE o APAC), su lista de regiones de destino nunca cambiará. AWS podría crear nuevos perfiles de inferencia que incorporen nuevas regiones. Puede actualizar sus sistemas para utilizar estos perfiles de inferencia cambiando IDs la configuración por una nueva.

El perfil de inferencia global entre regiones solo se admite actualmente en el modelo Anthropic Claude Sonnet 4 para las siguientes regiones de origen: Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Europa (Irlanda) y Asia-Pacífico (Tokio). Las regiones de destino de los perfiles de inferencia global entre regiones incluyen todas las Regiones de AWS comerciales.

Para ver qué modelos son compatibles con los perfiles de inferencia geográficos y globales, visite los modelos de un vistazo y elija el modelo que le interese.

Regiones y modelos compatibles con los perfiles de inferencia de aplicación

Los perfiles de inferencia de aplicaciones se pueden crear para todos los modelos de la siguiente manera: Regiones de AWS

  • ap-northeast-1

  • ap-northeast-2

  • ap-south-1

  • ap-southeast-1

  • ap-southeast-2

  • ca-central-1

  • eu-central-1

  • eu-west-1

  • eu-west-2

  • eu-west-3

  • sa-east-1

  • us-east-1

  • us-east-2

  • us-gov-east-1

  • us-west-2

Los perfiles de inferencia de aplicaciones se pueden crear a partir de la mayoría de los modelos compatibles con Amazon Bedrock. Algunos modelos, como los modelos de incrustación, no admiten perfiles de inferencia. Para comprobar si un modelo específico admite perfiles de inferencia, consulte los modelos de un vistazo.