Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Aumento del rendimiento con la inferencia entre regiones
Con la inferencia entre regiones, puede elegir un perfil de inferencia entre regiones vinculado a una región geográfica específica (como EE. UU. o la UE) o puede elegir un perfil de inferencia global. Cuando elige un perfil de inferencia vinculado a una zona geográfica específica, Amazon Bedrock selecciona automáticamente el anuncio óptimo Región de AWS dentro de esa zona geográfica para procesar su solicitud de inferencia. Con los perfiles de inferencia globales, Amazon Bedrock selecciona automáticamente la Región de AWS comercial óptima para procesar la solicitud, lo que optimiza los recursos disponibles y aumenta el rendimiento del modelo.
Ambos tipos de inferencia entre regiones funcionan mediante perfiles de inferencia, que definen un modelo básico (FM) y hacia dónde se pueden Regiones de AWS dirigir las solicitudes. Al ejecutar la inferencia del modelo en el modo bajo demanda, es posible que sus solicitudes estén restringidas por Service Quotas o durante las horas de mayor uso. La inferencia entre regiones le permite gestionar sin problemas las ráfagas de tráfico no planificadas mediante el uso de la computación en diferentes áreas. Regiones de AWS
También puede aumentar el rendimiento de un modelo mediante la compra de Rendimiento aprovisionado. Los perfiles de inferencia actualmente no admiten el rendimiento aprovisionado.
Para ver las regiones y los modelos con los que puede utilizar los perfiles de inferencia para ejecutar inferencias entre regiones, consulte Regiones y modelos compatibles con los perfiles de inferencia.
Temas
Elegir entre la inferencia geográfica y global entre regiones
Amazon Bedrock ofrece dos tipos de perfiles de inferencia entre regiones, cada uno diseñado para distintos casos de uso y requisitos de conformidad:
| Característica | Inferencia geográfica entre regiones | Inferencia global entre regiones | Recomendación |
|---|---|---|---|
| Residencia de datos | Dentro de los límites geográficos (EE. UU., UE, APAC, etc.) | Cualquier región AWS comercial compatible en todo el mundo | Elija Geographic para conocer los requisitos de conformidad |
| Rendimiento | Más alto que en una sola región | El más alto disponible | Elija Global para obtener el máximo rendimiento |
| Costo | Precio estándar | Ahorros de aproximadamente un 10% | Elija Global para optimizar los costes |
| Requisitos de SCP | Permita que todas las regiones de destino figuren en el perfil | Permitir "aws:RequestedRegion": "unspecified" |
Configure en función de las políticas de su organización |
| El más adecuado para lo siguiente: | Organizaciones con normas de residencia de datos | Organizations prioriza el costo y el rendimiento | Evalúe sus necesidades de cumplimiento y rendimiento |
Elija la inferencia geográfica entre regiones cuando tenga requisitos de residencia de datos y necesite asegurarse de que el procesamiento de los datos se mantenga dentro de límites geográficos específicos. Elija la inferencia global entre regiones si desea obtener el máximo rendimiento y ahorrar costes sin restricciones geográficas.
Consideraciones generales
Tenga en cuenta la siguiente información sobre la inferencia entre regiones:
-
El uso de la inferencia entre regiones no conlleva ningún costo de enrutamiento adicional. El precio se calcula en función de la región desde la que se llama al perfil de inferencia. Para obtener más información acerca de los precios, consulte Precios de Amazon Bedrock
. -
La inferencia entre regiones puede dirigir las solicitudes a las Regiones de AWS que no esté habilitada manualmente en su ordenador. Cuenta de AWS No es necesaria la activación manual de regiones para que funcione la inferencia entre regiones.
-
Todos los datos transmitidos durante las operaciones entre regiones permanecen en la AWS red y no atraviesan la Internet pública. Los datos se cifran en tránsito entre ellos. Regiones de AWS
-
Todas las solicitudes de inferencia entre regiones se registran CloudTrail en la región de origen. Busque el
additionalEventData.inferenceRegioncampo para identificar dónde se procesaron las solicitudes. -
AWSLos servicios impulsados por Amazon Bedrock también pueden usar CRIS. Para obtener más información, consulte la documentación del servicio específico.