Inferencia entre regiones Regiones compatibles con la inferencia entre regiones de

Procesamiento entre regiones para el agente de actualización de Apache Spark

El agente de actualización de Apache Spark utiliza la inferencia entre regiones para procesar las solicitudes en lenguaje natural y generar respuestas. Con la inferencia entre regiones, el agente enrutará automáticamente su solicitud de inferencia para optimizar el rendimiento, maximizar los recursos informáticos disponibles y la disponibilidad del modelo, y ofrecer la mejor experiencia al cliente. El tipo de inferencia entre regiones que se utilice depende de la región en la que se ejecute el agente de actualización de Apache Spark. En la mayoría de las regiones, el agente seleccionará la región óptima dentro de su zona geográfica para procesar sus solicitudes de inferencia. Sin embargo, en algunas regiones, una solicitud de inferencia realizada por el agente se enviará de forma segura a todos los recursos informáticos disponibles en todas las regiones comerciales del mundo. AWS

Inferencia entre regiones

El agente de actualización de Apache Spark se basa en la inferencia entre regiones y la utiliza para distribuir el tráfico entre distintas AWS regiones, a fin de mejorar el rendimiento y la fiabilidad de las inferencias de modelos de lenguaje de gran tamaño (LLM).

Si bien las inferencias entre regiones no cambian el lugar donde se alojan la aplicación de Spark, la experiencia de actualización o el lugar en el que se almacenan los datos, es posible que las solicitudes de entrada y los resultados de salida se transmitan a distintas regiones para su procesamiento. Todos los datos se transmitirán cifrados a través de la red segura de Amazon.

El uso de la inferencia entre regiones no conlleva ningún coste adicional.

Regiones compatibles con la inferencia entre regiones de

Regiones que utilizan la inferencia geográfica entre regiones

En la mayoría de las regiones, las solicitudes de inferencia entre regiones se guardan en AWS las regiones que forman parte de la misma zona geográfica en la que se ejecuta el agente de actualización de Apache Spark. Por ejemplo, una solicitud realizada por el agente en la región EE.UU. Este (Norte de Virginia) se envía únicamente a AWS las regiones dentro de la geografía de los Estados Unidos. En la siguiente tabla se describen las regiones a las que se pueden dirigir sus solicitudes en función de la zona geográfica en la que se originaron:

	Geografía de compatible	Regiones para la inferencia
1	Estados Unidos	EE.UU. Este (Norte de Virginia) (us-East-1), EE.UU. Oeste (Oregón) (us-west-2), EE.UU. Este (Ohio) (us-East-2), EE.UU. Oeste (Norte de California) (us-west-2)
2	Europa	Europa (Fráncfort) (eu-central-1), Europa (Irlanda) (eu-west-1), Europa (París) (eu-west-3), Europa (Estocolmo) (eu-north-1), Europa (Londres) (eu-west-2)
3	Asia Pacífico	Asia Pacífico (Tokio) (ap-northeast-1), Asia Pacífico (Seúl) (ap-northeast-2), Asia Pacífico (Mumbai) (ap-south-1)

Regiones que utilizan la inferencia global entre regiones

importante

Las siguientes AWS regiones utilizan la inferencia global entre regiones. Si utilizas el agente de actualización de Apache Spark en estas regiones, es posible que tus solicitudes se transmitan de todo el mundo a otras AWS regiones para su procesamiento de inferencias a fin de optimizar el rendimiento y la disponibilidad:

América del Sur (São Paulo) (sa-east-1)
Asia-Pacífico (Singapur) (ap-southeast-1)
Asia-Pacífico (Sídney) (ap-southeast-2)
Canadá (centro) (ca-central-1)

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Uso de las herramientas de actualización de Spark

CloudTrail Registro