Patrón 3: inferencia perimetral en tiempo real - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Patrón 3: inferencia perimetral en tiempo real

Muchos casos de uso empresarial exigen una toma de decisiones inteligente en el punto de interacción, ya sea con un cliente, una máquina, un vehículo o un dispositivo de IoT. En estos escenarios, la inferencia basada únicamente en la nube no es suficiente debido a los siguientes problemas:

  • Restricciones de latencia: los milisegundos son importantes en las experiencias de los usuarios, como la personalización, las recomendaciones y las comprobaciones de fraude.

  • Conectividad intermitente o nula: los entornos remotos, como los industriales, agrícolas y sanitarios, suelen carecer de un acceso constante a la nube APIs.

  • Alto volumen de datos: enviar grandes cargas útiles de sensores o imágenes a la nube para realizar inferencias es ineficiente y costoso.

  • Requisitos reglamentarios: en algunas jurisdicciones, los datos confidenciales deben permanecer locales.

Las arquitecturas tradicionales que se basan únicamente en la inferencia centralizada del aprendizaje automático provocan demoras, aumentan los costos y pueden dejar de ofrecer un servicio eficaz a los usuarios o los sistemas en entornos periféricos.

El patrón de inferencia perimetral: inteligencia en tiempo real en la periferia

El patrón de inferencia perimetral en tiempo real permite a las organizaciones ejecutar las cargas de trabajo de inferencia más cerca del usuario o del dispositivo, mediante los servicios gestionados por. AWS Estos servicios incluyen AWS IoT Greengrass, que permiten realizar inferencias localizadas y sin conexión a Internet en dispositivos periféricos físicos. Además, Lambda @Edge permite la ejecución de lógica de IA ligera en las ubicaciones CloudFront perimetrales de Amazon de todo el mundo.

Estos servicios sin servidor permiten experiencias de IA distribuidas que son instantáneas, resistentes a los problemas de conectividad y que cumplen con los requisitos regionales y sensibles a la latencia.

La arquitectura de referencia implementa cada capa de la siguiente manera:

  • Activador de eventos: utiliza eventos periféricos (como las lecturas de los sensores y los cambios de estado del dispositivo) o las solicitudes del espectador CloudFront.

  • Procesamiento: implementa una función Lambda local AWS IoT Greengrass para formatear la entrada, extraer metadatos o filtrar el ruido. Utiliza Lambda @Edge para inspeccionar los encabezados o la geolocalización.

  • Inferencia: implementa un modelo de aprendizaje automático a través de un AWS IoT Greengrass componente (por ejemplo, PyTorch oONNX) o realiza llamadas remotas a la API a Amazon Bedrock o Amazon SageMaker Serverless Inference a través de Lambda @Edge.

  • Posprocesamiento: se utiliza AWS IoT Greengrass para publicar la detección de anomalías en las sombras de los dispositivos MQTT o AWS IoT. Utiliza Lambda @Edge para personalizar las respuestas y configurar las cookies.

  • Salida: se sincroniza con AWS IoT CoreAmazon S3 o Amazon EventBridge. Envía las respuestas CloudFront a través del panel de control del navegador o del dispositivo.

nota

Cada nivel contribuye a reducir el tiempo de respuesta, optimizar el ancho de banda y localizar la inteligencia.

Casos de uso del patrón de inferencia de bordes

El patrón de inferencia en tiempo real en el borde admite diversas implementaciones en diferentes industrias. Estos son dos ejemplos representativos:

  • Supervisión de equipos de fábrica y AWS IoT Greengrass: una planta de fabricación despliega pasarelas que permiten detectar anomalías en AWS IoT Greengrass las vibraciones de los equipos. El modelo se ejecuta de forma local, alerta al operador en tiempo real y solo envía datos resumidos a la nube.

  • Contenido web personalizado y Lambda @Edge: un sitio de comercio electrónico utiliza Lambda @Edge para analizar las cookies y los encabezados de las solicitudes entrantes. Lambda @Edge ayuda al sitio a ofrecer recomendaciones e imágenes de productos personalizadas en menos de 50 ms, sin viajes de ida y vuelta al backend.

Mejores prácticas de seguridad y administración en la periferia

Tanto IoT Greengrass como Lambda @Edge están completamente integrados con AWS Identity and Access Management(IAM) y Amazon. AWS IoT Core CloudWatch Entre las mejores prácticas clave se incluyen las siguientes:

  • Firma y verificación del código de los AWS IoT Greengrass componentes

  • Inspección y registro de tráfico regionales para Lambda @Edge

  • Actualizaciones de modelos seguras over-the-air (OTA) mediante buckets de Amazon S3 y canalizaciones de integración e implementación continuas (CI/CD)

  • Funciones de IAM detalladas para limitar el acceso a los datos en la periferia

Comparación AWS IoT Greengrass y Lambda @Edge

En la siguiente tabla se comparan los aspectos operativos clave de AWS IoT Greengrass Lambda @Edge en el contexto de la inferencia perimetral.

Consideración

AWS IoT Greengrass

Lambda@Edge

Funciona sin conexión

No

Gestiona los datos del sensor y el actuador locales

No

Ideal para la personalización web global

No

Soporta modelos de IA

Inferencia local completa

Llamadas ligeras a la lógica y a la API en la nube

Integración con Amazon Bedrock o SageMaker Serverless Inference

Mediante sincronización y registro asíncronos

Mediante el almacenamiento alternativo o en caché de Amazon API Gateway

Al utilizar este patrón, las empresas pueden integrar la IA donde más se necesita: en el taller, sobre el terreno, en el navegador o en todo el mundo. El patrón de inferencia en tiempo real en los bordes es esencial para:

  • Aplicaciones con requisitos de baja latencia y alta disponibilidad

  • Dispositivos perimetrales en entornos remotos o de alto rendimiento

  • Experiencias de consumo globales en las que la ubicación es importante

Al combinar AWS IoT Greengrass la inteligencia integrada en el dispositivo con Lambda @Edge para la proximidad a los usuarios AWS , se posibilita un enfoque potente y sin servidores para una IA perimetral escalable, resiliente y rentable.

Valor empresarial del patrón de inferencia perimetral

El patrón de inferencia de bordes aporta valor en las siguientes áreas:

  • Rendimiento: logra una inferencia inferior a 100 ms para aplicaciones orientadas al usuario o para una automatización en la que el tiempo es crucial

  • Fiabilidad: funciona sin conectividad, lo que es especialmente importante para el IoT o las implementaciones remotas

  • Ahorro de ancho de banda: mantiene los datos sin procesar locales y envía solo los eventos significativos a la nube

  • Cumplimiento: mantiene las inferencias y los datos a nivel local para cumplir con la gobernanza regional, como el Reglamento General de Protección de Datos (GDPR) y la Ley de Portabilidad y Responsabilidad de los Seguros Médicos de 1996 (HIPAA)

  • Control de costos: minimiza el uso de los recursos de la nube y el tráfico de red cuando no es esencial