El patrón de inferencia perimetral: inteligencia en tiempo real en la periferia Casos de uso del patrón de inferencia de bordes Mejores prácticas de seguridad y administración en la periferia Comparación AWS IoT Greengrass y Lambda @Edge Valor empresarial del patrón de inferencia perimetral

Patrón 3: inferencia perimetral en tiempo real

Muchos casos de uso empresarial exigen una toma de decisiones inteligente en el punto de interacción, ya sea con un cliente, una máquina, un vehículo o un dispositivo de IoT. En estos escenarios, la inferencia basada únicamente en la nube no es suficiente debido a los siguientes problemas:

Restricciones de latencia: los milisegundos son importantes en las experiencias de los usuarios, como la personalización, las recomendaciones y las comprobaciones de fraude.
Conectividad intermitente o nula: los entornos remotos, como los industriales, agrícolas y sanitarios, suelen carecer de un acceso constante a la nube APIs.
Alto volumen de datos: enviar grandes cargas útiles de sensores o imágenes a la nube para realizar inferencias es ineficiente y costoso.
Requisitos reglamentarios: en algunas jurisdicciones, los datos confidenciales deben permanecer locales.

Las arquitecturas tradicionales que se basan únicamente en la inferencia centralizada del aprendizaje automático provocan demoras, aumentan los costos y pueden dejar de ofrecer un servicio eficaz a los usuarios o los sistemas en entornos periféricos.

El patrón de inferencia perimetral: inteligencia en tiempo real en la periferia

El patrón de inferencia perimetral en tiempo real permite a las organizaciones ejecutar las cargas de trabajo de inferencia más cerca del usuario o del dispositivo, mediante los servicios gestionados por. AWS Estos servicios incluyen AWS IoT Greengrass, que permiten realizar inferencias localizadas y sin conexión a Internet en dispositivos periféricos físicos. Además, Lambda @Edge permite la ejecución de lógica de IA ligera en las ubicaciones CloudFront perimetrales de Amazon de todo el mundo.

Estos servicios sin servidor permiten experiencias de IA distribuidas que son instantáneas, resistentes a los problemas de conectividad y que cumplen con los requisitos regionales y sensibles a la latencia.

La arquitectura de referencia implementa cada capa de la siguiente manera:

Activador de eventos: utiliza eventos periféricos (como las lecturas de los sensores y los cambios de estado del dispositivo) o las solicitudes del espectador CloudFront.
Procesamiento: implementa una función Lambda local AWS IoT Greengrass para formatear la entrada, extraer metadatos o filtrar el ruido. Utiliza Lambda @Edge para inspeccionar los encabezados o la geolocalización.
Inferencia: implementa un modelo de aprendizaje automático a través de un AWS IoT Greengrass componente (por ejemplo, PyTorch oONNX) o realiza llamadas remotas a la API a Amazon Bedrock o Amazon SageMaker Serverless Inference a través de Lambda @Edge.
Posprocesamiento: se utiliza AWS IoT Greengrass para publicar la detección de anomalías en las sombras de los dispositivos MQTT o AWS IoT. Utiliza Lambda @Edge para personalizar las respuestas y configurar las cookies.
Salida: se sincroniza con AWS IoT CoreAmazon S3 o Amazon EventBridge. Envía las respuestas CloudFront a través del panel de control del navegador o del dispositivo.

nota

Cada nivel contribuye a reducir el tiempo de respuesta, optimizar el ancho de banda y localizar la inteligencia.

Casos de uso del patrón de inferencia de bordes

El patrón de inferencia en tiempo real en el borde admite diversas implementaciones en diferentes industrias. Estos son dos ejemplos representativos:

Supervisión de equipos de fábrica y AWS IoT Greengrass: una planta de fabricación despliega pasarelas que permiten detectar anomalías en AWS IoT Greengrass las vibraciones de los equipos. El modelo se ejecuta de forma local, alerta al operador en tiempo real y solo envía datos resumidos a la nube.
Contenido web personalizado y Lambda @Edge: un sitio de comercio electrónico utiliza Lambda @Edge para analizar las cookies y los encabezados de las solicitudes entrantes. Lambda @Edge ayuda al sitio a ofrecer recomendaciones e imágenes de productos personalizadas en menos de 50 ms, sin viajes de ida y vuelta al backend.

Mejores prácticas de seguridad y administración en la periferia

Tanto IoT Greengrass como Lambda @Edge están completamente integrados con AWS Identity and Access Management(IAM) y Amazon. AWS IoT Core CloudWatch Entre las mejores prácticas clave se incluyen las siguientes:

Firma y verificación del código de los AWS IoT Greengrass componentes
Inspección y registro de tráfico regionales para Lambda @Edge
Actualizaciones de modelos seguras over-the-air (OTA) mediante buckets de Amazon S3 y canalizaciones de integración e implementación continuas (CI/CD)
Funciones de IAM detalladas para limitar el acceso a los datos en la periferia

Comparación AWS IoT Greengrass y Lambda @Edge

En la siguiente tabla se comparan los aspectos operativos clave de AWS IoT Greengrass Lambda @Edge en el contexto de la inferencia perimetral.

Consideración	AWS IoT Greengrass	Lambda@Edge
Funciona sin conexión	Sí	No
Gestiona los datos del sensor y el actuador locales	Sí	No
Ideal para la personalización web global	No	Sí
Soporta modelos de IA	Inferencia local completa	Llamadas ligeras a la lógica y a la API en la nube
Integración con Amazon Bedrock o SageMaker Serverless Inference	Mediante sincronización y registro asíncronos	Mediante el almacenamiento alternativo o en caché de Amazon API Gateway

Al utilizar este patrón, las empresas pueden integrar la IA donde más se necesita: en el taller, sobre el terreno, en el navegador o en todo el mundo. El patrón de inferencia en tiempo real en los bordes es esencial para:

Aplicaciones con requisitos de baja latencia y alta disponibilidad
Dispositivos perimetrales en entornos remotos o de alto rendimiento
Experiencias de consumo globales en las que la ubicación es importante

Al combinar AWS IoT Greengrass la inteligencia integrada en el dispositivo con Lambda @Edge para la proximidad a los usuarios AWS , se posibilita un enfoque potente y sin servidores para una IA perimetral escalable, resiliente y rentable.

Valor empresarial del patrón de inferencia perimetral

El patrón de inferencia de bordes aporta valor en las siguientes áreas:

Rendimiento: logra una inferencia inferior a 100 ms para aplicaciones orientadas al usuario o para una automatización en la que el tiempo es crucial
Fiabilidad: funciona sin conectividad, lo que es especialmente importante para el IoT o las implementaciones remotas
Ahorro de ancho de banda: mantiene los datos sin procesar locales y envía solo los eventos significativos a la nube
Cumplimiento: mantiene las inferencias y los datos a nivel local para cumplir con la gobernanza regional, como el Reglamento General de Protección de Datos (GDPR) y la Ley de Portabilidad y Responsabilidad de los Seguros Médicos de 1996 (HIPAA)
Control de costos: minimiza el uso de los recursos de la nube y el tráfico de red cuando no es esencial

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Patrón 2: orquestación de la IA de la agencia con Amazon Bedrock

Patrón 4: flujo de trabajo de IA en varias etapas