패턴 3: 엣지에서의 실시간 추론 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

패턴 3: 엣지에서의 실시간 추론

많은 엔터프라이즈 사용 사례에서는 상호 작용이 고객, 기계, 차량 또는 IoT 디바이스와 이루어지는지 여부에 관계없이 상호 작용 시점에 지능적인 의사 결정을 요구합니다. 이러한 시나리오에서는 다음과 같은 문제로 인해 클라우드 전용 추론만으로는 충분하지 않습니다.

  • 지연 시간 제약 - 개인화, 권장 사항 및 사기 확인과 같은 사용자 경험에서 밀리초는 중요합니다.

  • 간헐적이거나 연결되지 않음 - 산업, 농업 및 의료와 같은 원격 환경에는 클라우드 APIs에 대한 일관된 액세스가 없는 경우가 많습니다.

  • 대용량 데이터 - 대규모 센서 또는 이미지 페이로드를 추론을 위해 클라우드로 전송하는 것은 비효율적이고 비용이 많이 듭니다.

  • 규제 요구 사항 - 일부 관할권에서는 민감한 데이터가 로컬로 유지되어야 합니다.

중앙 집중식 ML 추론에만 의존하는 기존 아키텍처는 지연을 초래하고, 비용을 늘리며, 엣지 우선 환경에서 사용자 또는 시스템을 효과적으로 제공하지 못할 수 있습니다.

엣지 추론 패턴: 엣지에서의 실시간 인텔리전스

실시간 엣지 추론 패턴을 사용하면 조직이에서 관리하는 서비스를 사용하여 사용자 또는 디바이스에 더 가깝게 추론 워크로드를 실행할 수 있습니다 AWS. 이러한 서비스에는 물리적 엣지 디바이스에서 로컬화된 오프라인 가능 추론을 허용하는 AWS IoT Greengrass가 포함됩니다. 또한 Lambda@Edge를 사용하면 전 세계 Amazon CloudFront 엣지 로케이션에서 경량 AI 로직을 실행할 수 있습니다.

이러한 서버리스 서비스는 즉각적인 분산형 AI 환경을 지원하며, 연결 문제에 대한 복원력이 뛰어나고, 리전 및 지연 시간에 민감한 요구 사항을 준수합니다.

참조 아키텍처는 다음과 같이 각 계층을 구현합니다.

  • 이벤트 트리거 - CloudFront를 통해 엣지 이벤트(예: 센서 읽기 및 디바이스 상태 변경) 또는 뷰어 요청을 사용합니다.

  • 처리 -에서 로컬 Lambda 함수를 구현 AWS IoT Greengrass 하여 입력 형식을 지정하거나 메타데이터를 추출하거나 노이즈를 필터링합니다. Lambda@Edge를 사용하여 헤더 또는 지리적 위치를 검사합니다.

  • 추론 - AWS IoT Greengrass 구성 요소(예: PyTorch 또는 ONNX)를 통해 ML 모델을 배포하거나 Lambda@Edge를 통해 Amazon Bedrock 또는 Amazon SageMaker Serverless Inference에 원격 API를 호출합니다.

  • 사후 처리 - 이상 탐지를 AWS IoT Greengrass MQTT 또는 AWS IoT 디바이스 섀도에 게시하는 데 사용합니다. Lambda@Edge를 사용하여 응답을 개인화하고 쿠키를 설정합니다.

  • 출력 - AWS IoT CoreAmazon S3 또는 Amazon EventBridge와 동기화됩니다. CloudFront를 통해 브라우저 또는 디바이스 대시보드에 응답을 제공합니다.

참고

각 계층은 응답 시간을 줄이고, 대역폭을 최적화하고, 인텔리전스를 현지화하는 역할을 합니다.

엣지 추론 패턴의 사용 사례

엣지 패턴의 실시간 추론은 다양한 산업에서 다양한 구현을 지원합니다. 다음은 두 가지 대표적인 예입니다.

  • 공장 장비 모니터링 및 AWS IoT Greengrass - 제조 공장은 장비 진동의 이상을 감지 AWS IoT Greengrass 하기 위해에서 활성화된 게이트웨이를 배포합니다. 모델은 로컬에서 실행되어 운영자에게 실시간으로 알리고 요약 데이터만 클라우드로 전송합니다.

  • 개인 맞춤형 웹 콘텐츠 및 Lambda@Edge - 전자 상거래 사이트는 Lambda@Edge를 사용하여 수신 요청의 쿠키와 헤더를 분석합니다. Lambda@Edge를 사용하면 사이트가 백엔드 왕복 없이 50ms 이내에 맞춤형 추천 및 제품 이미지를 제공할 수 있습니다.

엣지의 보안 및 관리 모범 사례

IoT Greengrass와 Lambda@Edge는 모두 AWS Identity and Access Management (IAM) AWS IoT Core및 Amazon CloudWatch와 완전히 통합됩니다. 주요 모범 사례는 다음과 같습니다.

  • AWS IoT Greengrass 구성 요소에 대한 코드 서명 및 확인

  • Lambda@Edge에 대한 리전 트래픽 검사 및 로깅

  • Amazon S3 버킷과 지속적 통합 및 지속적 배포(CI/CD) 파이프라인을 사용하여 over-the-air(OTA) 모델 업데이트 보호

  • 엣지에서 데이터 액세스를 제한하는 세분화된 IAM 역할

AWS IoT Greengrass 및 Lambda@Edge 비교

다음 표에서는 엣지 추론의 맥락에서 AWS IoT Greengrass 및 Lambda@Edge의 주요 운영 측면을 비교합니다.

고려 사항

AWS IoT Greengrass

Lambda@Edge

오프라인으로 작동

아니요

로컬 센서 및 액추에이터 데이터 처리

아니요

글로벌 웹 개인화에 적합

아니요

AI 모델 지원

전체 로컬 추론

경량 로직 및 클라우드 API 호출

Amazon Bedrock 또는 SageMaker 서버리스 추론과 통합

비동기 동기화 및 로깅을 통해

Amazon API Gateway 폴백 또는 캐싱을 통해

이 패턴을 사용하면 기업은 가장 필요한 AI를 작업 현장, 필드, 브라우저 또는 전 세계에 포함할 수 있습니다. 엣지 패턴에서의 실시간 추론은 다음과 같은 경우에 필수적입니다.

  • 지연 시간이 짧은 고가용성 요구 사항이 있는 애플리케이션

  • 원격 또는 고처리량 환경의 엣지 디바이스

  • 위치가 중요한 글로벌 소비자 경험

사용자와의 근접성을 위해 디바이스 내 인텔리전스 AWS IoT Greengrass 를 Lambda@Edge와 결합하여 확장 가능하고 복원력이 뛰어나며 비용 효율적인 엣지 AI에 대한 강력하고 서버리스 접근 방식을 AWS 활성화합니다.

엣지 추론 패턴의 비즈니스 가치

엣지 추론 패턴은 다음 영역에서 값을 제공합니다.

  • 성능 - 사용자 대면 앱 또는 시간이 중요한 자동화에 대해 100ms 미만의 추론을 달성합니다.

  • 신뢰성 - 연결 없이 작동하며, IoT 또는 원격 배포에 특히 중요합니다.

  • 대역폭 절감 - 원시 데이터를 로컬로 유지하고 의미 있는 이벤트만 클라우드로 푸시합니다.

  • 규정 준수 - 추론 및 데이터를 로컬로 유지하여 일반 데이터 보호 규정(GDPR) 및 1996년 건강 보험 양도 및 책임에 관한 법률(HIPAA)과 같은 리전 거버넌스를 준수합니다.

  • 비용 제어 - 필수적이지 않은 클라우드 리소스 사용량 및 네트워크 트래픽 최소화