기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 엣지 AI 및 글로벌 추론 배포
<a name="edge-ai"></a>

클라우드 기반 추론은 대부분의 엔터프라이즈 사용 사례를 제공하지만 특정 시나리오에서는 실시간 응답, 오프라인 기능 또는 데이터 소스 또는 사용자와의 근접성이 필요합니다. 이러한 경우 디바이스에서 또는 디바이스 근처에서 AI 로직을 실행하는 *엣지* AI는 서버리스 클라우드 아키텍처를 강력하게 보완합니다.

AWS 는 두 가지 주요 서버리스 기술을 통해 엣지 AI를 지원합니다.
+ [Lambda@Edge](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/lambda-at-the-edge.html)는 Amazon CloudFront를 사용하여 AWS 엣지 로케이션에서 추론 로직을 전역적으로 실행합니다.

  **예** - 글로벌 전자 상거래 사이트는 Lambda@Edge 함수를 사용하여 사용자 위치 및 언어에 따라 홈페이지 콘텐츠를 개인화합니다. 따라서 가장 가까운 CloudFront 엣지 로케이션에서 즉시 맞춤형 경험을 제공합니다.
+ [AWS IoT Greengrass](https://docs.aws.amazon.com/greengrass/v2/developerguide/what-is-iot-greengrass.html)는 연결된 디바이스에서 로컬 AI 실행을 활성화합니다.

  **예** - 스마트 어플라이언스는 실시간 진단을 AWS IoT Greengrass 위해에 배포된 모델을 사용하여 필요할 때 또는 연결이 허용될 때 인사이트를 클라우드에 동기화합니다.

이러한 기술은 함께 서버리스 AI의 범위를 지연 시간이 짧거나 대역폭에 민감하거나 오프라인 환경 및 전 세계에 분산된 사용자 기반으로 확장합니다.

## Lambda@Edge: CDN 계층의 글로벌 추론
<a name="section-edge-lambda-cdn"></a>

개발자는 Lambda@Edge를 사용하여 CloudFront 엣지 로케이션에서 AWS Lambda 함수를 실행할 수 있습니다. 이 접근 방식은 최종 사용자의 지연 시간을 줄이고 컨텍스트를 인식하고 매우 빠른 AI 경험을 가능하게 합니다.

Lambda@Edge의 주요 기능은 다음과 같습니다.
+ 최종 사용자 요청 및 오리진 응답과 같은 CloudFront 이벤트에 대한 응답으로 CDN 계층에서 로직을 실행합니다.
+ 사용자, 위치 및 디바이스에 따라 웹 페이지 개인화 및 권장 사항과 같은 콘텐츠를 사용자 지정합니다.
+ 중앙으로 라우팅하지 않고 AI 추론을 콘텐츠 전송에 직접 통합 AWS 리전
+ 인프라를 프로비저닝하지 않고 전 세계에 배포

### Lambda@Edge의 사용 사례 예제
<a name="section-edge-lambda-use-cases"></a>

Lambda@Edge는 다음과 같은 주요 사용 사례를 활성화합니다.
+ **전자 상거래 개인화** - 사용자 ID 및 동작을 기반으로 동적 제품 권장 사항을 제공합니다.
+ **미디어 스트리밍** - 리전 정책에 따라 권장 사항 및 상위 제어를 조정합니다.
+ **마케팅 캠페인 **- 각 위치에 대한 배너, 콘텐츠 및 제안을 사용자 지정합니다.
+ **다국어 사용자 경험(UX)** - 사용자 위치 및 언어를 감지하여 Amazon Bedrock LLM 번역 콘텐츠를 인라인으로 제공합니다.

추론 로직을 사용자에게 최대한 가깝게 배치함으로써 Lambda@Edge는 하이퍼 개인화된 AI 기반 프런트 엔드 전송을 지원하며, 이는 대규모 소비자 애플리케이션에 적합합니다.

Lambda@Edge는 비동기 라우팅 및 캐싱 전략을 사용하여 속도와 인텔리전스를 결합하여 Amazon Bedrock 또는 SageMaker Serverless Inference와 함께 사용되는 경우가 많습니다.

## AWS IoT Greengrass: 엣지에서의 로컬 추론
<a name="section-edge-greengrass"></a>

AWS IoT Greengrass 는 고객이 Lambda 함수, ML 추론 및 사용자 지정 코드를 실행하는 데 사용할 수 있는 경량 런타임입니다. 산업용 컨트롤러, 카메라, 의료 디바이스 또는 스마트 어플라이언스와 같은 엣지 디바이스에서 작동합니다.

의 주요 기능은 다음과 AWS IoT Greengrass 같습니다.
+ 클라우드에서 연결이 끊긴 경우에도 로컬에서 Lambda 함수를 실행합니다.
+ ML 모델(SageMaker 또는 사용자 지정 훈련을 통해)을 패키징하여 디바이스에서 직접 추론을 수행합니다.
+ 안전한 over-the-air.
+ 중앙 집중식 모니터링을 위해 AWS 서비스 (예: Amazon S3 AWS IoT Core및 Amazon CloudWatch)와 통합합니다.

### 의 사용 사례 예제 AWS IoT Greengrass
<a name="section-edge-greengrass-use-cases"></a>

AWS IoT Greengrass 는 다음과 같은 여러 산업의 엣지에서 추론 애플리케이션을 활성화합니다.
+ **제조** - 구름 왕복 없이 카메라 입력의 결함을 감지합니다.
+ **의료** - 간헐적인 연결로 환자를 모니터링하고 클리닉에서 진단을 수행합니다.
+ **농업** - 드론 영상을 사용하여 작물 조건을 분류합니다.
+ **에너지** - 이상 탐지 모델을 사용하여 파이프라인과 터빈을 모니터링합니다.

AWS IoT Greengrass 를 사용하면 이러한 워크로드를 클라우드 측 관리, 관찰성 및 동기화를 제공하면서 클라우드 지연 시간과 관계없이 빠르고 복원력이 뛰어나며 독립적일 수 있습니다. AWS IoT Greengrass개발자는를 사용하여 클라우드에서 사용되는 것과 동일한 Lambda 함수를 배포하여 중앙 집중식 및 분산형 시스템 간에 연속성을 생성할 수 있습니다.

## 글로벌 및 로컬 AI: 계층형 실행 전략
<a name="section-edge-tiered-strategy"></a>

기업은 Lambda@Edge와 AWS IoT Greengrass 를 결합하여 계층형 엣지 AI 시스템을 생성할 수 있습니다. 이 하이브리드 아키텍처를 사용하면 지연 시간 민감도, 모델 크기, 연결 및 규정 준수 요구 사항에 따라 적절한 계층에서 지능적인 결정을 내릴 수 있습니다. 다음 표에서는이 아키텍처의 계층, AWS 기술 및 역할에 대해 설명합니다.


| 
| 
| **계층** | **AWS 기술** | **기술 역할** | 
| --- |--- |--- |
| 디바이스 엣지 | AWS IoT Greengrass |   디바이스 내   오프라인 지원   AI 로직   센서 데이터 처리   | 
| 네트워크 엣지 | Lambda@Edge |   콘텐츠 개인화   사용자 근처의 경량 AI   지연 시간이 매우 짧음   | 
| 클라우드 코어 | Amazon Bedrock, Amazon SageMaker Serverless Inference 및 AWS Step Functions |   헤비 AI 추론   오케스트레이션   에이전트 추론   RAG 파이프라인   | 

## 엣지 AI 요약
<a name="section-edge-summary"></a>

엣지 AI는 서버리스 아키텍처의 자연스러운 진화로, 연결 문제에 지연 시간이 짧은 추론, 컨텍스트 개인화 및 복원력을 제공합니다. AWS IoT Greengrass 및 Lambda@Edge를 사용하면 조직은 다음을 달성할 수 있습니다.
+ 개발자는 데이터 센터를 넘어 서버리스 원칙을 확장할 수 있습니다.
+ 기업은 AI 파이프라인을 사용자 및 데이터 소스에 더 가깝게 배포하고 유지할 수 있습니다.
+ AI 로직은 위치 인식, 자율성 및 확장성이 뛰어납니다.

AI는 스마트 시티부터 필드 로봇, 글로벌 미디어 전송에 이르기까지 여러 분야에서 널리 사용되고 있습니다. 이러한 진화를 지원하기 위해 이러한 진화는 어디서나 실행되는 분산된 지능형 애플리케이션을 구축하는 데 기본적인 역할을 할 AWS 서비스 수 있습니다.