模式 3：邊緣的即時推論

許多企業使用案例在互動時需要智慧型決策，無論該互動是與客戶、機器、車輛或 IoT 裝置互動。在這些情況下，純雲端推論不夠，因為下列問題：

僅依賴集中式 ML 推論的傳統架構會導致延遲、增加成本，並且可能無法在邊緣優先環境中有效地為使用者或系統提供服務。

邊緣推論模式：邊緣的即時智慧

即時邊緣推論模式可讓組織使用管理的服務，執行更接近使用者或裝置的推論工作負載 AWS。這些服務包括 AWS IoT Greengrass，允許在實體邊緣裝置上進行本機、離線功能的推論。此外，Lambda@Edge 可在全球 Amazon CloudFront 節點執行輕量型 AI 邏輯。

這些無伺服器服務可實現即時的分散式 AI 體驗、對連線問題的彈性，以及符合區域性和延遲敏感需求。

參考架構實作每一層，如下所示：

事件觸發 – 透過 CloudFront 使用邊緣事件（例如感應器讀取和裝置狀態變更）或檢視器請求。
處理 – 在實作本機 Lambda 函數 AWS IoT Greengrass ，以格式化輸入、擷取中繼資料或篩選雜訊。使用 Lambda@Edge 檢查標頭或地理位置。
推論：透過 AWS IoT Greengrass 元件（例如 PyTorch或 ONNX) 部署 ML 模型，或透過 Lambda@Edge 對 Amazon Bedrock 或 Amazon SageMaker Serverless Inference 進行遠端 API 呼叫。
後置處理 – 用來 AWS IoT Greengrass 將異常偵測發佈至 MQTT 或 AWS IoT 裝置陰影。使用 Lambda@Edge 來個人化回應並設定 Cookie。
輸出 – 同步至 AWS IoT Core、Amazon S3 或 Amazon EventBridge。透過 CloudFront 將回應提供給瀏覽器或裝置儀表板。

每個層在縮短回應時間、最佳化頻寬和在地化智慧方面都扮演著重要角色。

邊緣模式的即時推論支援跨不同產業的各種實作。以下是兩個代表性範例：

工廠設備監控和 AWS IoT Greengrass – 製造工廠部署啟用的閘道 AWS IoT Greengrass ，以偵測設備振動中的異常。模型會在本機執行，即時提醒運算子，而且只會傳送摘要資料至雲端。
個人化 Web 內容和 Lambda@Edge – 電子商務網站使用 Lambda@Edge 來分析傳入請求的 Cookie 和標頭。Lambda@Edge 可協助網站在 50 毫秒內提供個人化的建議和產品映像，無需後端往返。

IoT Greengrass 和 Lambda@Edge 都與 AWS Identity and Access Management(IAM) AWS IoT Core和 Amazon CloudWatch 完全整合。主要最佳實務包括下列項目：

下表比較 AWS IoT Greengrass 和 Lambda@Edge 在邊緣推論內容中的關鍵操作層面。

考量事項	AWS IoT Greengrass	Lambda@Edge
離線運作	是	否
處理本機感應器和致動器資料	是	否
適用於全球 Web 個人化	否	是
支援 AI 模型	完整本機推論	輕量型邏輯和雲端 API 呼叫
與 Amazon Bedrock 或 SageMaker Serverless Inference 整合	透過非同步同步和記錄	透過 Amazon API Gateway 備用或快取

透過使用此模式，企業可以將 AI 嵌入到最需要的地方、商店現場、現場、瀏覽器或全球。邊緣模式的即時推論對於下列項目至關重要：

透過 AWS IoT Greengrass 將裝置內智慧與 Lambda@Edge 結合以接近使用者，為可擴展性、彈性和經濟實惠的邊緣 AI AWS 啟用強大、無伺服器的方法。

邊緣推論模式會在下列區域中提供值：

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

模式 2：使用 Amazon Bedrock 進行代理式 AI 協調

模式 4：多階段 AI 工作流程