パターン 3: エッジでのリアルタイム推論 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

パターン 3: エッジでのリアルタイム推論

多くのエンタープライズユースケースでは、インタラクションが顧客、マシン、車両、IoT デバイスのいずれであるかにかかわらず、インタラクションの時点でインテリジェントな意思決定が必要です。これらのシナリオでは、以下の問題のため、クラウドのみの推論では不十分です。

  • レイテンシーの制約 – パーソナライゼーション、レコメンデーション、不正チェックなどのユーザーエクスペリエンスではミリ秒が重要です。

  • 断続的または接続なし – 産業、農業、医療などのリモート環境では、クラウド APIs。

  • データ量が多い – 推論のために大きなセンサーまたはイメージペイロードをクラウドに送信すると、非効率でコストがかかります。

  • 規制要件 – 一部の管轄区域では、機密データはローカルのままにする必要があります。

一元化された ML 推論のみに依存する従来のアーキテクチャでは、遅延が発生し、コストが増加し、エッジファースト環境でユーザーやシステムを効果的に提供できなくなる可能性があります。

エッジ推論パターン: エッジでのリアルタイムインテリジェンス

リアルタイムエッジ推論パターンを使用すると、組織は によって管理されるサービスを使用して、ユーザーまたはデバイスの近くで推論ワークロードを実行できます AWS。これらのサービスにはAWS IoT Greengrass、物理エッジデバイスでローカライズされたオフライン可能な推論を可能にする が含まれます。さらに、Lambda@Edge ではAmazon CloudFront エッジロケーションで軽量 AI ロジックをグローバルに実行できます。

これらのサーバーレスサービスにより、瞬時に接続の問題に対する回復力があり、リージョンやレイテンシーの影響を受けやすい要件に準拠する分散 AI エクスペリエンスが可能になります。

リファレンスアーキテクチャは、次のように各レイヤーを実装します。

  • イベントトリガー – CloudFront を介したエッジイベント (センサーの読み取りやデバイスの状態の変更など) またはビューワーリクエストを使用します。

  • 処理 — ローカル Lambda 関数を に実装 AWS IoT Greengrass して、入力のフォーマット、メタデータの抽出、ノイズのフィルタリングを行います。Lambda@Edge を使用して、ヘッダーまたは位置情報を検査します。

  • 推論 – AWS IoT Greengrass コンポーネント ( PyTorchや などONNX) を介して ML モデルをデプロイするか、Lambda@Edge を介して Amazon Bedrock または Amazon SageMaker Serverless Inference にリモート API コールを実行します。

  • 後処理 – 異常 AWS IoT Greengrass 検出を MQTT または AWS IoT デバイスシャドウに発行するために使用します。Lambda@Edge を使用してレスポンスをパーソナライズし、Cookie を設定します。

  • 出力 – AWS IoT Core、Amazon S3、または Amazon EventBridge と同期します。CloudFront 経由でブラウザまたはデバイスダッシュボードにレスポンスを提供します。

注記

各階層は、応答時間を短縮し、帯域幅を最適化し、インテリジェンスをローカライズする役割を果たします。

エッジ推論パターンのユースケース

エッジパターンでのリアルタイム推論は、さまざまな業界のさまざまな実装をサポートします。以下は 2 つの代表的な例です。

  • 工場の機器モニタリングと AWS IoT Greengrass – 製造工場は、機器の振動の異常を検出 AWS IoT Greengrass するために によって有効化されたゲートウェイをデプロイします。モデルはローカルで実行され、オペレーターにリアルタイムで警告し、概要データのみをクラウドに送信します。

  • パーソナライズされたウェブコンテンツと Lambda@Edge – e コマースサイトは Lambda@Edge を使用して、受信リクエストの Cookie とヘッダーを分析します。Lambda@Edge は、バックエンドのラウンドトリップなしで、パーソナライズされたレコメンデーションと製品イメージを 50 ミリ秒未満で配信するのに役立ちます。

エッジにおけるセキュリティと管理のベストプラクティス

IoT Greengrass と Lambda@Edge はどちらも、 AWS Identity and Access Management (IAM) AWS IoT Core、および Amazon CloudWatch と完全に統合されています。主なベストプラクティスは次のとおりです。

  • AWS IoT Greengrass コンポーネントのコード署名と検証

  • Lambda@Edge のリージョントラフィック検査とログ記録

  • Amazon S3 バケットと継続的インテグレーションおよび継続的デプロイ (CI/CD) パイプラインを使用してover-the-air (OTA) モデル更新を保護する

  • エッジでデータアクセスを制限するきめ細かな IAM ロール

AWS IoT Greengrass と Lambda@Edge の比較

次の表は、エッジ推論のコンテキストにおける AWS IoT Greengrass と Lambda@Edge の主な運用面を比較したものです。

考慮事項

AWS IoT Greengrass

Lambda@Edge

オフラインで動作

はい

なし

ローカルセンサーとアクチュエータのデータを処理します

はい

なし

グローバルウェブパーソナライゼーションに適しています

いいえ

はい

AI モデルをサポート

完全なローカル推論

軽量ロジックとクラウド API コール

Amazon Bedrock または SageMaker Serverless Inference との統合

非同期同期とログ記録による

Amazon API Gateway フォールバックまたはキャッシュ経由

このパターンを使用することで、企業は最も必要な場所に AI を埋め込むことができます。作業現場、現場、ブラウザ、または世界中で AI を埋め込むことができます。エッジパターンでのリアルタイム推論は、次の場合に不可欠です。

  • 低レイテンシー、高可用性要件を持つアプリケーション

  • リモート環境または高スループット環境のエッジデバイス

  • ロケーションが重要なグローバルコンシューマーエクスペリエンス

デバイス上のインテリジェンス AWS IoT Greengrass と Lambda@Edge を組み合わせることで、 はスケーラブルで回復力があり、費用対効果の高いエッジ AI に対する強力でサーバーレスなアプローチ AWS を可能にします。

エッジ推論パターンのビジネス値

エッジ推論パターンは、次の領域で値を配信します。

  • パフォーマンス – ユーザー向けアプリケーションまたはタイムクリティカルなオートメーションで 100 ミリ秒未満の推論を実現

  • 信頼性 – 接続なしで動作します。IoT やリモートデプロイでは特に重要です。

  • 帯域幅の削減 – raw データをローカルに保ち、意味のあるイベントのみをクラウドにプッシュします

  • コンプライアンス – 一般データ保護規則 (GDPR) や 1996 年の医療保険の相互運用性と説明責任に関する法律 (HIPAA) などのリージョンガバナンスに準拠するために、推論とデータをローカルに維持します

  • コスト管理 – 重要でない場合にクラウドリソースの使用量とネットワークトラフィックを最小限に抑える