AWS CloudFormation を使用してセマンティック検索用のリモート推論をセットアップする - Amazon OpenSearch Service

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS CloudFormation を使用してセマンティック検索用のリモート推論をセットアップする

OpenSearch バージョン 2.9 以降では、セマンティック検索によるリモート推論を使用して独自の機械学習 (ML) モデルをホストできます。リモート推論は ML Commons プラグインを使用します。

リモート推論を使用すると、Amazon SageMaker AI や Amazon Bedrock などの ML サービスでモデル推論をリモートでホストし、ML コネクタを使用して Amazon OpenSearch Service に接続できます。

リモート推論を簡単にセットアップできるように、Amazon OpenSearch Service ではコンソールで AWS CloudFormation テンプレートが提供されます。CloudFormation は、インフラストラクチャ AWS のサービス をコードとして扱うことで、 AWS およびサードパーティーのリソースをプロビジョニング、管理できる です。

OpenSearch CloudFormation テンプレートはモデルのプロビジョニングプロセスを自動化するため、OpenSearch Service ドメインでモデルを簡単に作成し、モデル ID を使用してデータを取り込み、ニューラル検索クエリを実行できます。

OpenSearch Service バージョン 2.12 以降でニューラルスパースエンコーダーを使用する場合は、リモートでデプロイするのではなく、ローカルでトークナイザモデルを使用することをお勧めします。詳細については、OpenSearch ドキュメントの「Sparse encoding models」を参照してください。

使用可能な AWS CloudFormation テンプレート

次の AWS CloudFormation 機械学習 (ML) テンプレートを使用できます。

Amazon Bedrock テンプレート
Amazon Titan Text Embeddings の統合

Amazon Bedrock のホストされた ML モデルに接続し、個別のモデルデプロイが不要になり、事前定義された Amazon Bedrock エンドポイントを使用します。詳細については、「Amazon Bedrock ユーザーガイド」の「Amazon Titan Text Embeddings」を参照してください。

Cohere 埋め込み統合

Cohere Embed モデルへのアクセスを提供し、特定のテキスト処理ワークフロー用に最適化されています。詳細については、Cohere ドキュメントウェブサイトの「埋め込み」を参照してください。

Amazon Titan マルチモーダル埋め込み

テキスト埋め込みとイメージ埋め込みの両方をサポートし、マルチモーダル検索機能を有効にします。詳細については、「Amazon Bedrock ユーザーガイド」の「Amazon Titan マルチモーダル埋め込み」を参照してください。

MCP サーバー統合テンプレート
MCP サーバー統合

Amazon Bedrock AgentCore ランタイムをデプロイし、エージェントエンドポイントを提供し、インバウンド認証とアウトバウンド認証を処理し、エンタープライズ認証用の OAuth をサポートします。

Amazon SageMaker テンプレート
Amazon SageMaker によるテキスト埋め込みモデルとの統合

Amazon SageMaker ランタイムにテキスト埋め込みモデルをデプロイし、モデルアーティファクトアクセス用の IAM ロールを作成し、セマンティック検索用の ML コネクタを確立します。

SageMaker を介したスパースエンコーダーとの統合

ニューラル検索用のスパースエンコーディングモデルを設定し、コネクタ管理用の関数を作成し AWS Lambda 、すぐに使用できるようにモデル IDsを返します。

前提条件

CloudFormation テンプレートを OpenSearch Service で使用するには、次の前提条件を満たす必要があります。

OpenSearch Service ドメインをセットアップする

CloudFormation テンプレートを使用するには、バージョン 2.9 以降の Amazon OpenSearch Service ドメインをセットアップし、詳細なアクセスコントロールを有効にする必要があります。OpenSearch Service バックエンドロールを作成して、コネクタを作成するアクセス許可を ML Commons プラグインに付与します。

CloudFormation テンプレートは、デフォルト名 LambdaInvokeOpenSearchMLCommonsRole で Lambda IAM ロールを作成します。別の名前使用する場合は、デフォルト名をオーバーライドできます。この IAM ロールがテンプレートによって作成されたら、OpenSearch Service ドメインを呼び出すアクセス許可を Lambda 関数に付与する必要があります。そのためには、以下の手順に従って、ml_full_access という名前のロールを OpenSearch Service バックエンドロールにマッピングします。

  1. OpenSearch Service ドメインの OpenSearch Dashboards プラグインに移動します。OpenSearch Service コンソールのドメインダッシュボードに Dashboards エンドポイントがあります。

  2. メインメニューから [セキュリティ]、[ロール] を選択し、[ml_full_access] ロールを選択します。

  3. [マッピングされたユーザー][マッピングの管理] を選択します。

  4. [バックエンドロール] で、ドメインを呼び出すアクセス許可を必要とする Lambda ロールの ARN を追加します。

    arn:aws:iam::account-id:role/role-name
  5. [マップ] を選択し、ユーザーまたはロールが [マッピングされたユーザー] の下に表示されていることを確認します。

ロールをマッピングしたら、ドメインのセキュリティ設定に移動し、Lambda IAM ロールを OpenSearch Service アクセスポリシーに追加します。

AWS アカウントでアクセス許可を有効にする

には、CloudFormation と Lambda にアクセスするためのアクセス許可と、SageMaker ランタイムまたは Amazon Bedrock のいずれかのテンプレートで AWS のサービス 選択したアクセス許可 AWS アカウント が必要です。

Amazon Bedrock を使用している場合、モデルも登録する必要があります。モデルを登録するには、「Amazon Bedrock ユーザーガイド」の「モデルアクセス」を参照してください。

独自の Amazon S3 バケットを使用してモデルアーティファクトを提供する場合は、CloudFormation IAM ロールを S3 アクセスポリシーに追加する必要があります。詳細については、「 IAM ユーザーガイド」の「IAM ID アクセス許可の追加および削除」を参照してください。

セマンティックハイライトテンプレートのリモート推論

セマンティックハイライトは、キーワードの完全一致のみに依存するのではなく、クエリの意味とコンテキストを分析することで結果の関連性を高める高度な検索機能です。この機能では、機械学習モデルを使用して、検索クエリとドキュメントコンテンツの間のセマンティック類似性を評価し、ドキュメント内の最もコンテキストに関連する文や文章を特定して強調表示します。正確な用語一致に焦点を当てた従来の強調表示方法とは異なり、セマンティック強調表示は AI モデルを活用して、クエリと周囲のテキストの両方のコンテキスト情報を使用して各文を評価し、正確な検索用語が強調表示された文章に存在しなくても関連情報を表示できます。このアプローチは、ユーザーがリテラルワードマッチングよりもセマンティックな意味を優先する AI 主導の検索実装に特に役立ちます。これにより、検索管理者はキーワード出現だけでなく、意味のあるコンテンツスパンを強調する、よりインテリジェントでコンテキストに応じた検索エクスペリエンスを提供できます。詳細については、「セマンティックハイライトの使用」を参照してください。

次の手順を使用して、セマンティックハイライト用に Amazon SageMaker モデルを自動的に設定する AWS CloudFormation テンプレートを開き、実行します。

セマンティックハイライト CloudFormation テンプレートを使用するには
  1. https://console.aws.amazon.com/aos/home で Amazon OpenSearch Service コンソールを開きます。

  2. 左側のナビゲーションペインから、[統合] を選択します。

  3. Amazon SageMaker 統合によるセマンティックハイライトの有効化で、ドメインの設定パブリックドメインの設定を選択します。

  4. プロンプトの指示に従ってモデルをセットアップします。

注記

OpenSearch Service は VPC ベースの OpenSearch ドメインを設定するための個別のテンプレートも提供します。このテンプレートを使用する場合は、Lambda 関数の VPC ID を指定する必要があります。