翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
CloudFormationを使用してセマンティック検索用のリモート推論をセットアップする
OpenSearch バージョン 2.9 以降では、セマンティック検索
リモート推論を使用すると、Amazon SageMaker AI や Amazon Bedrock などの ML サービス上でモデル推論をリモートでホストし、ML コネクタを使用して Amazon OpenSearch Service に接続することができます。
リモート推論を簡単にセットアップできるように、Amazon OpenSearch Service ではコンソールで AWS CloudFormation テンプレートが提供されます。CloudFormation は、インフラストラクチャAWS のサービスをコードとして扱うことで、 AWSおよびサードパーティーのリソースをプロビジョニング、管理できる です。
OpenSearch CloudFormation テンプレートはモデルのプロビジョニングプロセスを自動化するため、OpenSearch Service ドメインでモデルを簡単に作成し、モデル ID を使用してデータを取り込み、ニューラル検索クエリを実行できます。
OpenSearch Service バージョン 2.12 以降でニューラルスパースエンコーダーを使用する場合は、リモートでデプロイするのではなく、ローカルでトークナイザモデルを使用することをお勧めします。詳細については、OpenSearch ドキュメントの「Sparse encoding models
トピック
使用可能なCloudFormationテンプレート
次のAWS CloudFormation機械学習 (ML) テンプレートを使用できます。
Amazon Bedrock テンプレート
- Amazon Titan Text Embeddings の統合
-
Amazon Bedrock のホストされた ML モデルに接続し、個別のモデルデプロイが不要になり、事前定義された Amazon Bedrock エンドポイントを使用します。詳細については、「Amazon Bedrock ユーザーガイド」の「Amazon Titan Text Embeddings」を参照してください。
- Cohere 埋め込み統合
-
Cohere Embed モデルへのアクセスを提供し、特定のテキスト処理ワークフロー向けに最適化されています。詳細については、「Cohere ドキュメント」サイトの「Embed
」を参照してください。 - Amazon Titan Multimodal Embeddings
-
テキスト埋め込みとイメージ埋め込みの両方をサポートし、マルチモーダル検索機能を有効にします。詳細については、「Amazon Bedrock ユーザーガイド」の「Amazon Titan Multimodal Embeddings」を参照してください。
MCP サーバー統合テンプレート
- MCP サーバー統合
-
Amazon Bedrock AgentCore ランタイムをデプロイし、エージェントエンドポイントを提供し、インバウンド認証とアウトバウンド認証を処理し、エンタープライズ認証用の OAuth をサポートします。
Amazon SageMaker テンプレート
- Amazon SageMaker によるテキスト埋め込みモデルとの統合
-
Amazon SageMaker ランタイムにテキスト埋め込みモデルをデプロイし、モデルアーティファクトアクセス用の IAM ロールを作成し、セマンティック検索用の ML コネクタを確立します。
- SageMaker を介したスパースエンコーダーとの統合
-
ニューラル検索用のスパースエンコーディングモデルを設定し、コネクタ管理用の AWS Lambda 関数を作成し、すぐに使用できるようにモデル ID を返します。
前提条件
CloudFormation テンプレートを OpenSearch Service で使用するには、次の前提条件を満たす必要があります。
OpenSearch Service ドメインをセットアップする
CloudFormation テンプレートを使用するには、バージョン 2.9 以降の Amazon OpenSearch Service ドメインをセットアップし、詳細なアクセスコントロールを有効にする必要があります。OpenSearch Service バックエンドロールを作成して、コネクタを作成するアクセス許可を ML Commons プラグインに付与します。
CloudFormation テンプレートは、デフォルト名 LambdaInvokeOpenSearchMLCommonsRole で Lambda IAM ロールを作成します。別の名前使用する場合は、デフォルト名をオーバーライドできます。この IAM ロールがテンプレートによって作成されたら、OpenSearch Service ドメインを呼び出すアクセス許可を Lambda 関数に付与する必要があります。そのためには、以下の手順に従って、ml_full_access という名前のロールを OpenSearch Service バックエンドロールにマッピングします。
-
OpenSearch Service ドメインの OpenSearch Dashboards プラグインに移動します。OpenSearch Service コンソールのドメインダッシュボードに Dashboards エンドポイントがあります。
-
メインメニューから [セキュリティ]、[ロール] を選択し、[ml_full_access] ロールを選択します。
-
[マッピングされたユーザー]、[マッピングの管理] を選択します。
-
[バックエンドロール] で、ドメインを呼び出すアクセス許可を必要とする Lambda ロールの ARN を追加します。
arn:aws:iam::account-id:role/role-name -
[マップ] を選択し、ユーザーまたはロールが [マッピングされたユーザー] の下に表示されていることを確認します。
ロールをマッピングしたら、ドメインのセキュリティ設定に移動し、Lambda IAM ロールを OpenSearch Service アクセスポリシーに追加します。
AWS アカウントでアクセス許可を有効にする
には、テンプレートにAWS のサービス選択した SageMaker ランタイムまたは Amazon Bedrock のいずれかとともに、CloudFormation と Lambda へのアクセス許可AWS アカウントが必要です。
Amazon Bedrock を使用している場合、モデルも登録する必要があります。モデルを登録するには、「Amazon Bedrock ユーザーガイド」の「Model access」を参照してください。
独自の Amazon S3 バケットを使用してモデルアーティファクトを提供する場合は、CloudFormation IAM ロールを S3 アクセスポリシーに追加する必要があります。詳細については、 IAM ユーザーガイドの「IAM ID アクセス許可の追加および削除」を参照してください。
セマンティックハイライトテンプレートに対するリモート推論
セマンティックハイライトは、キーワードの完全一致のみに依存するのではなく、クエリの意味とコンテキストを分析することで結果の関連性を高める高度な検索機能です。この機能は、機械学習モデルを使用して検索クエリとドキュメントコンテンツ間のセマンティック類似性を評価することで、ドキュメント内で特にコンテキスト関連性が高い文章やフレーズを抽出して強調表示します。従来のハイライト手法が正確な語句の一致に焦点を当てているのに対し、セマンティックハイライトは AI モデルを活用し、クエリと周辺テキスト両方のコンテキスト情報をもとに各文を評価します。これにより、検索語がハイライト対象の文に正確に含まれていない場合でも、関連性の高い情報を抽出することが可能になります。このアプローチは、ユーザーが文字通りの語句一致よりもセマンティックな関連性を重視する AI 駆動型の検索実装に役立ちます。これにより、検索管理者は、単なるキーワードの出現箇所ではなく、意味のあるコンテンツスパンを強調する、よりインテリジェントでコンテキストに応じた検索エクスペリエンスを提供できます。詳細については、「Using semantic highlighting
次の手順を使用して、セマンティックハイライト用に Amazon SageMaker モデルを自動的に設定する CloudFormationテンプレートを開き、実行します。
セマンティックハイライト CloudFormation テンプレートを使用するには
-
https://console.aws.amazon.com/aos/home
で Amazon OpenSearch Service コンソールを開きます。 -
左側のナビゲーションペインから、[統合] を選択します。
-
[Amazon SageMaker 統合によるセマンティックハイライトの有効化] で、[ドメインの設定]、[パブリックドメインの設定] を選択します。
-
プロンプトの指示に従ってモデルをセットアップします。
注記
OpenSearch Service は VPC ベースの OpenSearch ドメインを設定するための個別のテンプレートも提供します。このテンプレートを使用する場合は、Lambda 関数の VPC ID を指定する必要があります。