コンソールでの自動最適化の使用 - Amazon OpenSearch Service

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

コンソールでの自動最適化の使用

Amazon OpenSearch Service コンソールを使用して、ベクトル取り込みジョブの作成、進行状況のモニタリング、最適化レコメンデーションの表示、それらのレコメンデーションに基づくインデックスの構築を行うことができます。

前提条件

コンソールで自動最適化を使用する前に、以下が必要です。

  • OpenSearch コンソールにアクセスできるアクティブな AWS アカウント。

  • タイプベクトル検索または Managed OpenSearch ドメインの既存の OpenSearch Serverless コレクション。

  • 次のアクションの IAM アクセス許可:

    • opensearch:SubmitAutoOptimizeJob

    • opensearch:GetAutoOptimizeJob

    • opensearch:DeleteAutoOptimizeJob

    • opensearch:CancelAutoOptimizeJob

    • opensearch:ListAutoOptimizeJobs

    注記

    これらはアイデンティティベースのポリシーです。 AWS は、リソースを自動最適化するためのリソースベースのポリシーをサポートしていません。

  • 認証情報の有効期限が 1 時間以上になるようにフェデレーティッドユーザーセッションを設定します。非常に大きなデータセットや高いディメンションの場合は、有効期限を最大 3 時間延長することを検討してください。

ベクトル取り込みジョブの作成

ベクトル取り込みジョブは、ベクトルデータを分析し、インデックス設定の最適化に関する推奨事項を提供します。

ベクトル取り込みジョブを作成するには
  1. で Amazon OpenSearch Service コンソールにサインインしますAWS マネジメントコンソール

  2. ナビゲーションペインで、自動最適化を選択します。

  3. ベクトル取り込みジョブの作成 を選択します。

  4. ジョブの詳細に、ベクトル取り込みジョブの名前を入力します。この名前は、コンソールでジョブを識別するのに役立ちます。

  5. データソースで、以下を設定します。

    1. Amazon S3 URI の場合は、Parquet ファイルを含むフォルダの Amazon S3 URI を入力します。URI は、個々のファイルではなく、囲みフォルダを指す必要があります。例えば、Parquet ファイルが にある場合はs3://my-bucket/my-folder/file1.parquet、 と入力しますs3://my-bucket/my-folder/

    2. リージョンで、Amazon S3 バケットがある AWS リージョンを選択します。リージョンはバケットの場所と一致する必要があります。

  6. OpenSearch ドメインで、既存のドメインまたはコレクションを選択するか、新規作成を選択して作成します。

    注記

    OpenSearch Managed ドメインまたは OpenSearch Serverless サーバーレスコレクションを指定できます。

  7. データソースのアクセス許可で、Amazon S3 バケットと OpenSearch ドメインまたはコレクションにアクセスするアクセス許可を持つ IAM ロールを指定します。ロールには、ドメインまたはコレクション設定に基づいて必要なアクセス許可が必要です。

    • ドメインアクセスポリシーを持つ OpenSearch ドメインの場合、そのポリシーを通じてロールアクセスを許可します。

    • きめ細かなアクセスコントロールを持つ OpenSearch ドメインの場合は、ロールをバックエンドロールとして追加します。

    • OpenSearch Serverless コレクションの場合、データアクセスポリシーに ロールを追加します。

  8. [次へ] を選択します。

  9. インデックスを設定する で、以下を指定します。

    1. フィールド名に、ベクトルデータを含む Parquet データセットの列名を入力します。

    2. スペースタイプでは、ベクトル間の距離を計算するために使用される距離メトリクスを選択します。

      • l2 - ユークリッド距離

      • Cosinesimil - Cosine の類似度

      • 内部製品 - 内部製品

    3. ディメンションには、各ベクトルの浮動小数点値の数を入力します。

  10. パフォーマンス要件で、以下を設定します。

    1. リコールでは、目的の検索品質を 0~1 の 10 進値として指定します。リコール値が高いほど、より関連性の高い結果が返されます。例えば、次のようになります。

      • 0.95 は、クエリベクトルに最も近い 20 個のドキュメントベクトルのうち、平均 19 個が返されることを示します。

      • 0.9 は 10 の 9 を示します

      • 0.8 は 10 の 8 を示します

    2. 検索レイテンシーの要件については、レイテンシー許容値を選択します。ささいな要件では、メモリ要件を減らす圧縮方法により、より多くのコスト削減が可能になります。

  11. [次へ] を選択します。

  12. 設定を確認し、作成を選択します。

ジョブは処理を開始します。Vector Ingestion Jobs テーブルで進行状況をモニタリングできます。

最適化ジョブのモニタリング

ベクトル取り込みジョブのステータスは、自動最適化ランディングページからモニタリングできます。

最適化ジョブをモニタリングするには
  1. https://console.aws.amazon.com/aos/home で Amazon OpenSearch Service コンソールにサインインします。

  2. ナビゲーションペインで、自動最適化を選択します。

  3. Vector Ingestion Jobs テーブルには、現在のステータスのすべてのジョブが表示されます。更新されたステータス情報を表示するには、ページを更新します。

    注記

    自動更新や通知のメカニズムはありません。ジョブの完了を確認するには、コンソールを手動で更新する必要があります。

ジョブステータスの状態について

自動最適化ジョブのステータス値は次のとおりです。

保留中

ジョブはキューに入れられ、開始を待っています。

実行中

自動最適化ジョブは、データを積極的に分析し、レコメンデーションを生成しています。

完了

自動最適化ジョブが正常に終了しました。すべての分析、評価、レコメンデーションが完了し、表示できるようになります。

失敗

ジョブでエラーが発生しました。ジョブの詳細ページでエラーの詳細を表示して、原因を特定します。

Active

アタッチされたクラスターにインデックスが作成され、データが取り込まれました。

ジョブ期間は、主にデータセットのサイズと現在のサービスの負荷によって異なります。一般的なジョブは 15 分から数時間以内に完了します。

ジョブの詳細の表示

設定やステータスなど、特定の最適化ジョブに関する詳細情報を表示できます。

ジョブの詳細を表示するには
  1. https://console.aws.amazon.com/aos/home で Amazon OpenSearch Service コンソールにサインインします。

  2. ナビゲーションペインで、自動最適化を選択します。

  3. Vector Ingestion Jobs テーブルで、ジョブ名を選択します。

  4. ジョブの詳細ページには、次の情報が表示されます。

    • ジョブ名とステータス

    • データソース設定 (Amazon S3 URI とリージョン)

    • OpenSearch ドメインまたはコレクション

    • インデックス設定 (フィールド名、スペースタイプ、ディメンション)

    • パフォーマンス要件 (リコールとレイテンシー)

    • エラーメッセージ (ジョブが失敗した場合)

結果の表示と理解

ジョブが正常に完了すると、最適化の推奨事項を表示できます。

最適化結果を表示するには
  1. https://console.aws.amazon.com/aos/home で Amazon OpenSearch Service コンソールにサインインします。

  2. ナビゲーションペインで、自動最適化を選択します。

  3. ベクトル取り込みジョブ テーブルで、完了ステータスのジョブを選択します。

  4. 結果ページには、次のセクションが表示されます。

    • 結果の概要 - 要件と比較した推定検索品質の再現率と、推奨される上位の設定と比較したインデックスメモリフットプリントを表示します。

    • コメンデーション - 最大 3 つの最適化レコメンデーションを一覧表示し、設定に最適な上位のレコメンデーションを順に並べます。各レコメンデーションには以下が含まれます。

      • インデックス設定パラメータ

      • 検索設定パラメータ

      • 期待されるパフォーマンスメトリクス

      • メモリフットプリントの見積もり

    注記

    レコメンデーションは最適な順序で並べられますが、特定のユースケースにより適したレコメンデーションを選択できます。自動最適化は、選択したリコール基準に最も近いものを見つけようとします。

レコメンデーションからインデックスを作成する

最適化レコメンデーションを確認したら、レコメンデーション設定を使用してインデックスを手動で作成するか、選択したレコメンデーションを使用してインデックスを自動的に作成できます。

インデックスを自動的に構築するには
  1. https://console.aws.amazon.com/aos/home で Amazon OpenSearch Service コンソールにサインインします。

  2. ナビゲーションペインで、自動最適化を選択します。

  3. ベクトル取り込みジョブ テーブルで、完了ステータスのジョブを選択します。

  4. レコメンデーションを確認し、使用するレコメンデーションを選択します。

  5. Build index を選択します。

  6. 選択したレコメンデーションを使用してクラスターにインデックスが自動的に作成され、Parquet データセットからベクトルデータが取り込まれます。

インデックスを手動で構築するには
  1. https://console.aws.amazon.com/aos/home で Amazon OpenSearch Service コンソールにサインインします。

  2. ナビゲーションペインで、自動最適化を選択します。

  3. ベクトル取り込みジョブ テーブルで、完了ステータスのジョブを選択します。

  4. レコメンデーションを確認し、選択したレコメンデーションのインデックス設定と検索設定パラメータを書き留めます。

  5. OpenSearch API またはコンソールを使用して、推奨パラメータを含むインデックスを手動で作成します。