チュートリアル: Amazon Kendra を使用したメタデータに富んだインテリジェントな検索ソリューションの構築

このチュートリアルでは、Amazon Kendra、Amazon Comprehend、Amazon Simple Storage Service(S3)、AWS CloudShell を使用して、エンタープライズデータ向けのメタデータに富んだ自然言語ベースのインテリジェント検索ソリューションを構築する方法を説明します。

Amazon Kendra は、非構造化自然言語データリポジトリの検索インデックスを構築できるインテリジェントな検索サービスです。お客様が関連する回答を簡単に検索してフィルタリングできるようにするには、Amazon Comprehend を使用してデータからメタデータを抽出し、Amazon Kendra 検索インデックスに取り込みます。

Amazon Comprehend は、エンティティを識別できる自然言語処理 (NLP) サービスです。エンティティは、データ内の人、場所、位置、組織、およびオブジェクトのリファレンスです。

このチュートリアルでは、ニュース記事のサンプルデータセットを使用して、エンティティを抽出し、メタデータに変換し、Amazon Kendra インデックスに取り込んで検索を実行します。追加されたメタデータを使用すると、これらのエンティティのサブセットを使用して検索結果をフィルタリングでき、検索の精度が向上します。このチュートリアルに従うことで、専門的な機械学習知識がなくても、エンタープライズデータの検索ソリューションを作成する方法を学習します。

このチュートリアルでは、以下のステップで検索ソリューションを構築する方法を示します。

Amazon S3 にニュース記事のサンプルデータセットを保存する。
Amazon Comprehend を使用してデータからエンティティを抽出します。
Python 3 スクリプトを実行してエンティティを Amazon Kendra インデックスメタデータ形式に変換し、このメタデータを S3 に保存します。
Amazon Kendra 検索インデックスを作成し、データとメタデータを取り込みます。
検索インデックスのクエリ｡

以下の図に、このワークフローを示しています。

このチュートリアルを完了する予定時間: 1 時間

推定コスト: このチュートリアルの一部のアクションでは、 AWS アカウントに料金が発生します。各サービスのコストの詳細については、Amazon S3、Amazon Comprehend、AWS CloudShell、および Amazon Kendra の料金ページを参照してください。

トピック

前提条件

このチュートリアルを完了するには、以下のリソースが必要です。

AWS アカウント。 AWS アカウントがない場合は、「Amazon Kendra のセットアップ」の手順に従って AWS アカウントを設定します。
AWS コマネジメントコンソールにアクセスするための、Windows、macOS、および Linux を実行している開発用コンピュータ。詳細については、「 AWS マネジメントコンソールの設定」を参照してください。

AWS Identity and Access Management (IAM) ユーザー。アカウントの IAM ユーザーとグループをセットアップする方法については、IAM ユーザーガイドの開始方法セクションを参照してください。

を使用している場合は AWS Command Line Interface、次のポリシーを IAM ユーザーにアタッチして、このチュートリアルを完了するために必要な基本的なアクセス許可を付与する必要があります。

詳細については、IAM ポリシーの作成およびIAM アイデンティティアクセス許可の追加と削除を参照してください。

AWS リージョンサービスリスト。レイテンシーを減らすには、Amazon Comprehend と Amazon Kendra の両方でサポートされている地理的な場所に最も近い AWS リージョンを選択する必要があります。
(オプション) AWS Key Management Service。このチュートリアルでは暗号化を使用しませんが、特定のユースケースで暗号化のベストプラクティスを使用することをお勧めします。
(オプション) Amazon Virtual Private Cloud。このチュートリアルでは VPC を使用しませんが、VPC のベストプラクティスを使用して特定のユースケースでデータセキュリティを確保することをお勧めします。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

検索結果の強調表示

ステップ 1: ドキュメントを追加する