チュートリアル: Amazon Kendra を使用したメタデータに富んだインテリジェントな検索ソリューションの構築
このチュートリアルでは、Amazon Kendra
Amazon Kendra は、非構造化自然言語データリポジトリの検索インデックスを構築できるインテリジェントな検索サービスです。お客様が関連する回答を簡単に検索してフィルタリングできるようにするには、Amazon Comprehend を使用してデータからメタデータを抽出し、Amazon Kendra 検索インデックスに取り込みます。
Amazon Comprehend は、エンティティを識別できる自然言語処理 (NLP) サービスです。エンティティは、データ内の人、場所、位置、組織、およびオブジェクトのリファレンスです。
このチュートリアルでは、ニュース記事のサンプルデータセットを使用して、エンティティを抽出し、メタデータに変換し、Amazon Kendra インデックスに取り込んで検索を実行します。追加されたメタデータを使用すると、これらのエンティティのサブセットを使用して検索結果をフィルタリングでき、検索の精度が向上します。このチュートリアルに従うことで、専門的な機械学習知識がなくても、エンタープライズデータの検索ソリューションを作成する方法を学習します。
このチュートリアルでは、以下のステップで検索ソリューションを構築する方法を示します。
-
Amazon S3 にニュース記事のサンプルデータセットを保存する。
-
Amazon Comprehend を使用してデータからエンティティを抽出します。
-
Python 3 スクリプトを実行してエンティティを Amazon Kendra インデックスメタデータ形式に変換し、このメタデータを S3 に保存します。
-
Amazon Kendra 検索インデックスを作成し、データとメタデータを取り込みます。
-
検索インデックスのクエリ。
以下の図に、このワークフローを示しています。
このチュートリアルを完了する予定時間: 1 時間
推定コスト: このチュートリアルのアクションには、AWS アカウントの変更を引き起こすものがあります。各サービスのコストの詳細については、Amazon S3
トピック
前提条件
このチュートリアルを完了するには、以下のリソースが必要です。
-
AWS アカウント。AWS アカウントをお持ちの場合は、Amazon Kendra のセットアップの手順を行い、AWS アカウントをセットアップします。
-
AWS コマネジメントコンソールにアクセスするための、Windows、macOS、および Linux を実行している開発用コンピュータ。詳細については、AWS マネジメントコンソールの設定を参照してください。
-
AWS Identity and Access Management
(IAM) ユーザー。アカウントの IAM ユーザーとグループをセットアップする方法については、IAM ユーザーガイドの開始方法セクションを参照してください。 AWS Command Line Interface を使用している場合、このチュートリアルを完了するために必要な基本的なアクセス権限を付与するために、IAM ユーザーに以下のポリシーをアタッチする必要があります。
詳細については、IAM ポリシーの作成およびIAM アイデンティティアクセス許可の追加と削除を参照してください。
-
AWS リージョンサービスリスト
。レイテンシーを減らすには、Amazon Comprehend と Amazon Kendra の両方でサポートされている地理的な場所に最も近い AWS リージョンを選択する必要があります。 -
(オプション)AWS Key Management Service 。このチュートリアルでは暗号化を使用しませんが、特定のユースケースで暗号化のベストプラクティスを使用することをお勧めします。
-
(オプション) Amazon Virtual Private Cloud。このチュートリアルでは VPC を使用しませんが、VPC のベストプラクティスを使用して特定のユースケースでデータセキュリティを確保することをお勧めします。