翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Google Drive コネクタ V1.0
Google Drive はクラウドベースのファイルストレージサービスです。を使用してAmazon Kendra、Google Drive データソースの共有ドライブ、マイドライブ、共有フォルダに保存されているドキュメントやコメントのインデックスを作成できます。Google WorkSpace のドキュメントと、ドキュメントのタイプに記載されているドキュメントにインデックスを作成できます。包含フィルターと除外フィルターを使用して、ファイル名、ファイルタイプ、ファイルパスでコンテンツにインデックスを作成することもできます。
Google Drive コネクタ V1.0/Google DriveConfiguration API のサポートは 2023 年に終了しました。Google Drive コネクタ V2.0/TemplateConfiguration API に移行するか、こちらを使用することをお勧めします。
Amazon KendraGoogle Drive データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング。
サポートされている機能
-
フィールドマッピング
-
ユーザーアクセスコントロール
-
包含/除外フィルター
前提条件
Amazon Kendraを使用して Google Drive データソースのインデックスを作成する前に、Google Drive とAWSアカウントでこれらの変更を行います。
Google Drive で以下を確認してください。
-
スーパー管理者ロールからアクセスを許可されているか、管理者権限を持つユーザーであるかのどちらかです。スーパー管理者ロールからアクセス許可を付与されている場合は、スーパー管理者ロールは必要ありません。
-
[G Suite ドメイン全体の委任を有効にする] を有効にしたサービスアカウントを作成し、そのアカウントを使用してプライベートキーとして JSON キーを作成しました。
-
ユーザーアカウント E メールとサービスアカウント E メールをコピーしました。に接続するAmazon Kendraときは、ユーザーアカウントの E メールを管理者アカウントの E メールとして、サービスアカウントの E メールをクライアント E メールとしてAWS Secrets Managerシークレットに入力します。
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
-
管理者 SDK API と Google Drive API がアカウントに追加されました。
-
スーパー管理者ロールを使用して、以下のアクセス許可をサービスアカウントに追加しました (またはスーパー管理者ロールを持つユーザーに追加を依頼しました)。
-
https://www.googleapis.com/auth/drive.readonly
-
https://www.googleapis.com/auth/drive.metadata.readonly
-
https://www.googleapis.com/auth/admin.directory.user.readonly
-
https://www.googleapis.com/auth/admin.directory.group.readonly
-
各ドキュメントが Google Drive および同じインデックスを使用予定の他のデータソース間で一意であることが確認されていること。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。
でAWS アカウント、以下があることを確認します。
-
Amazon Kendraインデックスを作成し、API を使用している場合はインデックス ID を記録しました。
-
データソースの IAMロールを作成し、 API を使用している場合はロールの ARN を記録しましたIAM。
認証タイプと認証情報を変更する場合は、IAMロールを更新して正しいAWS Secrets Managerシークレット ID にアクセスする必要があります。
-
Google Drive の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
既存のIAMロールまたはシークレットがない場合は、Google Drive データソースを接続するときに コンソールを使用して新しいIAMロールとSecrets Managerシークレットを作成できますAmazon Kendra。API を使用している場合は、既存のIAMロールとSecrets Managerシークレットの ARN とインデックス ID を指定する必要があります。
接続手順
Google Drive データソースAmazon Kendraに接続するには、 がデータAmazon Kendraにアクセスできるように、Google Drive データソースの必要な詳細を指定する必要があります。Google Drive をまだ設定していない場合は、Amazon Kendra「」を参照してください前提条件。
- Console
-
Google Drive Amazon Kendraに接続するには
-
AWSマネジメントコンソールにサインインし、Amazon Kendraコンソールを開きます。
-
左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。
[インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。
-
[使用開始] ページで、[データソースを追加] を選択します。
-
[データソースを追加する] ページで [Google Drive コネクタ V1.0] を選択し、[コネクタを追加] を選択します。
-
[データソースの詳細を指定] ページで、次の情報を入力します。
-
[名前と説明] の [データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。
-
(オプション) [説明] - オプションで、データソースの説明を入力します。
-
[デフォルト言語] - インデックス用にドキュメントをフィルターするための言語。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。
-
タグで新しいタグを追加する - リソースを検索してフィルタリングしたり、AWSコストを追跡したりするためのオプションのタグを含めます。
-
[次へ] を選択します。
-
[アクセスとセキュリティの定義] ページで、次の情報を入力します。
-
[認証のタイプ] の場合 - [既存] と [新規] を選択します。既存のシークレットを使用する場合は、[シークレットを選択] を使用してシークレットを選択してください。
-
新しいシークレットの作成を選択すると、AWS Secrets Manager シークレットオプションが開きます。
-
[AWS Secrets Manager シークレットウィンドウを作成] に次の情報を入力します。
-
[シークレット名] - シークレットの名前。シークレットネームには「AmazonKendra-Google Drive-」というプレフィックスが自動的に追加されます。
-
[管理者アカウントの E メール]、[クライアントの E メール]、[プライベートキー] の場合 - Google Drive アカウントから生成してダウンロードした認証情報の値を入力します。
-
[認証を保存] を選択します。
-
IAMrole — 既存のIAMロールを選択するか、新しいIAMロールを作成してリポジトリの認証情報とインデックスコンテンツにアクセスします。
IAMインデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。
-
[次へ] を選択します。
-
[同期設定の構成] ページで、次の情報を入力します。
-
[ユーザーアカウントを除外する] - インデックスから除外する Google Drive ユーザー。最大 100 件のユーザーアカウントを追加できます。
-
[共有ドライブを除外する] - インデックスから除外する Google Drive の共有ドライブ。最大 100 件の共有ドライブを追加できます。
-
[ファイルタイプのドライブを除外する] - インデックスから除外する Google Drive のファイルタイプ。MIME タイプの選択を編集することもできます。
-
[追加設定] の場合: 特定のコンテンツを含めるか除外する正規表現パターンを指定します。最大 100 のパターンを追加できます。
-
[頻度] - Amazon Kendra がデータソースと同期する頻度。
-
[次へ] を選択します。
-
[フィールドマッピングを設定] ページで、次の情報を入力します。
-
GoogleDrive フィールド名とその他の推奨フィールドマッピングの場合 - インデックスにマッピングするAmazon Kendra生成されたデフォルトのデータソースフィールドから選択します。
-
[フィールドを追加] - カスタムデータソースフィールドを追加して、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。
-
[次へ] を選択します。
-
[確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。
- API
-
Google Drive Amazon Kendraに接続するには
GoogleDriveConfiguration API を使用して以下を指定する必要があります。
-
Secret Amazon Resource Name (ARN) — Google Drive アカウントの認証情報を含む Secrets Managerシークレットの Amazon リソースネーム (ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。
{
"clientAccount": "service account email",
"adminAccount": "user account email"",
"privateKey": "private key"
}
-
IAMrole — を呼び出しCreateDataSourceて、シーSecrets Managerクレットにアクセスするためのアクセス許可を IAMロールに提供し、Google Drive コネクタと に必要なパブリック APIsを呼び出すRoleArnタイミングを指定しますAmazon Kendra。詳細については、「IAM roles for Google Drive data sources」を参照してください。
オプションで、次の機能を追加することもできます。
-
包含フィルターと除外フィルター - デフォルトでは、Amazon Kendra は Google Drive 内のすべてのドキュメントのインデックスを作成します。共有ドライブ、ユーザーアカウント、ドキュメント MIME タイプ、ファイルに特定のコンテンツを含めるか除外するかを指定できます。ユーザーアカウントを除外すると、そのアカウントが所有する My Drive 内のファイルにはインデックスが作成されません。ユーザーと共有されているファイルは、ファイルの所有者も除外されない限り、インデックスが作成されます。
ほとんどのデータソースは、フィルターと呼ばれる包含または除外パターンである正規表現パターンを使用しています。包含フィルターを指定すると、包含フィルターに一致するコンテンツのみのインデックスが作成されます。包含フィルターに一致しないドキュメントのインデックスは作成されません。包含フィルターと除外フィルターを指定した場合、除外フィルターに一致するドキュメントは、包含フィルターと一致してもインデックスは作成されません。
-
フィールドマッピング - 選択すると、Google Drive データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします。詳細については、「データソースフィールドのマッピング」を参照してください。
がドキュメントAmazon Kendraを検索するには、ドキュメント本文フィールドまたはドキュメントと同等のドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名 _document_body にマッピングする必要があります。その他のすべてのフィールドはオプションです。
-
[ユーザーコンテキストのフィルタリングとアクセスコントロール] — ドキュメントの ACL がある場合は、Amazon Kendra がドキュメントのアクセスコントロールリスト (ACL) をクロールします。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。
詳細はこちら
Google Drive データソースAmazon Kendraとの統合の詳細については、以下を参照してください。