Microsoft OneDrive コネクタ V1.0 - Amazon Kendra

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Microsoft OneDrive コネクタ V1.0

Microsoft OneDrive は、コンテンツの保存、共有、およびホストに使用できるクラウドベースのストレージサービスです。Amazon Kendraを使用して Microsoft OneDrive データソースのインデックスを作成できます。

注記

OneDrive コネクタ V1.0/Microsft OneDrive API のサポートは、2023 年 6 月までに終了する予定です。OneDrive コネクタ V2.0/TemplateConfiguration API を使用することをお勧めします。

Amazon KendraOneDrive データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング

サポートされている機能

  • フィールドマッピング

  • 包含/除外フィルター

前提条件

Amazon Kendraを使用して OneDrive データソースのインデックスを作成する前に、OneDrive とAWSアカウントでこれらの変更を行います。

Azure Active Directory (AD) で、以下を確認します。

  • Azure Active Directory (AD) アプリケーションを作成しました。

  • AD アプリケーション ID を使用して AD サイト上のアプリケーションのシークレットキーを登録しました。シークレットキーには、アプリケーション ID とシークレットキーが含まれている必要があります。

  • 組織の AD ドメインをコピーしました。

  • Microsoft Graph オプションで、AD アプリケーションに次のアプリケーションアクセス権限を追加しました。

    • すべてのサイトコレクション内のファイルを読み取る (File.Read.All)

    • すべてのユーザーの完全なプロフィールを読み取る (User.Read.All)

    • ディレクトリデータを読み取る (Directory.Read.All)

    • すべてのグループを読み取る (Group.Read.All)

    • すべてのサイトコレクションの項目の読み取り (Site.Read.All)

  • インデックスを作成する必要があるドキュメントを持つユーザーのリストをコピーしました。ユーザー名のリストを指定するか、Amazon S3 に保存されているファイルにユーザー名を指定できます。データソースを作成すると、次のことが行なえます。

    • ユーザーのリストを変更します。

    • ユーザーのリストから Amazon S3バケットに保存されているリストに変更します。

    • ユーザーのリストのAmazon S3バケットの場所を変更します。バケットの場所を変更する場合は、データソースのIAMロールを更新して、バケットにアクセスできるようにする必要があります。

      注記

      ユーザー名のリストを Amazon S3バケットに保存する場合、データソースのIAMポリシーは、バケットへのアクセスと、バケットが暗号化されたキーへのアクセスを提供する必要があります。

  • 各ドキュメントが OneDrive および同じインデックスを使用予定の他のデータソース間で一意であることが確認されていること。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。

でAWS アカウント、以下があることを確認します。

  • Amazon Kendraインデックスを作成し、API を使用している場合はインデックス ID を記録しました。

  • データソースの IAMロールを作成し、 API を使用している場合はロールの ARN を記録しましたIAM。

    注記

    認証タイプと認証情報を変更する場合は、IAMロールを更新して正しいAWS Secrets Managerシークレット ID にアクセスする必要があります。

  • OneDrive の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。

    注記

    認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません

既存のIAMロールまたはシークレットがない場合は、OneDrive データソースを接続するときに コンソールを使用して新しいIAMロールとSecrets Managerシークレットを作成できますAmazon Kendra。API を使用している場合は、既存のIAMロールとSecrets Managerシークレットの ARN とインデックス ID を指定する必要があります。

接続手順

OneDrive データソースAmazon Kendraに接続するには、 がデータAmazon Kendraにアクセスできるように、OneDrive 認証情報の詳細を指定する必要があります。OneDrive をまだ設定していない場合は、Amazon Kendra「」を参照してください前提条件

Console

OneDrive Amazon Kendraに接続するには

  1. にサインインAWS マネジメントコンソールし、 Amazon Kendraコンソールを開きます。

  2. 左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。

    注記

    [インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。

  3. [使用開始] ページで、[データソースを追加] を選択します。

  4. [データソースを追加] ページで [OneDrive コネクタ] を選択し、[コネクタを追加] を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いた [OneDrive コネクタ] を選択します。

  5. [データソースの詳細を指定] ページで、次の情報を入力します。

    1. [名前と説明][データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。

    2. (オプション) [説明] - オプションで、データソースの説明を入力します。

    3. [デフォルト言語] - インデックス用にドキュメントをフィルターするための言語。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。

    4. タグで、新しいタグを追加する - リソースを検索してフィルタリングしたり、AWSコストを追跡したりするためのオプションのタグを含めます。

    5. [次へ] を選択します。

  6. [アクセスとセキュリティの定義] ページで、次の情報を入力します。

    1. OneDrive テナント ID - OneDrive テナント ID をプロトコルなしで入力します。

    2. [認証のタイプ] の場合 - [新規][既存] を選択します。

      1. [既存] を選択した場合は、[シークレットを選択] で既存のシークレットを選択します。

      2. [新規] を選択した場合は、[新規の AWS Secrets Manager シークレット] セクションに次の情報を入力します。

        1. [シークレット名] - シークレットの名前。シークレット名に、プレフィックス「AmazonKendra-OneDrive-」が自動的に追加されます。

        2. [アプリケーション ID] および [アプリケーションパスワード] - OneDrive アカウントの認証情報の値を入力し、[認証を保存] を選択します。

    3. IAMrole — 既存のIAMロールを選択するか、新しいIAMロールを作成してリポジトリの認証情報とインデックスコンテンツにアクセスします。

      注記

      IAMインデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。

    4. [次へ] を選択します。

  7. [同期設定の構成] ページで、次の情報を入力します。

    1. ユースケースに基づいて、[リストファイル][名前リスト] のどちらかを選択します。

      1. [リストファイル] を選択した場合は、次の情報を入力します。

        1. [場所を選択する] - Amazon S3 バケットへのパスを入力します。

          ユーザーリストファイルを に追加するAmazon S3 — ユーザーリストファイルをAmazon S3バケットに追加する場合に選択します。

          [ユーザーローカルグループマッピング] - ローカルグループマッピングを使用してコンテンツをフィルタリングします。

      2. [名前リスト] を選択した場合は、次の情報を入力します。

        1. ユーザー名 - インデックスを作成するユーザードライブを最大 10 件入力します。10 件以上のユーザーを追加するには、名前を含むファイルを作成します。

          [別のものを追加] - さらにユーザーを追加します。

          [ユーザーローカルグループマッピング] - ローカルグループマッピングを使用してコンテンツをフィルタリングします。

    2. [追加設定] の場合 - 特定のファイルを含めるか除外する正規表現パターンを追加します。最大 100 のパターンを追加できます。

    3. 同期実行スケジュール、頻度 - Amazon Kendraがデータソースと同期する頻度を選択します。

    4. [次へ] を選択します。

  8. [フィールドマッピングを設定] ページで、次の情報を入力します。

    1. デフォルトのデータソースフィールド追加の推奨フィールドマッピングの場合 - インデックスにマッピングするAmazon Kendra生成されたデフォルトのデータソースフィールドから選択します。

    2. [次へ] を選択します。

  9. [確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。

API

OneDrive Amazon Kendraに接続するには

OneDriveConfiguration API を使用して以下を指定する必要があります。

  • テナント ID - 組織の Azure Active Directory ドメインを指定します。

  • OneDrive ユーザー - インデックスを作成する必要があるドキュメントを持つユーザーアカウントのリストを指定します。

  • Secret Amazon Resource Name (ARN) — OneDrive アカウントの認証情報を含む Secrets Managerシークレットの Amazon リソースネーム (ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。

    { "username": "OAuth client ID", "password": "client secret" }
  • IAMrole — を呼び出しCreateDataSourceて、シーSecrets Managerクレットにアクセスするためのアクセス許可を IAMロールに提供し、OneDrive コネクタと に必要なパブリック APIs を呼び出すRoleArnタイミングを指定しますAmazon Kendra。詳細については、「IAM roles for OneDrive data sources」を参照してください。

オプションで、次の機能を追加することもできます。

  • 包含フィルターと除外フィルター - 特定のドキュメントを含めるか除外するかを指定します。

    注記

    ほとんどのデータソースは、フィルターと呼ばれる包含または除外パターンである正規表現パターンを使用しています。包含フィルターを指定すると、包含フィルターに一致するコンテンツのみのインデックスが作成されます。包含フィルターに一致しないドキュメントのインデックスは作成されません。包含フィルターと除外フィルターを指定した場合、除外フィルターに一致するドキュメントは、包含フィルターと一致してもインデックスは作成されません。

  • フィールドマッピング - 選択すると、OneDrive データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします。詳細については、「データソースフィールドのマッピング」を参照してください。

    注記

    がドキュメントAmazon Kendraを検索するには、ドキュメント本文フィールドまたはドキュメントと同等のドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名 _document_body にマッピングする必要があります。その他のすべてのフィールドはオプションです。

  • [ユーザーコンテキストのフィルタリングとアクセスコントロール] — ドキュメントの ACL がある場合は、Amazon Kendra がドキュメントのアクセスコントロールリスト (ACL) をクロールします。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。