Microsoft OneDrive 連接器 V1.0 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Microsoft OneDrive 連接器 V1.0

Microsoft OneDrive 是一種雲端儲存服務,可用來存放、共用和託管您的內容。您可以使用 Amazon Kendra為 Microsoft OneDrive 資料來源編製索引。

注意

對 OneDrive 連接器 V1.0 / Microsft OneDrive API 的支援預計在 2023 年 6 月結束。建議使用 OneDrive 連接器 V2.0 / TemplateConfiguration API。

如需對Amazon KendraOneDrive 資料來源連接器進行故障診斷,請參閱 對資料來源進行故障診斷

支援的功能

  • 欄位對應

  • 包含/排除篩選條件

先決條件

在您可以使用 Amazon Kendra為 OneDrive 資料來源編製索引之前,請在 OneDrive 和AWS帳戶中進行這些變更。

在 Azure Active Directory (AD) 中,請確定您有:

  • 已建立 Azure Active Directory (AD) 應用程式。

  • 使用 AD 應用程式 ID 在 AD 網站上註冊應用程式的私密金鑰。私密金鑰必須包含應用程式 ID 和私密金鑰。

  • 已複製組織的 AD 網域。

  • 在 Microsoft 圖形選項中,將下列應用程式許可新增至 AD 應用程式:

    • 讀取所有網站集合中的檔案 (File.Read.All)

    • 讀取所有使用者的完整設定檔 (User.Read.All)

    • 讀取目錄資料 (Directory.Read.All)

    • 讀取所有群組 (Group.Read.All)

    • 讀取所有網站集合中的項目 (Site.Read.All)

  • 已複製其文件必須編製索引的使用者清單。您可以選擇提供使用者名稱清單,也可以在存放在 的檔案中提供使用者名稱Amazon S3。建立資料來源之後,您可以:

    • 修改使用者清單。

    • 從使用者清單變更為存放在 Amazon S3儲存貯體中的清單。

    • 變更使用者清單的Amazon S3儲存貯體位置。如果您變更儲存貯體位置,您還必須更新資料來源IAM的角色,使其可以存取儲存貯體。

      注意

      如果您將使用者名稱清單存放在 Amazon S3儲存貯體中,資料來源IAM的政策必須提供儲存貯體的存取權,以及存取儲存貯體加密所用的金鑰,如果有的話。

  • 檢查每個文件在 OneDrive 中以及您計劃用於相同索引的其他資料來源中都是唯一的。您要用於索引的每個資料來源不得包含跨資料來源的相同文件。文件 IDs是索引的全域 ID,且每個索引必須是唯一的。

在您的 中AWS 帳戶,請確定您有:

  • 建立Amazon Kendra索引,如果使用 API, 會記下索引 ID。

  • 為您的資料來源建立 IAM角色,如果使用 API, 會記下IAM角色的 ARN。

    注意

    如果您變更身分驗證類型和登入資料,則必須更新您的IAM角色以存取正確的AWS Secrets Manager秘密 ID。

  • 將您的 OneDrive 身分驗證憑證存放在AWS Secrets Manager秘密中,如果使用 API, 會記下秘密的 ARN。

    注意

    建議定期更新或輪換憑證與機密。僅授予作業所需的最低存取層級,以確保自身安全。我們不建議您在資料來源和連接器版本 1.0 和 2.0 (如適用) 之間重複使用登入資料和秘密。

如果您沒有現有的IAM角色或秘密,您可以在連接 OneDrive 資料來源時,使用 主控台建立新的IAM角色和Secrets Manager秘密Amazon Kendra。如果您使用的是 API,則必須提供現有IAM角色和Secrets Manager秘密的 ARN,以及索引 ID。

連線指示

若要Amazon Kendra連線至 OneDrive 資料來源,您必須提供 OneDrive 登入資料的詳細資訊,讓 Amazon Kendra可以存取您的資料。如果您尚未為 設定 OneDrive,Amazon Kendra請參閱 先決條件

Console

Amazon Kendra連線至 OneDrive

  1. 登入 AWS 管理主控台並開啟 Amazon Kendra主控台

  2. 從左側導覽窗格中,選擇索引,然後從索引清單中選擇您要使用的索引。

    注意

    您可以選擇在索引設定下設定或編輯使用者存取控制設定。

  3. 入門頁面上,選擇新增資料來源

  4. 新增資料來源頁面上,選擇 OneDrive 連接器,然後選擇新增連接器。如果使用第 2 版 (如適用),請選擇具有「V2.0」標籤的 OneDrive 連接器

  5. 指定資料來源詳細資訊頁面上,輸入下列資訊:

    1. 名稱和描述中,針對資料來源名稱 - 輸入資料來源的名稱。您可以包含連字號,但不能包含空格。

    2. (選用) 描述 — 輸入資料來源的選用描述。

    3. 預設語言 - 選擇語言來篩選索引的文件。除非您另有指定,否則語言預設為英文。文件中繼資料中指定的語言會覆寫選取的語言。

    4. 標籤中,針對新增標籤 - 包含選用標籤,以搜尋和篩選您的資源或追蹤您的AWS成本。

    5. 選擇下一步

  6. 定義存取和安全性頁面上,輸入下列資訊:

    1. OneDrive 租用戶 ID - 輸入不含通訊協定的 OneDrive 租用戶 ID。

    2. 身分驗證類型 - 在新增現有之間進行選擇。

      1. 若選擇現有,請在選取機密中選擇現有的機密。

      2. 如果您選擇新增,請在新增AWSSecrets Manager秘密區段中輸入下列資訊:

        1. 機密名稱 - 輸入您的機密名稱。字首「AmazonKendra-OneDrive-」會自動新增至您的秘密名稱。

        2. 對於應用程式 ID應用程式密碼 - 輸入 OneDrive 帳戶中的身分驗證憑證值,然後選擇儲存身分驗證

    3. IAMrole - 選擇現有IAM角色或建立新的IAM角色,以存取您的儲存庫登入資料和索引內容。

      注意

      IAM用於索引的 角色無法用於資料來源。如果您不確定現有角色是否用於索引或常見問答集,請選擇建立新角色以避免錯誤。

    4. 選擇下一步

  7. 設定同步設定頁面上,輸入下列資訊:

    1. 根據您的使用案例選擇清單檔案名稱清單

      1. 如果您選擇列出檔案,請輸入下列資訊:

        1. 選取位置 - 輸入儲存Amazon S3貯體的路徑。

          將使用者清單檔案新增至Amazon S3 - 選取 以將使用者清單檔案新增至儲存Amazon S3貯體。

          使用者本機群組映射 - 選取以使用本機群組映射來篩選您的內容。

      2. 如果您選擇名稱清單,請輸入下列資訊:

        1. 使用者名稱 — 輸入最多 10 個要編製索引的使用者磁碟機。若要新增超過 10 位使用者,請建立包含名稱的檔案。

          新增另一個 - 選擇以新增更多使用者。

          使用者本機群組映射 - 選取以使用本機群組映射來篩選您的內容。

    2. 對於其他組態 - 新增規則表達式模式,以包含或排除特定檔案。最多可新增 100 個模式。

    3. 同步執行排程中,針對頻率 - 選擇與您的資料來源Amazon Kendra同步的頻率。

    4. 選擇下一步

  8. 設定欄位映射頁面上,輸入下列資訊:

    1. 對於預設資料來源欄位和其他建議的欄位映射 - 從您要映射到索引Amazon Kendra的產生預設資料來源欄位中選取 。

    2. 選擇下一步

  9. 檢閱和建立頁面上,檢查您輸入的資訊是否正確,然後選取新增資料來源。您也可以選擇從此頁面編輯您的資訊。成功新增資料來源後,您的資料來源將顯示在資料來源頁面上。

API

Amazon Kendra連線至 OneDrive

您必須使用 OneDriveConfiguration API 指定下列項目:

  • 租用戶 ID - 指定組織的 Azure Active Directory 網域。

  • OneDrive 使用者 - 指定其文件應編製索引的使用者帳戶清單。

  • Secret Amazon Resource Name (ARN) — 提供秘密的 Amazon Resource Name (ARN)Secrets Manager,其中包含 OneDrive 帳戶的身分驗證憑證。秘密會以下列金鑰存放在 JSON 結構中:

    { "username": "OAuth client ID", "password": "client secret" }
  • IAMrole—指定RoleArn您何時呼叫 CreateDataSource 以提供IAM角色存取Secrets Manager秘密的許可,以及呼叫 OneDrive 連接器所需的公有 APIs 和 Amazon Kendra。如需詳細資訊,請參閱 IAM OneDrive 資料來源的角色

您也可以新增下列選用功能:

  • 包含和排除篩選條件 - 指定是否包含或排除特定文件。

    注意

    大多數資料來源使用規則表達式模式,作為包含或排除的篩選規則,稱為篩選條件。若您設定包含篩選條件,則只有符合該條件的內容會被編列索引。任何不符合包含篩選條件的文件都不會編製索引。如果您指定包含和排除篩選條件,則符合排除篩選條件的文件不會編製索引,即使它們符合包含篩選條件。

  • 欄位映射 - 選擇將 OneDrive 資料來源欄位映射至您的Amazon Kendra索引欄位。如需詳細資訊,請參閱映射資料來源欄位

    注意

    需要文件內文欄位或文件內文對等項目, Amazon Kendra才能搜尋您的文件。您必須將資料來源中的文件內文欄位名稱映射至索引欄位名稱 _document_body。所有其他欄位是選用的。

  • 使用者內容篩選和存取控制 —Amazon Kendra 如果您有文件的 ACL, 會為您的文件編目存取控制清單 (ACL)。ACL 資訊用於根據使用者或其群組對文件的存取來篩選搜尋結果。如需詳細資訊,請參閱使用者內容篩選