本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon FSx(Windows)
Amazon FSx(Windows) 是一種全受管的雲端型檔案伺服器系統,可提供共用儲存功能。如果您是 Amazon FSx(Windows) 使用者,您可以使用Amazon Kendra 為 Amazon FSx(Windows) 資料來源編製索引。
Amazon Kendra現在支援 升級的 Amazon FSx(Windows) 連接器。
主控台已為您自動升級。您在主控台上建立的任何新連接器都會使用升級的架構。如果您使用 API,您現在必須使用 TemplateConfiguration 物件,而不是 FSxConfiguration 物件來設定連接器。
使用舊版主控台和 API 架構設定的連接器將繼續按設定運作。不過,您將無法編輯或更新它們。如果您想要編輯或更新連接器組態,則必須建立新的連接器。
建議您將連接器工作流程遷移至升級版本。使用較舊架構設定的連接器支援預計在 2024 年 6 月結束。
您可以使用 Amazon Kendra主控台或 TemplateConfiguration API Amazon Kendra連線到您的 Amazon FSx(Windows) 資料來源。
如需疑難排解您的 Amazon KendraAmazon FSx(Windows) 資料來源連接器,請參閱 對資料來源進行故障診斷。
支援的功能
Amazon KendraAmazon FSx(Windows) 資料來源連接器支援下列功能:
-
欄位對應
-
使用者存取控制
-
使用者身分爬取
-
包含和排除篩選條件
-
完整和增量內容同步
-
虛擬私有雲端 (VPC)
先決條件
在您可以使用 Amazon Kendra為 Amazon FSx(Windows) 資料來源編製索引之前,請檢查 Amazon FSx(Windows) 和 的詳細資訊AWS 帳戶。
對於 Amazon FSx(Windows),請確定您有:
-
使用讀取和掛載許可設定 Amazon FSx(Windows)。
-
記下您的檔案系統 ID。您可以在 檔案系統儀表板的 Amazon FSx(Windows) 主控台中找到您的檔案系統 ID。
-
使用 Amazon VPCAmazon FSx(Windows) 檔案系統所在的 設定虛擬私有雲端。
-
記下使用者帳戶的 Amazon FSx(Windows) 身分驗證憑證Active Directory。這包括您的 Active Directory 使用者名稱與 DNS 網域名稱 (例如 user@corp.example.com) 和密碼。
僅使用連接器運作所需的必要登入資料。請勿使用特權登入資料,例如網域管理員。
建議定期更新或輪換憑證與機密。僅授予作業所需的最低存取層級,以確保自身安全。我們不建議您在資料來源以及連接器 1.0 和 2.0 版 (如適用) 之間重複使用登入資料和秘密。
-
已檢查每個文件在 Amazon FSx(Windows) 和您計劃用於相同索引的其他資料來源中是唯一的。您要用於索引的每個資料來源不得包含跨資料來源的相同文件。文件 IDs是索引的全域 ID,且每個索引必須是唯一的。
在您的 中AWS 帳戶,請確定您有:
-
建立Amazon Kendra索引,如果使用 API, 會記下索引 ID。
-
為您的資料來源建立 IAM角色,如果使用 API, 會記下IAM角色的 ARN。
如果您變更身分驗證類型和登入資料,則必須更新您的IAM角色以存取正確的AWS Secrets Manager秘密 ID。
-
將您的 Amazon FSx(Windows) 身分驗證登入資料存放在AWS Secrets Manager秘密中,如果使用 API, 會記下秘密的 ARN。
建議定期更新或輪換憑證與機密。僅授予作業所需的最低存取層級,以確保自身安全。我們不建議您在資料來源以及連接器 1.0 和 2.0 版 (如適用) 之間重複使用登入資料和秘密。
如果您沒有現有的IAM角色或秘密,則可以在將 Amazon FSx(Windows) 資料來源連線到 時,使用 主控台建立新的IAM角色和Secrets Manager秘密Amazon Kendra。如果您使用 API,則必須提供現有IAM角色和Secrets Manager秘密的 ARN,以及索引 ID。
連線指示
若要Amazon Kendra連線至您的 Amazon FSx(Windows) 資料來源,您必須提供 Amazon FSx(Windows) 資料來源的必要詳細資訊,以便 Amazon Kendra可以存取您的資料。如果您尚未設定 Amazon FSx(Windows)Amazon Kendra,請參閱 先決條件。
- Console
-
Amazon Kendra連線至您的 Amazon FSx(Windows) 檔案系統
-
登入 AWS 管理主控台並開啟 Amazon Kendra主控台。
-
從左側導覽窗格中,選擇索引,然後從索引清單中選擇您要使用的索引。
您可以選擇在索引設定下設定或編輯使用者存取控制設定。
-
在入門頁面上,選擇新增資料來源。
-
在新增資料來源頁面上,選擇 Amazon FSx(Windows) 連接器,然後選擇新增連接器。如果使用版本 2 (如適用),請選擇具有「V2.0」標籤的 Amazon FSx(Windows) 連接器。
-
在指定資料來源詳細資訊頁面上,輸入下列資訊:
-
在名稱和描述中,針對資料來源名稱 - 輸入資料來源的名稱。您可以包含連字號,但不能包含空格。
-
(選用) 描述 — 輸入資料來源的選用描述。
-
在預設語言 - 選擇語言來篩選索引的文件。除非您另有指定,否則語言預設為英文。文件中繼資料中指定的語言會覆寫選取的語言。
-
在標籤中,針對新增標籤 - 包含選用標籤,以搜尋和篩選您的資源或追蹤您的AWS成本。
-
選擇下一步。
-
在定義存取和安全性頁面上,輸入下列資訊:
-
Amazon FSx(Windows) 檔案系統 ID — 從下拉式清單中選取從 Amazon FSx(Windows) 擷取的現有檔案系統 ID。或者,建立 Amazon FSx(Windows) 檔案系統。您可以在 檔案系統儀表板的 Amazon FSx(Windows) 主控台中找到您的檔案系統 ID。
-
授權:如果您有 ACL 並想要將其用於存取控制,請開啟或關閉文件的存取控制清單 (ACL) 資訊。ACL 指定使用者可以和群組存取哪些文件。ACL 資訊用於根據使用者或其群組對文件的存取來篩選搜尋結果。如需詳細資訊,請參閱使用者內容篩選。
-
身分驗證 - 選擇現有的AWS Secrets Manager秘密,或建立新的秘密來存放檔案系統登入資料。若建立新機密,系統會開啟 AWS Secrets Manager 機密視窗。
提供秘密來存放使用者名稱和密碼的身分驗證登入資料。使用者名稱必須包含您的 DNS 網域名稱。例如:user@corp.example.com。
儲存並新增您的秘密。
-
Virtual Private Cloud (VPC) — 您必須選取 Amazon VPCAmazon FSx(Windows) 所在的 。您可以包含 VPC 子網路和安全群組。請參閱設定 Amazon VPC。
-
IAMrole - 選擇現有IAM角色或建立新的IAM角色,以存取您的儲存庫登入資料和索引內容。
IAM用於索引的 角色無法用於資料來源。如果您不確定現有角色是否用於索引或常見問答集,請選擇建立新角色以避免錯誤。
-
選擇下一步。
-
在設定同步設定頁面上,輸入下列資訊:
-
同步範圍、Regex 模式 - 新增規則表達式模式,以包含或排除特定檔案。
-
同步模式 - 選擇您希望在資料來源內容變更時更新索引的方式。當您Amazon Kendra第一次使用 同步資料來源時,預設會爬取所有內容並編製索引。如果初始同步失敗,即使您未選擇完全同步做為同步模式選項,仍必須執行資料的完整同步。
-
同步執行排程 - 針對頻率,選擇同步資料來源內容和更新索引的頻率。
-
選擇下一步。
-
在設定欄位映射頁面上,輸入下列資訊:
-
從要映射到索引的檔案Amazon Kendra產生的預設欄位中選取 。若要新增自訂資料來源欄位,請建立要映射的索引欄位名稱和欄位資料類型。
-
選擇下一步。
-
在檢閱和建立頁面上,檢查您輸入的資訊是否正確,然後選取新增資料來源。您也可以選擇從此頁面編輯您的資訊。成功新增資料來源後,您的資料來源將顯示在資料來源頁面上。
- API
-
Amazon Kendra連線至您的 Amazon FSx(Windows) 檔案系統
您必須使用 TemplateConfiguration API 指定資料來源結構描述的 JSON。您必須提供下列資訊:
-
資料來源 - 當您使用 TemplateConfiguration JSON 結構描述FSX時,指定資料來源類型。另請在呼叫 CreateDataSource API TEMPLATE時將資料來源指定為 。
-
檔案系統 ID - Amazon FSx(Windows) 檔案系統的識別符。您可以在 Amazon FSx(Windows) 主控台的檔案系統儀表板中找到您的檔案系統 ID。
-
檔案系統類型 - 將檔案系統的類型指定為 WINDOWS。
-
Virtual Private Cloud (VPC)—指定您呼叫 VpcConfiguration的時間CreateDataSource。如需詳細資訊,請參閱設定 Amazon Kendra以使用Amazon VPC。
您必須選取 Amazon FSx(Windows) 所在的 Amazon VPC。您可以包含 VPC 子網路和安全群組。
-
同步模式 - 指定 Amazon Kendra如何在資料來源內容變更時更新索引。當您第一次使用Amazon Kendra 同步資料來源時,預設會爬取所有內容並編製索引。如果初始同步失敗,即使您未選擇完全同步做為同步模式選項,仍必須執行資料的完整同步。您可以選擇:
-
身分爬蟲程式 - 指定是否開啟 Amazon Kendra的身分爬蟲程式。身分爬蟲程式會使用文件的存取控制清單 (ACL) 資訊,根據使用者或其群組對文件的存取來篩選搜尋結果。如果您有文件的 ACL 並選擇使用您的 ACL,您也可以選擇開啟Amazon Kendra身分爬蟲程式,以設定搜尋結果的使用者內容篩選。否則,如果關閉身分識別編目程式,則所有文件都可公開搜尋。如果您想要使用文件的存取控制,而身分識別編目程式為關閉狀態,您可以改用 PutPrincipalMapping API 來上傳使用者和群組存取資訊,以供使用者內容篩選使用。
-
機密 Amazon Resource Name (ARN) — 提供機密的 Amazon Resource Name (ARN)Secrets Manager,其中包含您 Amazon FSx(Windows) 帳戶的身分驗證憑證。秘密會以下列金鑰存放在 JSON 結構中:
{
"username": "user@corp.example.com",
"password": "password"
}
-
IAMrole—指定RoleArn您何時呼叫 CreateDataSource 以提供IAM角色存取Secrets Manager秘密的許可,以及呼叫 Amazon FSx(Windows) 連接器所需的公有 APIs 和 Amazon Kendra。如需詳細資訊,請參閱 IAMAmazon FSx(Windows) 資料來源的角色。
您也可以新增下列選用功能:
-
包含和排除篩選條件 - 指定是否包含或排除特定檔案。
大多數資料來源使用規則表達式模式,作為包含或排除的篩選規則,稱為篩選條件。若您設定包含篩選條件,則只有符合該條件的內容會被編列索引。任何不符合包含篩選條件的文件都不會編製索引。如果您指定包含和排除篩選條件,則符合排除篩選條件的文件不會編製索引,即使它們符合包含篩選條件。
-
存取控制清單 (ACL) — 如果您擁有 ACL 並想要將其用於存取控制,請指定是否要為文件編目 ACL 資訊。ACL 指定使用者可以和群組存取哪些文件。ACL 資訊用於根據使用者或其群組對文件的存取來篩選搜尋結果。如需詳細資訊,請參閱使用者內容篩選。
若要測試使用者的內容篩選,您必須在發出查詢時包含 DNS 網域名稱做為使用者名稱的一部分。您必須擁有 Active Directory 網域的管理許可。您也可以在群組名稱上測試使用者內容篩選。
-
欄位映射 - 選擇將 Amazon FSx(Windows) 資料來源欄位映射至您的Amazon Kendra索引欄位。如需詳細資訊,請參閱映射資料來源欄位。
需要文件內文欄位或文件內文對等項目, Amazon Kendra才能搜尋您的文件。您必須將資料來源中的文件內文欄位名稱映射至索引欄位名稱 _document_body。所有其他欄位是選用的。
如需要設定的其他重要 JSON 金鑰清單,請參閱 Amazon FSx(Windows) 範本結構描述。
進一步了解
若要進一步了解Amazon Kendra如何與您的 Amazon FSx(Windows) 資料來源整合,請參閱: