對資料來源進行故障診斷 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

對資料來源進行故障診斷

本節可協助您解決設定和使用 Amazon Kendra 資料來源連接器時的常見問題。

我的文件未被編索

當您將 Amazon Kendra 索引與資料來源同步時,可能會遇到防止文件編製索引的問題。編索程序包含兩個步驟。首先,系統會檢查資料來源中是否包含需要編索的新文件或更新文件,並找出需從索引中移除的文件。接著在文件層級,系統會存取並編製每個文件的索引。

在任一步驟中都可能發生錯誤。資料來源層級錯誤會回報於主控台中資料來源詳細資訊頁的同步執行歷史記錄區段。同步任務的狀態可能為成功不完整失敗。您也可以查看任務期間完成索引與刪除的文件數量。若狀態為失敗詳細資訊欄會顯示相關訊息。

文件層級錯誤會在 中回報 Amazon CloudWatch Logs。您可以使用 CloudWatch 主控台查看錯誤。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我的同步任務失敗

同步任務通常因索引或資料來源的組態設定錯誤而失敗。在主控台的資料來源詳細資訊頁面中,您可在同步執行歷史記錄區段的詳細資訊欄位中找到錯誤訊息。文件層級錯誤會於 Amazon CloudWatch Logs中回報。錯誤訊息會說明問題發生的原因。問題通常是索引或資料來源沒有適當的 IAM 許可。錯誤訊息會指出缺少哪些許可。以下是您可以接收的一些錯誤訊息:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

如果您的索引角色沒有使用 的許可 CloudWatch,資料來源將無法建立 CloudWatch 日誌。如果您收到此錯誤,則必須將 CloudWatch 許可新增至索引角色。

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

當您使用 Amazon S3 資料來源時, Amazon Kendra 必須具有存取包含文件之儲存貯體的許可。您需要新增 許可 Amazon Kendra ,才能將儲存貯體讀取至資料來源 IAM 角色。

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra 需要許可才能擔任索引和資料來源 IAM 角色。您需要將信任政策新增至具有 sts:AssumeRole動作許可的角色。

如需索引資料來源 Amazon Kendra 所需的 IAM 政策,請參閱 IAM 角色

若要產生文件同步狀態報告,請參閱我想要為我的文件產生同步狀態報告

我的同步任務不完整

任務若已完成資料來源層級程序,但在文件層級程序發生錯誤,即會被視為不完整。當任務不完整時,有些文件可能尚未成功編製索引。對於 Amazon S3 資料來源,不完整的任務通常是由以下原因造成:

  • 一或多個文件的中繼資料無效。

  • 提交文件以供編索時,有至少一份文件未成功提交。

  • 若提交文件準備自索引中刪除時,有至少一份文件未成功提交。

若要對未完成的同步任務進行故障診斷,請先查看您的 CloudWatch 日誌。

  1. 在詳細資訊欄中,選擇檢視詳細資訊 CloudWatch

  2. 檢視錯誤訊息,以確認文件失敗的原因。

若要產生文件同步狀態報告,請參閱我想要為我的文件產生同步狀態報告

我的同步任務顯示成功,但沒有任何文件被編索

索引同步任務執行偶爾會標示為成功,但預期不會有新的或更新的文件編製索引。可能的原因包括:

  • 檢查 CloudWatch DocumentsSubmittedForIndexingFailed指標,查看是否有任何文件無法同步。如需詳細資訊,請檢查您的 CloudWatch 日誌。

  • 對於 Amazon S3 資料來源,您可能給了 Amazon Kendra 錯誤的儲存貯體名稱或字首。請確定 Amazon Kendra 使用 的儲存貯體是包含要編製索引之文件的儲存貯體。

  • 若您要重新編索先前編索失敗的文件,除非文件本身或其相關的中繼資料檔案已有變更,否則 Amazon Kendra 不會重新編索。

若要產生文件同步狀態報告,請參閱我想要產生文件的同步狀態報告

我在同步資料來源時遇到檔案格式相關問題

如果您在將檔案新增至資料來源或同步資料來源時遇到檔案格式問題,請確定您的文件類型受到 Amazon Kendra 支援。如需 支援的文件類型清單, Amazon Kendra 請參閱文件類型或格式

如果您使用 BatchPutDocument API 搭配純文字檔案,請指定 PLAIN_TEXT做為內容類型。

我想要為我的文件產生同步歷史記錄報告

透過選取檢視報告,您可在 CloudWatch 中檢視資料來源同步任務的文件層級同步執行歷史記錄報告。同步執行歷史記錄報告將列出同步任務中各文件的進度與狀態詳細資訊。報告會顯示各文件在網路爬取、同步與編索階段的狀態,包括成功、失敗或遭略過。您也可以查看與失敗或略過文件相關的錯誤訊息。若報告未顯示正在執行的同步任務結果,則相關日誌可能尚未產生。同步程序中事件發生後資料會陸續寫入報告,請稍後再回來查看。

若要查看同步執行歷史記錄報告,請依下列步驟操作:

  1. 開啟位於 https://https://console.aws.amazon.com/kendra/ 的 Amazon Kendra 主控台。

  2. 在左側導覽選單的資料管理下,選擇資料來源,然後選擇您的資料來源。

  3. 在資料來源摘要頁面中向下捲動,並選取同步歷史記錄標籤。

  4. 同步執行歷史記錄中選取動作

  5. 動作中選取檢視報告。系統會將您重新導向至 CloudWatch 主控台,您可在該處查看相關報告。

注意

如果文件在擷取期間成功編製索引,包括連接 ACLs 和中繼資料,則同步執行歷史記錄會記錄所有 Amazon Kendra 支援的連接器。

如果您使用的是 Amazon S3 連接器:

除了在 CloudWatch 中擷取文件層級同步執行歷史記錄報告之外,您還可以為 Amazon S3 資料來源中的每個文件產生同步歷史記錄報告,並將其複製到 Amazon S3 儲存貯體。在此過程中,您的資料會使用 AWS KMS 金鑰加密,而且只能由您檢視。報告的文件狀態可以是下列其中一項:失敗已完成成功並發生錯誤。您必須先執行下列動作,才能產生 Amazon S3 的同步狀態報告:

  • 將下列 Amazon Kendra 服務主體新增至您的 Amazon S3 存取政策

  • 建立具有 存取許可的 儲存 Amazon S3 貯體 Amazon Kendra

如果您使用 主控台,若要產生 Amazon S3 的同步歷史記錄報告,請選擇從資料來源詳細資訊頁面上的同步歷史記錄報告 – 選用區段中啟用產生報告選項。然後,輸入儲存 Amazon S3 貯體位置,然後從可用的組態選項中進行選擇。啟用產生報告後,報告會從下一次同步產生。

如果您刪除儲存 Amazon S3 貯體,您會遺失日誌資料,而且必須設定新的儲存貯體來存放新的同步報告。

注意

同步歷史記錄報告僅提供有關 Amazon S3 連接器是否成功編目和擷取資料的資訊。

同步資料來源需要多少時間?

如果文件沒有更新, Amazon Kendra 索引的同步時間會與文件數量呈線性比例增加。例如,沒有任何更新的 1,000 份文件需要約五分鐘的時間同步,而沒有任何更新的 2,000 份文件則需要約 10 分鐘的時間。如果文件有任何更新,則同步時間會根據更新的文件數量而增加。

同步資料來源的費用是多少?

當您同步索引時,需要兩分鐘的時間來暖機並啟用 Amazon EC2 來建立必要的連線。在此過程中,您不需要付費。您的用量計只會在同步任務啟動後開始。如需 Amazon Kendra 定價的詳細資訊,請參閱 Amazon Kendra 定價

我收到 Amazon EC2 授權錯誤

如果在虛擬私有雲端 (VPC) 資料來源的同步期間發生 Amazon EC2 未經授權的操作錯誤,VPC IAM 角色可能會缺少必要的許可。請檢查您用於資料來源 IAM 的角色是否具有連接的許可。如需詳細資訊,請參閱虛擬私有雲端 IAM 角色

您的 Amazon Kendra 索引只能存取 Amazon S3 資料來源授予其存取許可的檔案。例如, Amazon Kendra 無法修改判斷物件是公有還是加密的 Amazon S3 許可。 Amazon Kendra 也沒有預設許可來建立或傳回 Amazon S3 物件的已簽署連結。如果您想要為 Amazon Kendra 索引中的 Amazon S3 物件啟用簽章連結,您有兩個選項:

  • 您可以在將結果傳回至搜尋頁面之前,將索引查詢結果與來源 uri 物件搭配使用簽署。如需此程序的step-by-step演練,請參閱使用預先簽章URLs 共用物件

  • 您可以覆寫 Amazon S3 物件中繼資料來源 uri,並透過連線至 Amazon S3 儲存貯體 CloudFront 的內容交付網路 (CDN) 提供您的服務。或者,您可以使用傳回預先簽章 URL 並重新導向至它的 API 閘道 代理端點。

我收到使用 SSL 憑證檔案時存取遭拒錯誤訊息

如果您在搭配資料來源使用 SSL 憑證時收到存取遭拒錯誤,請確定您的 IAM 角色具有在其指定位置存取 SSL 憑證檔案的許可。如果憑證使用 AWS KMS 金鑰加密,您的 IAM 角色也應該具有使用 AWS KMS 金鑰解密的許可。如需詳細資訊,請參閱 的身分驗證和存取控制 AWS KMS

我在使用 SharePoint 資料來源時收到授權錯誤

如果您在與 SharePoint 資料來源同步索引時收到授權錯誤,請確認您在 SharePoint 中已指派 Site Admin 角色給您。

我的索引不會從 Confluence 資料來源爬取文件

如果您的 Amazon Kendra 索引未在同步程序期間從 Confluence 資料來源爬取文件,請確認您是 Confluence 中管理員群組的一部分。