

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 知識庫
<a name="knowledge-base-integrations"></a>

知識庫是從資料來源中組織化、編製索引的文件或內容集合，針對生成式 AI 技術的擷取和問題回答進行最佳化。無論您的團隊在 Confluence 中存放文件、透過 SharePoint 協作，還是在雲端儲存中管理檔案，您都可以透過建立知識庫，將所有此資訊整合到一個統一的搜尋體驗中。

 只需按幾下滑鼠，即可設定內建整合，在 Quick 中同步您的資料，讓您輕鬆地利用組織在 Google Drive、OneDrive、Confluence、SharePoint、S3 和 Web Crawler 方面的知識。無論您的團隊在 Confluence 中存放文件、透過 SharePoint 協作，還是在雲端儲存中管理檔案，您都可以在知識庫的協助下，將所有資訊整合到統一的搜尋體驗中。

## 知識庫的運作方式
<a name="how-knowledge-bases-work"></a>

知識庫是 Google Drive 等資料來源的文件或內容的索引集合，針對生成式 AI 支援的擷取和問題回答進行最佳化。可以從相同的來源建立多個知識庫，所有知識庫都可以位於共用的快速索引中。例如，如果您從 Google Drive 同步兩個資料夾並建立兩個知識庫 - 一個用於「政策文件」以回答查詢，例如*「我們的退款政策是什麼」*，另一個用於「客戶意見回饋」以回答查詢，例如*「常見的客戶抱怨是什麼」* - 兩者都可以屬於相同的索引。使用知識庫 ID 快速區分它們，因此可以篩選查詢，以僅從所需的知識庫擷取相關文件。這可讓使用者組織、保護和擷取與不同網域或使用案例相關的資訊，即使基礎資料一起編製索引。

您的知識庫可以個別使用，或透過 Amazon Quick spaces 與團隊成員共用。我們的粗略存取控制可在知識庫層級實現安全性，確保使用者只會從他們獲授權存取的知識庫接收資訊。

### 建立程序
<a name="knowledge-base-creation-process"></a>

您可以在設定新的資料存取整合時建立知識庫，並使用現有的整合來建立其他知識庫：

1. **資料存取整合設定** - 連線至外部資料來源

1. **內容選擇** - 透過篩選條件和範圍設定選擇要包含的內容

1. **索引** - Amazon Quick 處理和索引選取的內容

1. **可用性** - 知識庫可用於空格和 AI 代理器

### 功能
<a name="knowledge-base-capabilities"></a>

每個知識庫都提供下列功能：
+ **內容索引** - 處理來自外部來源的文字、文件和結構化資料
+ **語意搜尋** - 啟用索引內容的 AI 支援搜尋
+ **自動同步** - 使用可設定的同步排程讓內容保持up-to-date 
+ **粗略存取控制** - 確保使用者只會從他們獲授權存取的知識庫中接收資訊。
+ **多空間使用** - 可用於多個空間和不同的 AI 代理器

## 一般工作流程
<a name="general-workflow"></a>

使用知識庫的一般工作流程遵循下列步驟：

1. **設定資料來源整合** - 使用適當的身分驗證連接到外部應用程式 （例如 SharePoint、Google Drive 或 Confluence)。如需詳細資訊，請參閱[整合特定的指南](integration-guides.md)。

1. **建立知識庫** - 您可以在設定新整合時建立知識庫。透過設定 來設定內容篩選條件，包括篩選條件、檔案類型限制和資料夾選擇，以專注於相關內容。

1. **設定同步排程** - 資料重新整理頻率預設為每日。您可以編輯同步頻率，以設定使用來源的新內容更新知識庫的頻率。

1. **監控和管理** - 檢閱同步狀態、管理存取許可。

## 常見的組態設定
<a name="common-configuration-settings"></a>

知識庫在不同資料來源整合之間共用常見的組態模式。了解這些設定可協助您最佳化內容索引，並有效地管理同步行為。

**注意**  
雖然這些組態選項可在大多數整合中使用，但特定設定和可用選項可能會因您選擇的資料來源整合而有所不同。

### 知識庫操作的服務主體
<a name="kb-service-principal"></a>

如果您使用客戶受管金鑰 (CMK) 做為預設 CMK 和 Q 資料金鑰 （請參閱[使用 AWS Key Management Service 客戶受管金鑰加密 Amazon Quick 資料](customer-managed-keys.md))，Amazon Quick 會在知識庫同步操作期間，使用 `qbusiness.amazonaws.com``quicksight.amazonaws.com`和服務主體存取您的 AWS KMS 金鑰。

**注意**  
確保管理 CMK 存取權的任何政策都允許 `qbusiness.amazonaws.com``quicksight.amazonaws.com`和服務主體。

### 檔案大小和內容限制
<a name="file-size-and-content-limits"></a>

設定檔案大小限制，以最佳化處理效能和管理儲存成本。特定限制會因內容類型而異，當您設定知識庫時，會顯示在主控台中。

**標準文字文件**  
適用於 PDFs、Word 檔案和文字檔案等文件。檔案大小限制為 500 MB。

**影片檔案**  
啟用影片處理時可用。支援的格式包括 `.mp4`、`.mov`、`.m4v`。檔案大小限制為 10 GB (10240 MB)。Quick Index 支援**每個 GB 儲存體最多 10 個影片檔案**。如果您的使用案例需要更高的視訊磁碟區，請開立 AWS 支援 的票證，以延長此限制。

**音訊檔案**  
啟用音訊處理時可用。支援的格式包括 `.mp3`` .wav`、`.flac`、 和 ` .m4a`` .ogg`。音訊檔案的限制為 2 GB (2048 MB)。  
無論原始檔案大小為何，擷取文字超過 30 MB 系統限制的檔案都不會編製索引。可從單一文件擷取的文字數量上限為 30 MB。

**映像**  
快速索引會套用下列影像限制：  
+ **每個文件限制**：每個文件 500 個映像
+ **每 GB 限制**：每 GB 索引儲存 10K 張影像
+ **每個索引限制**：每個索引 2M張影像
如果您的使用案例需要更高的映像磁碟區，請開立 AWS 支援 的票證來擴展這些限制。

### 同步排程和防護措施
<a name="sync-schedule-and-safeguards"></a>

設定知識庫更新和防止意外內容刪除的頻率：

#### 同步頻率
<a name="sync-frequency"></a>

資料重新整理頻率預設為每日。您可以編輯同步頻率，以設定知識庫應使用來源新內容更新的頻率

#### 文件刪除防護措施
<a name="document-deletion-safeguard"></a>

透過設定最大刪除百分比閾值，保護您的索引內容免於意外大量刪除。如果同步任務會刪除超過閾值允許的文件，則會略過刪除階段，保留現有的索引內容。

此保護可防止暫時性網路問題、許可變更或可能使內容暫時無法使用的來源系統問題。

#### 最長同步持續時間
<a name="maximum-sync-duration"></a>

每個同步執行的執行時間上限為 14 天。如果同步執行在 14 天後仍在進行中，Amazon Quick 會以 **FAILED** 狀態結束執行，並顯示下列錯誤訊息：

超過同步時間上限：請編輯同步組態，以減少要抓取和擷取的檔案數量。對於 Web 爬蟲程式資料來源，如果您想要與 wikipedia.org 等公有網站聊天，建議您使用 Web 搜尋功能。

如果您的同步執行達到此限制，請編輯知識庫以縮小同步範圍。例如，套用包含或排除篩選條件、限制要抓取的檔案類型或資料夾，或將內容分割到多個知識庫。對於 Web 爬蟲程式資料來源，當您的目標是與大型公有網站聊天時，請考慮改用 Web 搜尋功能。