翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ナレッジベース
<a name="knowledge-base-integrations"></a>

ナレッジベースは、生成 AI を活用した検索と質問への回答に最適化された、データソースからのドキュメントやコンテンツの、インデックス化された整理されたコレクションです。チームがドキュメントを Confluence に保存する場合でも、SharePoint を通じてコラボレーションする場合でも、クラウドストレージ内のファイルを管理する場合でも、ナレッジベースを作成することで、この情報をすべて 1 つの統合検索エクスペリエンスに取り込むことができます。

 組み込みの統合は、Quick でデータを同期するために数回クリックするだけでセットアップでき、Google Drive、OneDrive、Confluence、SharePoint、S3、Web Crawler 全体で組織の知識を簡単に活用できます。チームがドキュメントを Confluence に保存する場合でも、SharePoint を通じてコラボレーションする場合でも、クラウドストレージ内のファイルを管理する場合でも、ナレッジベースを利用して、この情報をすべて 1 つの統合検索エクスペリエンスに取り込むことができます。

## ナレッジベースの仕組み
<a name="how-knowledge-bases-work"></a>

ナレッジベースは、Google Drive などのデータソースからのドキュメントやコンテンツのインデックス付きコレクションであり、生成 AI を活用した検索と質問への回答に最適化されています。複数のナレッジベースを同じソースから作成でき、すべて共有クイックインデックス内に配置できます。例えば、Google Drive から 2 つのフォルダを同期して 2 つのナレッジベースを作成する場合、1 つは*「返金ポリシーとは*」などのクエリに回答するためのポリシードキュメント用、もう 1 つは「顧客のフィードバック」で*「顧客の一般的な苦情とは*」などのクエリに回答するためのナレッジベース用です。どちらも同じインデックスに含めることができます。クイックはナレッジベース ID を使用してそれらを区別するため、クエリをフィルタリングして、目的のナレッジベースから関連ドキュメントのみを取得できます。これにより、基になるデータが一緒にインデックス化されていても、ユーザーはさまざまなドメインやユースケースに関連する情報を整理、保護、取得できます。

ナレッジベースは、個別に使用することも、Amazon Quick スペースを通じてチームメンバーと共有することもできます。粗粒度のアクセスコントロールにより、ナレッジベースレベルでのセキュリティが可能になり、ユーザーはアクセスが許可されているナレッジベースからのみ情報を受信できます。

### 作成プロセス
<a name="knowledge-base-creation-process"></a>

新しいデータアクセス統合をセットアップしながらナレッジベースを作成し、既存の統合を使用して追加のナレッジベースを作成できます。

1. **データアクセス統合設定** - 外部データソースに接続する

1. **コンテンツの選択** - フィルターとスコープ設定を使用して含めるコンテンツを選択します

1. **インデックス作成** - Amazon Quick は、選択したコンテンツを処理およびインデックス作成します。

1. **可用性** - ナレッジベースがスペースや AI エージェントで使用できるようになります。

### 機能
<a name="knowledge-base-capabilities"></a>

各ナレッジベースには以下の機能があります。
+ **コンテンツのインデックス作成** - 外部ソースからのテキスト、ドキュメント、構造化データを処理します
+ **セマンティック検索** - インデックス付きコンテンツ全体で AI を活用した検索を有効にします
+ **自動同期** - 設定可能な同期スケジュールでコンテンツをup-to-dateに保つ
+ **粗粒度のアクセスコントロール** - ユーザーは、アクセスが許可されているナレッジベースからのみ情報を受信できます。
+ **複数スペースの使用** - 複数のスペースおよび異なる AI エージェントで使用できます

## 一般的なワークフロー
<a name="general-workflow"></a>

ナレッジベースを使用するための一般的なワークフローは、次のステップに従います。

1. **データソース統合の設定** - 適切な認証を使用して外部アプリケーション (SharePoint、Google Drive、Confluence など) に接続します。詳細については、「[統合固有のガイド](integration-guides.md)」を参照してください。

1. **ナレッジベースの作成** - 新しい統合の設定中にナレッジベースを作成できます。関連するコンテンツに焦点を当てるように、インクルードフィルター、ファイルタイプの制限、フォルダの選択を設定して、コンテンツフィルターを設定します。

1. **同期スケジュールの設定** - データの更新頻度は、デフォルトで毎日に設定されます。同期頻度を編集して、ナレッジベースをソースの新しいコンテンツで更新する頻度を設定できます。

1. **モニタリングと管理** - 同期ステータスを確認し、アクセス許可を管理します。

## 一般的な設定
<a name="common-configuration-settings"></a>

ナレッジベースは、さまざまなデータソース統合で共通の設定パターンを共有します。これらの設定を理解することで、コンテンツのインデックス作成を最適化し、同期動作を効果的に管理できます。

**注記**  
これらの設定オプションはほとんどの統合で使用できますが、特定の設定と使用可能なオプションは、選択したデータソース統合によって異なる場合があります。

### ナレッジベースオペレーションのサービスプリンシパル
<a name="kb-service-principal"></a>

デフォルトの CMK および Q データキーとしてカスタマーマネージドキー (CMK) を使用する場合 (「」を参照[AWS Key Management Service カスタマーマネージドキーを使用した Amazon Quick データの暗号化](customer-managed-keys.md))、Amazon Quick はナレッジベースの同期オペレーション中に `qbusiness.amazonaws.com`および `quicksight.amazonaws.com`サービスプリンシパルを使用して AWS KMS キーにアクセスします。

**注記**  
CMK へのアクセスを管理するポリシーで、 `qbusiness.amazonaws.com`と `quicksight.amazonaws.com`サービスプリンシパルの両方が許可されていることを確認します。

### ファイルサイズとコンテンツの制限
<a name="file-size-and-content-limits"></a>

ファイルサイズ制限を設定して、処理パフォーマンスを最適化し、ストレージコストを管理します。特定の制限はコンテンツタイプによって異なり、ナレッジベースを設定するとコンソールに表示されます。

**標準テキストドキュメント**  
PDFs、Word ファイル、テキストファイルなどのドキュメントに適用されます。ファイルサイズ制限は 500 MB です。

**動画ファイル**  
ビデオ処理が有効になっている場合に使用できます。サポートされている形式は、`.mp4`、`.mov`、 です`.m4v`。ファイルサイズ制限は 10 GB (10240 MB) です。クイックインデックスは、ストレージの **GB あたり最大 10 個のビデオファイル**をサポートします。ユースケースでビデオボリュームを増やす必要がある場合は、この制限を延長する AWS サポート付きのチケットを開いてください。

**オーディオファイル**  
オーディオ処理が有効になっている場合に使用できます。サポートされている形式には`.mp3`、、` .wav`` .m4a`、`.flac`、、 などがあります` .ogg`。オーディオファイルの制限は 2 GB (2048 MB) です。  
抽出されたテキストが 30 MB のシステム制限を超えるファイルは、元のファイルサイズに関係なくインデックス化されません。1 つのドキュメントから抽出できるテキストの最大量は 30 MB です。

**イメージ**  
クイックインデックスでは、イメージに次の制限が適用されます。  
+ **ドキュメントあたりの制限**: ドキュメントあたり 500 イメージ
+ **GB あたりの制限**: インデックスストレージの GB あたり 10K イメージ
+ **インデックスあたりの制限**: インデックスあたり 2Mイメージ
ユースケースでイメージボリュームを増やす必要がある場合は、サポート付きのチケットを開いて AWS 、これらの制限を拡張してください。

### スケジュールと保護を同期する
<a name="sync-schedule-and-safeguards"></a>

ナレッジベースが更新する頻度を設定し、意図しないコンテンツの削除から保護します。

#### 同期頻度
<a name="sync-frequency"></a>

デフォルトでは、データの更新頻度は毎日に設定されています。同期頻度を編集して、ナレッジベースがソースの新しいコンテンツで更新する頻度を設定できます。

#### ドキュメント削除の保護
<a name="document-deletion-safeguard"></a>

最大削除率しきい値を設定して、インデックス化されたコンテンツを偶発的な一括削除から保護します。同期ジョブがしきい値で許可されているよりも多くのドキュメントを削除する場合、削除フェーズはスキップされ、既存のインデックス付きコンテンツが保持されます。

この保護は、一時的なネットワークの問題、アクセス許可の変更、またはコンテンツを一時的に使用できなくなる可能性のあるソースシステムの問題から保護します。

#### 最大同期期間
<a name="maximum-sync-duration"></a>

各同期実行の最大ランタイムは 14 日です。同期実行が 14 日後にまだ進行中の場合、Amazon Quick はステータスが **FAILED** で実行を終了し、次のエラーメッセージが表示されます。

最大同期時間を超えました: 同期設定を編集して、クロールして取り込むファイルの数を減らしてください。ウェブクローラーデータソースでは、wikipedia.org などのパブリックウェブサイトとチャットする場合は、ウェブ検索機能を使用することをお勧めします。

同期実行がこの制限に達した場合は、ナレッジベースを編集して同期範囲を絞り込みます。たとえば、インクルードフィルターまたは除外フィルターを適用したり、クロールするファイルタイプやフォルダを制限したり、コンテンツを複数のナレッジベースに分割したりできます。ウェブクローラーデータソースの場合、大規模なパブリックウェブサイトとチャットすることを目標とする場合は、代わりにウェブ検索機能を使用することを検討してください。