Aurora(PostgreSQL)

注記

Aurora(PostgreSQL) コネクタは、2026 年 5 月 31 日まで既存のお客様を対象に引き続き完全にサポートされます。このコネクタは新規ユーザーには使用できなくなりますが、現在のユーザーは中断することなく引き続き使用できます。コネクタポートフォリオは、よりスケーラブルでカスタマイズ可能なソリューションを提供するために継続的に進化しています。今後の統合のために、柔軟性を高めながら、より広範なエンタープライズユースケースをサポートするように設計された、Amazon Kendra Custom Connector Framework[1] を検討いただくことをお勧めします。

Auroraは、クラウド用に構築されたリレーショナルデータベース管理システム (RDBMS) です。Auroraユーザーの場合は、 Amazon Kendraを使用してAurora(PostgreSQL)データソースのインデックスを作成できます。データソースコネクタはAmazon KendraAurora(PostgreSQL) Aurora PostgreSQL 1 をサポートしています。

Amazon Kendraコンソールと TemplateConfiguration API を使用してAurora(PostgreSQL)データソースAmazon Kendraに接続できます。

データソースコネクタのAmazon KendraAurora(PostgreSQL)トラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング。

サポートされている機能

フィールドマッピング
ユーザーコンテキストフィルタリング
包含/除外フィルター
完全および増分コンテンツ同期
Virtual Private Cloud (VPC)

前提条件

を使用してAurora(PostgreSQL)データソースAmazon Kendraのインデックスを作成する前に、 Aurora(PostgreSQL)および AWSアカウントでこれらの変更を行います。

Aurora(PostgreSQL) で以下を確認してください。

データベースユーザー名とパスワードを記録済み。

重要
ベストプラクティスとして、 Amazon Kendraに読み取り専用データベース認証情報を指定します。
コピーしたデータベースのホスト URL、ポート、インスタンス。
各ドキュメントが Aurora(PostgreSQL) および同じインデックスを使用予定の他のデータソース間で一意であることが確認されていること。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。

でAWS アカウント、以下があることを確認します。

Amazon Kendraインデックスを作成し、API を使用している場合はインデックス ID を記録しました。
データソースの IAMロールを作成し、 API を使用している場合はロールの ARN を記録しましたIAM。

注記
認証タイプと認証情報を変更する場合は、IAMロールを更新して正しいAWS Secrets Managerシークレット ID にアクセスする必要があります。
Aurora(PostgreSQL) の認証情報を AWS Secrets Manager シークレットに保存し、API を使用している場合は、シークレットの ARN を記録済み。

注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。

既存のIAMロールまたはシークレットがない場合は、コンソールを使用して、Aurora(PostgreSQL)データソースを接続するときに新しいIAMロールとSecrets Managerシークレットを作成できますAmazon Kendra。API を使用している場合は、既存のIAMロールとSecrets Managerシークレットの ARN とインデックス ID を指定する必要があります。

接続手順

Aurora(PostgreSQL) データソースAmazon Kendraに接続するには、がデータにアクセスできるようにAmazon Kendra、Aurora(PostgreSQL)認証情報の詳細を指定する必要があります。をまだ設定していない場合は、Aurora(PostgreSQL)Amazon Kendra「」を参照してください前提条件。

Console

Amazon Kendraに接続するには Aurora(PostgreSQL)

にサインインAWS マネジメントコンソールし、 Amazon Kendraコンソールを開きます。
左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。

注記
[インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。
[使用開始] ページで、[データソースを追加] を選択します。
[データソースを追加] ページで [Aurora(PostgreSQL) コネクタ] を選択し、[コネクタを追加] を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いた [Aurora(PostgreSQL) コネクタ] を選択します。
[データソースの詳細を指定] ページで、次の情報を入力します。
1. [名前と説明] の [データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。
2. (オプション) [説明] - オプションで、データソースの説明を入力します。
3. [デフォルト言語] - インデックス用にドキュメントをフィルターするための言語。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。
4. タグで、新しいタグを追加する - リソースを検索してフィルタリングしたり、AWSコストを追跡したりするためのオプションのタグを含めます。
5. [次へ] を選択します。
[アクセスとセキュリティの定義] ページで、次の情報を入力します。
1. [ソース] には、次の情報を入力します。
2. ホスト – データベースのホスト URL を入力します (例: http://instance URL.region.rds.amazonaws.com)。
3. ポート – データベースポートを入力します (例: 5432)。
4. インスタンス – データベースインスタンスを入力します (例: postgres)。
5. SSL 証明書の場所を有効にする - SSL 証明書ファイルへのAmazon S3パスを入力する場合に選択します。
6. [認証] には、次の情報を入力します。
  1. AWS Secrets Managersecret — 既存のシークレットを選択するか、Aurora(PostgreSQL)新しいSecrets Managerシークレットを作成して認証情報を保存します。新しいシークレットの作成を選択すると、[AWS Secrets Manager シークレット] ウィンドウが開きます。
    1. [AWS Secrets Manager シークレットウィンドウを作成] に次の情報を入力します。
      1. [シークレット名] - シークレットの名前。シークレット名に、プレフィックス「AmazonKendra-Aurora(PostgreSQL)-」が自動的に追加されます。
      2. [データベースユーザー名] と [パスワード] - データベースからコピーした認証情報の値を入力します。
    2. [保存] を選択します。
7. [仮想プライベートクラウド (VPC)] - VPC の使用を選択できます。選択する場合は、[サブネット] と [VPC セキュリティグループ] を追加する必要があります。
8. IAMrole — 既存のIAMロールを選択するか、リポジトリの認証情報とインデックスコンテンツにアクセスするための新しいIAMロールを作成します。
  
  注記
  IAMインデックスに使用されるロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。
9. [次へ] を選択します。
[同期設定の構成] ページで、次の情報を入力します。
1. [同期の範囲] で、次のオプションから選択します。
  - [SQL クエリ] - SELECT や JOIN オペレーションなどの SQL クエリステートメントを入力します。SQL クエリは 32KB 未満である必要があります。SQL クエリは 32KB 未満で、セミコロン (;) を含まない必要があります。 Amazon Kendraは、クエリに一致するすべてのデータベースコンテンツをクロールします。
  - [プライマリキー列] - データベーステーブルのプライマリキーを指定します。これにより、データベース内のテーブルが識別されます。
  - [タイトル列] - データベーステーブル内のドキュメントタイトル列の名前を指定します。
  - [本文列] - データベーステーブル内のドキュメント本文列の名前を指定します。
2. [その他の設定 - オプション] で、すべてのファイルを同期する代わりに特定のコンテンツを同期するには、次のオプションから選択します。
  - 列の変更検出 — コンテンツの変更を検出Amazon Kendraするために使用する列の名前を入力します。これらの列のいずれかに変更があると、はコンテンツのインデックスを再Amazon Kendra作成します。
  - [ユーザー ID 列] - コンテンツへのアクセスを許可するユーザー ID を含む列の名前を入力します。
  - [グループ列] - コンテンツへのアクセスを許可するグループを含む列の名前を入力します。
  - [ソース URL 列] - インデックスを作成するソース URL を含む列の名前を入力します。
  - タイムスタンプ列 - タイムスタンプを含む列の名前を入力します。は、タイムスタンプ情報Amazon Kendraを使用してコンテンツの変更を検出し、変更されたコンテンツのみを同期します。
  - [タイムゾーン列] - クロールするコンテンツのタイムゾーンを含む列の名前を入力します。
  - [タイムスタンプの形式] - コンテンツの変更を検出してコンテンツを再同期するために使用するタイムスタンプの形式を含む列の名前を入力します。
3. [同期モード] - データソースのコンテンツが変更されたときのインデックスの更新方法を選択します。データソースを Amazon Kendraと初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択していない場合でも、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。
  - 完全同期: データソースがインデックスと同期されるたびに、既存のコンテンツを置き換えて、すべてのコンテンツのインデックスを新たに作成します。
  - 新規作成、変更の同期: データソースがインデックスと同期するたびに、新規作成および変更されたコンテンツのみのインデックスを作成します。Amazon Kendra は、データソースのメカニズムを利用してコンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成することができます。
  - 新規、変更、削除された同期: データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのインデックスのみを作成します。 Amazon Kendraは、データソースのメカニズムを使用して、前回の同期以降に変更されたコンテンツの変更とインデックスコンテンツを追跡できます。
4. [同期実行スケジュール] の [頻度] - Amazon Kendra がデータソースと同期する頻度。
5. [次へ] を選択します。
[フィールドマッピングを設定] ページで、次の情報を入力します。
1. Amazon Kendraインデックスにマッピングするドキュメント IDs、ドキュメントタイトル、ソース URLsなど、生成されたデフォルトのデータソースフィールドから選択します。
2. [フィールドを追加] - カスタムデータソースフィールドを追加して、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。
3. [次へ] を選択します。
[確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。

API

Amazon Kendraに接続するには Aurora(PostgreSQL)

TemplateConfiguration API を使用して、以下を指定する必要があります。

[データソース] — TemplateConfiguration JSON スキーマを使用する場合は、データソースタイプを JDBC と指定します。また、CreateDataSource API を呼び出す場合は、データソースを TEMPLATE と指定します。
データベースタイプ - データベースタイプを postgresql として指定する必要があります。
[SQL クエリ] - SELECT や JOIN オペレーションなどの SQL クエリステートメントを入力します。SQL クエリは 32 KB 未満にする必要があります。Amazon Kendra はクエリに一致するすべてのデータベースコンテンツをクロールします。
同期モード — データソースコンテンツが変更されたときに Amazon Kendraがインデックスを更新する方法を指定します。Amazon Kendra でデータソースを初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択していない場合でも、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。以下のいずれかから選択できます。
- FORCED_FULL_CRAWL は、データソースがインデックスと同期されるたびに、既存のコンテンツを置き換えて、すべてのコンテンツのインデックスを新たに作成します。
- FULL_CRAWL は、データソースがインデックスと同期するたびに、新規作成、変更、削除されたコンテンツのみのインデックスを作成します。Amazon Kendra は、データソースのメカニズムを利用してコンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成することができます。
- CHANGE_LOG は、データソースがインデックスと同期するたびに、新規作成および変更されたコンテンツのインデックスのみを作成します。Amazon Kendra は、データソースのメカニズムを利用してコンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成できます。
シークレット Amazon リソースネーム (ARN) — Aurora(PostgreSQL)アカウントで作成した認証情報を含む Secrets Managerシークレットの Amazon リソースネーム (ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。
```
{
    "user name": "database user name",
    "password": "password"
}
```
注記
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません。
IAMrole - を呼び出しCreateDataSourceて、シーSecrets Managerクレットにアクセスするためのアクセス許可を IAMロールに提供し、Aurora(PostgreSQL)コネクタとに必要なパブリック APIsを呼び出すRoleArnタイミングを指定しますAmazon Kendra。詳細については、「IAM roles for Aurora(PostgreSQL) data sources」を参照してください。

オプションで、次の機能を追加することもできます。

[仮想プライベートクラウド (VPC)] - VpcConfiguration で CreateDataSource を呼び出すタイミングを指定します。詳細については、「を使用する Amazon Kendra ようにを設定する Amazon VPC」を参照してください。
包含フィルターと除外フィルター - ユーザー ID、グループ、ソース URL、タイムスタンプ、タイムゾーンを使用して、特定のコンテンツを含めるかどうかを指定できます。
[ユーザーコンテキストのフィルタリングとアクセスコントロール] — ドキュメントの ACL がある場合は、Amazon Kendra がドキュメントのアクセスコントロールリスト (ACL) をクロールします。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。
フィールドマッピング - 選択すると、Aurora(PostgreSQL) データソースフィールドを Amazon Kendra インデックスフィールドにマッピングします。詳細については、「データソースフィールドのマッピング」を参照してください。

注記
がドキュメントAmazon Kendraを検索するには、ドキュメント本文フィールドまたはドキュメントと同等のドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名 _document_body にマッピングする必要があります。その他のすべてのフィールドはオプションです。

設定が必要なその他の重要な JSON キーのリストについての詳細は、「Aurora (PostgreSQL) テンプレートスキーマ」を参照してください。

注意事項

削除されたデータベース行は、が更新されたコンテンツAmazon Kendraをチェックするときにで追跡されません。
データベースの 1 行のフィールド名と値のサイズは 400 KB を超えることはできません。
データベースデータソースに大量のデータがあり、最初の同期後にすべてのデータベースコンテンツのAmazon Kendraインデックスを作成しない場合は、新規、変更、または削除されたドキュメントのみを同期できます。
ベストプラクティスとして、 Amazon Kendraに読み取り専用データベース認証情報を指定します。
ベストプラクティスとして、機密データや個人を特定できる情報 (PII) を含むテーブルを追加することは避けてください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

Aurora(MySQL)

Amazon FSx(Windows)