Amazon FSx(NetApp ONTAP) - Amazon Kendra

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon FSx(NetApp ONTAP)

Amazon FSx(NetApp ONTAP) は、共有ストレージ機能を提供するフルマネージド型のクラウドベースのファイルサーバーシステムです。Amazon FSx(NetApp ONTAP) ユーザーの場合は、 を使用してAmazon Kendra Amazon FSx(NetApp ONTAP) データソースのインデックスを作成できます。

(Amazon FSxNetApp ONTAP) データソースAmazon Kendraに接続するには、 Amazon Kendraコンソールまたは TemplateConfiguration API を使用します。

Amazon KendraAmazon FSx(NetApp ONTAP) データソースコネクタのトラブルシューティングについては、「」を参照してくださいデータソースのトラブルシューティング

サポートされている機能

Amazon KendraAmazon FSx(NetApp ONTAP) データソースコネクタは、次の機能をサポートしています。

  • フィールドマッピング

  • ユーザーアクセスコントロール

  • 包含フィルターと除外フィルター

  • 完全および増分コンテンツ同期

  • Virtual Private Cloud (VPC)

前提条件

Amazon Kendraを使用して Amazon FSx(NetApp ONTAP) データソースのインデックスを作成する前に、Amazon FSx(NetApp ONTAP) と の詳細を確認してくださいAWS アカウント。

Amazon FSx(NetApp ONTAP) の場合は、以下があることを確認してください

  • 読み取りおよびマウントのアクセス許可を持つ Amazon FSx(NetApp ONTAP) を設定します。

  • ファイルシステム ID を書き留めてある。ファイルシステム ID は、Amazon FSx(NetApp ONTAP) コンソールのファイルシステムダッシュボードにあります。

  • ファイルシステムで使用されるストレージ仮想マシン (SVM) ID を書き留めてある。SVM ID を確認するには、Amazon FSx (NetApp ONTAP) コンソールのファイルシステムダッシュボードに移動し、ファイルシステム ID を選択してから、[ストレージ仮想マシン] を選択します。

  • Amazon FSx(NetApp ONTAP) ファイルシステムが存在する Amazon VPCを使用して仮想プライベートクラウドを設定しました。

  • Active Directory ユーザーアカウントの Amazon FSx(NetApp ONTAP) 認証情報を記録しました。これには、DNS ドメイン名を使用した Active Directory ユーザー名 (user@corp.example.com など) とパスワードが含まれます。Amazon FSx(NetApp ONTAP) ファイルシステムにネットワークファイルシステム (NFS) プロトコルを使用する場合、認証情報には左 ID、右 ID、および事前共有キーが含まれます。

    注記

    コネクタが機能するために必要な認証情報のみを使用してください。ドメイン管理者などの特権認証情報は使用しないでください。

    注記

    認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません

  • 各ドキュメントが Amazon FSx(NetApp ONTAP) および同じインデックスに使用する予定の他のデータソース間で一意であることを確認します。インデックスに使用する各データソースには、データソース全体に同じドキュメントが含まれていてはなりません。ドキュメント ID はインデックス全体に適用され、インデックスごとに一意である必要があります。

でAWS アカウント、以下があることを確認します。

  • Amazon Kendraインデックスを作成し、 API を使用している場合はインデックス ID を記録しました。

  • データソースの IAMロールを作成し、 API を使用している場合はロールの ARN を記録しましたIAM。

    注記

    認証タイプと認証情報を変更する場合は、IAMロールを更新して正しいAWS Secrets Managerシークレット ID にアクセスする必要があります。

  • Amazon FSx(NetApp ONTAP) 認証情報を AWS Secrets Managerシークレットに保存し、 API を使用している場合はシークレットの ARN を記録しました。

    注記

    認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。認証情報とシークレットを、データソース、コネクタバージョン 1.0 と 2.0 (該当する場合) で再利用することは推奨しません

既存のIAMロールまたはシークレットがない場合は、 Amazon FSx(NetApp ONTAP) データソースを接続するときに、コンソールを使用して新しいIAMロールとSecrets Managerシークレットを作成できますAmazon Kendra。API を使用している場合は、既存のIAMロールとSecrets Managerシークレットの ARN とインデックス ID を指定する必要があります。

接続手順

Amazon FSx(NetApp ONTAP) データソースAmazon Kendraに接続するには、 がデータAmazon Kendraにアクセスできるように、Amazon FSx(NetApp ONTAP) データソースの必要な詳細を指定する必要があります。(Amazon FSxNetApp ONTAP) をまだ設定していない場合はAmazon Kendra、「」を参照してください前提条件

Console

Amazon FSx(NetApp ONTAP) ファイルシステムAmazon Kendraに接続するには

  1. にサインインAWS マネジメントコンソールし、 Amazon Kendraコンソールを開きます。

  2. 左側のナビゲーションペインで、[インデックス] を選択し、インデックスのリストから使用するインデックスを選択します。

    注記

    [インデックスの設定] で、[ユーザーアクセスコントロール] 設定を設定または編集できます。

  3. [使用開始] ページで、[データソースを追加] を選択します。

  4. [データソースを追加する] ページで [Amazon FSx (NetApp ONTAP) コネクタ] を選択し、[コネクタを追加] を選択します。バージョン 2 (該当する場合) を使用している場合は、「V2.0」タグが付いた [Amazon FSx (NetApp ONTAP) コネクタ] を選択します。

  5. [データソースの詳細を指定] ページで、次の情報を入力します。

    1. [名前と説明][データソース名] に、データソースの名前を入力します。ハイフン (-) は使用できますが、スペースは使用できません。

    2. (オプション) [説明] - オプションで、データソースの説明を入力します。

    3. [デフォルト言語] - インデックス用にドキュメントをフィルターするための言語。特に指定しない限り、言語はデフォルトで英語に設定されます。ドキュメントのメタデータで指定された言語は、選択した言語よりも優先されます。

    4. タグで新しいタグを追加する - リソースを検索してフィルタリングしたり、AWSコストを追跡したりするためのオプションのタグを含めます。

    5. [次へ] を選択します。

  6. [アクセスとセキュリティの定義] ページで、次の情報を入力します。

    1. [ソース] — ファイルシステム情報を入力します。

      • ファイルシステムプロトコル — Amazon FSx(NetApp ONTAP) ファイルシステムのプロトコルを選択します。共通インターネットファイルシステム (CIFS) プロトコル、または、Linux の場合はネットワークファイルシステム (NFS) プロトコルを選択します。

      • Amazon FSx(NetApp ONTAP) ファイルシステム ID — Amazon FSx(NetApp ONTAP) から取得した既存のファイルシステム ID をドロップダウンから選択します。または、Amazon FSx (NetApp ONTAP) ファイルシステムを作成します。ファイルシステム ID は、Amazon FSx (NetApp ONTAP) コンソールのファイルシステムダッシュボードで確認できます。

      • SVM ID (Amazon FSx(NetApp ONTAP) for NetApp ONTAPのみ) — (NetApp ONTAP) のストレージ仮想マシン Amazon FSx(SVM) ID を指定しますNetApp ONTAP。SVM ID を見つけるには、Amazon FSx(NetApp ONTAP) コンソールのファイルシステムダッシュボードに移動し、ファイルシステム ID を選択し、Storage 仮想マシンを選択します。

    2. [承認] - アクセスコントロールリスト (ACL) があり、それをアクセスコントロールに使用する場合に、ドキュメントの ACL 情報を有効にするか無効にするかを選択します。ACL では、ユーザーとグループがアクセスできるドキュメントを指定します。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。

    3. 認証 — 既存のAWS Secrets Managerシークレットを選択するか、新しいシークレットを作成してファイルシステムの認証情報を保存します。新しいシークレットを作成すると、AWS Secrets Manager シークレットウィンドウが開きます。

      ユーザー名とパスワードの認証情報を保存するシークレットを指定します。ユーザー名には DNS ドメイン名が含まれている必要があります。例えば、user@corp.example.com と入力します。

      Amazon FSx (NetApp ONTAP) ファイルシステムに NFS プロトコルを使用する場合は、左 ID、右 ID、および事前共有キーの認証情報を保存するシークレットを指定します。

      シークレットを保存して追加します。

    4. Virtual Private Cloud (VPC) — Amazon VPCAmazon FSx(NetApp ONTAP) が存在する を選択する必要があります。VPC サブネットとセキュリティグループを指定します。「 の設定Amazon VPC」を参照してください。

    5. IAMrole — 既存のIAMロールを選択するか、新しいIAMロールを作成してリポジトリの認証情報とインデックスコンテンツにアクセスします。

      注記

      IAMインデックスに使用される ロールは、データソースには使用できません。インデックスやよくある質問に既存のロールが使用されているかどうかが不明な場合は、エラーを避けるため、[新しいロールを作成] を選択してください。

    6. [次へ] を選択します。

  7. [同期設定の構成] ページで、次の情報を入力します。

    1. [同期スコープ]、[正規表現パターン] - 特定のファイルを含めるまたは除外するための、正規表現パターンを追加します。

    2. [同期モード] - データソースのコンテンツが変更されたときのインデックスの更新方法を選択します。データソースを Amazon Kendraと初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択していない場合でも、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。

      • 完全同期: データソースがインデックスと同期されるたびに、既存のコンテンツを置き換えて、すべてのコンテンツのインデックスを新たに作成します。

      • 新規、変更、削除された同期: データソースがインデックスと同期するたびに、新規、変更、削除されたコンテンツのインデックスのみを作成します。 Amazon Kendraは、データソースのメカニズムを使用して、前回の同期以降に変更されたコンテンツの変更とインデックスコンテンツを追跡できます。

    3. [同期実行スケジュール][頻度] では、データソースのコンテンツを同期してインデックスを更新する頻度を選択します。

    4. [次へ] を選択します。

  8. [フィールドマッピングを設定] ページで、次の情報を入力します。

    1. インデックスにマッピングするファイルのAmazon Kendra生成されたデフォルトフィールドから選択します。カスタムデータソースフィールドを追加するには、マッピング先のインデックスフィールド名とフィールドデータタイプを作成します。

    2. [次へ] を選択します。

  9. [確認と作成] ページで、入力した情報が正しいことを確認し、[データソースを追加] を選択します。このページで情報の編集を選択することもできます。データソースが正常に追加されると、データソースが [データソース] ページに表示されます。

API

Amazon FSx(NetApp ONTAP) ファイルシステムAmazon Kendraに接続するには

TemplateConfiguration API を使用してデータソーススキーマの JSON を指定する必要があります。これには、以下の情報を入力する必要があります。

  • [データソース]TemplateConfiguration JSON スキーマを使用する場合は、データソースタイプを FSXONTAP と指定します。また、CreateDataSource API を呼び出す場合は、データソースを TEMPLATE と指定します。

  • ファイルシステム ID — Amazon FSx(NetApp ONTAP) ファイルシステムの識別子。ファイルシステム ID は、Amazon FSx (NetApp ONTAP) コンソールのファイルシステムダッシュボードで確認できます。

  • [SVM ID] — ファイルシステムで使用されるストレージ仮想マシン (SVM) ID。SVM ID を確認するには、Amazon FSx (NetApp ONTAP) コンソールのファイルシステムダッシュボードに移動し、ファイルシステム ID を選択してから、[ストレージ仮想マシン] を選択します。

  • [プロトコルタイプ] — 共通インターネットファイルシステム (CIFS) プロトコル、または Linux 用のネットワークファイルシステム (NFS) プロトコルのどちらを使用するかを指定します。

  • [ファイルシステムタイプ] - ファイルシステムのタイプを FSXONTAP と指定します。

  • [仮想プライベートクラウド (VPC)] - VpcConfigurationCreateDataSource を呼び出すタイミングを指定します。詳細については、「を使用するAmazon Kendraように を設定するAmazon VPC」を参照してください。

    注記

    Amazon FSx(NetApp ONTAP) が存在する を選択する必要がありますAmazon VPC。VPC サブネットとセキュリティグループを指定します。

  • シークレット Amazon リソースネーム (ARN) — (NetApp ONTAP) アカウントの認証情報を含む Secrets Managerシークレットの Amazon リソースネーム Amazon FSx(ARN) を指定します。シークレットは、次のキーを含む JSON 構造に保存されます。

    { "username": "user@corp.example.com", "password": "password" }

    Amazon FSx(NetApp ONTAP) ファイルシステムに NFS プロトコルを使用する場合、シークレットは次のキーを持つ JSON 構造に保存されます。

    { "leftId": "left ID", "rightId": "right ID", "preSharedKey": "pre-shared key" }
  • IAMrole — を呼び出しCreateDataSourceて、 IAMロールにSecrets Managerシークレットへのアクセス許可を付与し、 Amazon FSx(NetApp ONTAP) コネクタと に必要なパブリック APIs を呼び出すRoleArnタイミングを指定しますAmazon Kendra。詳細については、IAMAmazon FSx「(NetApp ONTAP) データソースのロール」を参照してください。

オプションで、次の機能を追加することもできます。

  • 同期モード — データソースコンテンツが変更されたときに Amazon Kendraがインデックスを更新する方法を指定します。Amazon Kendra でデータソースを初めて同期すると、デフォルトですべてのコンテンツがクロールされ、インデックスが作成されます。同期モードオプションとして完全同期を選択していない場合でも、最初の同期が失敗した場合は、データの完全同期を実行する必要があります。以下のいずれかから選択できます。

    • FORCED_FULL_CRAWL は、データソースがインデックスと同期されるたびに、既存のコンテンツを置き換えて、すべてのコンテンツのインデックスを新たに作成します。

    • FULL_CRAWL は、データソースがインデックスと同期するたびに、新規作成、変更、削除されたコンテンツのみのインデックスを作成します。Amazon Kendra は、データソースのメカニズムを利用してコンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツのインデックスを作成することができます。

  • 包含フィルターと除外フィルター - 特定のファイルを含めるか除外するかを指定します。

    注記

    ほとんどのデータソースは、フィルターと呼ばれる包含または除外パターンである正規表現パターンを使用しています。包含フィルターを指定すると、包含フィルターに一致するコンテンツのみのインデックスが作成されます。包含フィルターに一致しないドキュメントのインデックスは作成されません。包含フィルターと除外フィルターを指定した場合、除外フィルターに一致するドキュメントは、包含フィルターと一致してもインデックスは作成されません。

  • [アクセスコントロールリスト (ACL)] - ACL があり、それをアクセスコントロールに使用したい場合に、ドキュメントの ACL 情報をクロールするかどうかを指定します。ACL では、ユーザーとグループがアクセスできるドキュメントを指定します。ACL 情報は、ユーザーまたはそのグループのドキュメントへのアクセスに基づいて、検索結果をフィルタリングするために使用されます。詳細については、「User context filtering」を参照してください。

    注記

    ユーザーに対してユーザーコンテキストフィルタリングをテストするには、クエリを発行するときにユーザー名の一部として DNS ドメイン名を含める必要があります。Active Directory ドメインの管理用のアクセス許可が必要です。グループ名でユーザーコンテキストフィルタリングをテストすることもできます。

  • フィールドマッピング — 選択すると、Amazon FSx(NetApp ONTAP) データソースフィールドをAmazon Kendraインデックスフィールドにマッピングします。詳細については、「データソースフィールドのマッピング」を参照してください。

    注記

    がドキュメントAmazon Kendraを検索するには、ドキュメント本文フィールドまたはドキュメントと同等のドキュメント本文が必要です。データソースのドキュメント本文フィールド名をインデックスフィールド名 _document_body にマッピングする必要があります。その他のすべてのフィールドはオプションです。

設定が必要なその他の重要な JSON キーのリストについては、「Amazon FSx (NetApp ONTAP) テンプレートスキーマ」を参照してください。