Amazon FSx(Windows) - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon FSx(Windows)

Amazon FSx(Windows) es un sistema de servidor de archivos totalmente gestionado y basado en la nube que ofrece capacidades de almacenamiento compartido. Si es usuario de Amazon FSx (Windows), puede utilizarlo Amazon Kendra para indexar su fuente de datos Amazon FSx (Windows).

nota

Amazon Kendraahora es compatible con un conector actualizado Amazon FSx (Windows).

La consola se ha actualizado de forma automática. Todos los conectores nuevos que cree en la consola utilizarán la arquitectura actualizada. Si usa la API, ahora debe usar el objeto TemplateConfiguration en lugar del objeto FSxConfiguration para configurar el conector.

Los conectores configurados con la antigua arquitectura de consola y API seguirán funcionando tal y como estaban configurados. Sin embargo, no podrá editarlos ni actualizarlos. Si desea editar o actualizar la configuración de un conector, deberá crear uno nuevo.

Se recomienda migrar el flujo de trabajo de los conectores a la versión actualizada. Está previsto que la compatibilidad para los conectores configurados con la arquitectura anterior finalice en junio de 2024.

Puede conectarse Amazon Kendra a su fuente de datos Amazon FSx (Windows) mediante la Amazon Kendraconsola o la TemplateConfigurationAPI.

Para solucionar problemas del conector de fuente de datos Amazon Kendra Amazon FSx (Windows), consulteSolución de problemas con los orígenes de datos.

Características admitidas

Amazon KendraAmazon FSxEl conector de fuente de datos (Windows) admite las siguientes funciones:

  • Asignaciones de campos

  • Control de acceso de usuarios

  • Rastreo de identidades de usuarios

  • Filtros de inclusión y exclusión

  • Sincronizaciones completas e incrementales del contenido

  • Nube privada virtual (VPC)

Requisitos previos

Antes de poder utilizarla Amazon Kendra para indexar su fuente de datos Amazon FSx (Windows), compruebe los detalles de su fuente de datos Amazon FSx (Windows) yCuentas de AWS.

En el Amazon FSx caso de (Windows), asegúrese de que dispone de:

  • Configure Amazon FSx (Windows) con permisos de lectura y montaje.

  • Haber anotado el ID del sistema de archivos. Puede encontrar el identificador de su sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (Windows).

  • Configuró una nube privada virtual utilizando el Amazon VPC lugar donde reside su sistema de archivos Amazon FSx (Windows).

  • Apuntó sus credenciales de autenticación Amazon FSx (de Windows) para una cuenta Active Directory de usuario. Esto incluye el nombre de usuario de Active Directory con el nombre de dominio de DNS (por ejemplo, user@corp.example.com) y la contraseña.

    nota

    Utilice únicamente las credenciales necesarias para que el conector funcione. No utilice credenciales con privilegios como las de administrador del dominio.

    nota

    Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

  • Ha comprobado que cada documento es único en Amazon FSx (Windows) y en otras fuentes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.

En el tuyoCuenta de AWS, asegúrate de tener:

  • Creó un Amazon Kendra índice y, si usa la API, anotó el ID del índice.

  • Creó un IAM rol para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.

    nota

    Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.

  • Guardó sus credenciales de autenticación Amazon FSx (Windows) en un AWS Secrets Manager secreto y, si utiliza la API, anotó el ARN del secreto.

    nota

    Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y Secrets Manager secreto al conectar su fuente de datos Amazon FSx (Windows) aAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

Instrucciones de conexión

Para conectarse Amazon Kendra a su fuente de datos Amazon FSx (Windows), debe proporcionar los detalles necesarios de su fuente de datos Amazon FSx (Windows) para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado Amazon FSx (Windows)Amazon Kendra, consulteRequisitos previos.

Console

Para conectarse Amazon Kendra a su sistema de archivos Amazon FSx (Windows)

  1. Inicie sesión en la Amazon Kendraconsola Consola de administración de AWS y ábrala.

  2. En el panel de navegación izquierdo, elija Índices y, a continuación, elija el índice que desee usar de la lista de índices.

    nota

    Puede elegir configurar o editar los ajustes de Control de acceso de usuarios en la Configuración del índice.

  3. En la página Introducción, seleccione Agregar origen de datos.

  4. En la página Agregar origen de datos, seleccione el Conector de Amazon FSx (Windows) y, a continuación, seleccione Agregar conector. Si usa la versión 2 (si corresponde), elija el Conector de Amazon FSx (Windows) con la etiqueta “V2.0”.

  5. En la página Especificar detalles del origen de datos, introduzca la siguiente información:

    1. En Nombre y descripción, en Nombre del origen de datos: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

    2. (Opcional) Descripción: introduzca una descripción opcional para el origen de datos.

    3. En Idioma predeterminado: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

    4. En Etiquetas, para añadir una nueva etiqueta: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.

    5. Elija Siguiente.

  6. En la página Definir acceso y seguridad, introduzca la siguiente información:

    1. Amazon FSxID del sistema de archivos (Windows): seleccione en el menú desplegable su ID de sistema de archivos existente, obtenido de Amazon FSx (Windows). O bien, cree un sistema de archivos de Amazon FSx (Windows). Puede encontrar el ID de su sistema de archivos en el panel de sistemas de archivos de la consola Amazon FSx (Windows).

    2. Autorización: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.

    3. Autenticación: elija un AWS Secrets Manager secreto existente o cree uno nuevo para almacenar las credenciales del sistema de archivos. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.

      Proporcione un secreto que almacene las credenciales de autenticación del nombre de usuario y contraseña. El nombre de usuario debe incluir su nombre de dominio de DNS. Por ejemplo, user@corp.example.com.

      Guarde y agregue el secreto.

    4. Virtual Private Cloud (VPC): debe seleccionar un Amazon VPC lugar en el que resida su Amazon FSx (Windows). Incluya la subred de VPC y los grupos de seguridad. Consulte Configurar un. Amazon VPC

    5. IAMrol: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.

      nota

      IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija Crear un nuevo rol para evitar errores.

    6. Elija Siguiente.

  7. En la página Configurar ajustes de sincronización, introduzca la siguiente información:

    1. Ámbito de sincronización, patrones regex: añada patrones de expresiones regulares para incluir o excluir determinados archivos.

    2. Modo de sincronización: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.

      • Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.

      • Sincronización nueva, modificada o eliminada: indexe solo el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.

    3. Programación de ejecución de sincronización: en Frecuencia, elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.

    4. Elija Siguiente.

  8. En la página Establecer asignaciones de campos, especifique la siguiente información:

    1. Seleccione entre los campos predeterminados Amazon Kendra generados de sus archivos que desee asignar a su índice. Para agregar campos de origen de datos personalizados, cree un nombre de campo de índice para asignarlos y el tipo de datos del campo.

    2. Elija Siguiente.

  9. En la página Revisar y crear, compruebe que la información que ha introducido es correcta y, a continuación, seleccione Añadir origen de datos. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página Orígenes de datos una vez que el origen de datos se haya agregado correctamente.

API

Para conectarse Amazon Kendra a su sistema de archivos Amazon FSx (Windows)

Debe especificar un JSON del esquema del origen de datos mediante la API TemplateConfiguration. Debe proporcionar la siguiente información:

  • Origen de datos: defina el tipo de origen de datos como FSX cuando utilice el esquema JSON TemplateConfiguration. Además, defina el origen de datos como TEMPLATE al llamar a la API CreateDataSource.

  • ID del sistema de archivos: el identificador del sistema de archivos Amazon FSx (Windows). Puede encontrar el ID del sistema de archivos en el panel de Sistemas de archivos de la consola de Amazon FSx (Windows).

  • Tipo de sistema de archivos: especifique el tipo de sistema de archivos como WINDOWS.

  • Nube privada virtual (VPC): especifique a VpcConfiguration cuándo llamar a CreateDataSource. Para obtener más información, consulte ¿Se está configurando Amazon Kendra para usar un Amazon VPC.

    nota

    Debe seleccionar el lugar en el que Amazon VPC reside su Amazon FSx (Windows). Incluya la subred de VPC y los grupos de seguridad.

  • Modo de sincronización: especifique cómo Amazon Kendra debe actualizarse el índice cuando cambie el contenido de la fuente de datos. Al sincronizar el origen de datos con Amazon Kendra por primera vez, todo el contenido se rastrea y se indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización. Puede elegir entre las siguientes opciones:

    • FORCED_FULL_CRAWL para volver a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.

    • FULL_CRAWL para indexar solo el contenido nuevo, modificado y eliminado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.

  • Rastreador de identidades: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda según el contexto del usuario. De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la PutPrincipalMappingAPI para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.

  • Nombre secreto de recurso de Amazon (ARN): proporcione el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su Amazon FSx cuenta (Windows). El secreto se almacena en una estructura JSON con las siguientes claves:

    { "username": "user@corp.example.com", "password": "password" }
  • IAMrol: especifique RoleArn cuándo debe llamar CreateDataSource para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector Amazon FSx (Windows) y. Amazon Kendra Para obtener más información, consulte las IAMfunciones de las fuentes de datos Amazon FSx (Windows).

También puede añadir las siguientes características opcionales:

  • Filtros de inclusión y exclusión: especifique si desea incluir o excluir determinados archivos.

    nota

    La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.

  • Lista de control de acceso (ACL): especifique si se va a rastrear la información de la ACL para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.

    nota

    Para probar el filtrado de contexto de usuario con un usuario, debe incluir el nombre de dominio DNS como parte del nombre de usuario al realizar la consulta. Debe disponer de permisos administrativos del dominio de Active Directory. También puede probar el filtrado de contexto de usuario con el nombre de un grupo.

  • Asignaciones de campos: elija asignar los campos de la fuente de datos Amazon FSx (Windows) a los campos de índice. Amazon Kendra Para obtener más información, consulte Asignación de campos de origen de datos.

    nota

    El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice _document_body. Todos los demás campos son opcionales.

Para obtener una lista de otras claves JSON importantes que debe configurar, consulte el Esquema de plantilla de Amazon FSx (Windows).

Más información

Para obtener más información sobre la integración Amazon Kendra con su fuente de datos Amazon FSx (Windows), consulte: