Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Box
Box es un servicio de almacenamiento en la nube que ofrece capacidades de alojamiento de archivos. Puedes usarlo Amazon Kendra para indexar el contenido de tu Box, incluidos comentarios, tareas y enlaces web.
Puedes conectarte Amazon Kendra a tu fuente de datos de Box mediante la Amazon Kendraconsola y la BoxConfigurationAPI.
Para solucionar problemas del conector de fuente de datos de Amazon Kendra Box, consultaSolución de problemas con los orígenes de datos.
Características admitidas
Amazon KendraEl conector de fuente de datos de Box admite las siguientes funciones:
-
Asignaciones de campos
-
Control de acceso de usuarios
-
Filtros de inclusión/exclusión
-
Sincronizaciones completas e incrementales del contenido y del registro de cambios
-
Nube privada virtual (VPC)
Requisitos previos
Antes de poder utilizarla Amazon Kendra para indexar tu fuente de datos de Box, realiza estos cambios en Box y en tus AWS cuentas.
En Box, asegúrese de que:
-
Tiene una cuenta Box Enterprise o Box Enterprise Plus.
-
Ha configurado una aplicación personalizada de Box en la consola para desarrolladores de Box con autenticación del servidor mediante tokens web JSON (JWT). Consulte la documentación de Box sobre la creación de una aplicación personalizada y la documentación de Box sobre la configuración de JWT Auth para obtener más información.
-
Ha establecido el nivel de acceso de la aplicación en App + Enterprise Access y le ha permitido Realizar llamadas a la API utilizando el encabezado como usuario.
-
Ha usado el usuario administrador para agregar los siguientes Ámbitos de aplicación en su aplicación Box:
-
Escribir todos los archivos y carpetas almacenados en un Box
-
Administración de usuarios
-
Administrar grupos
-
Administrar propiedades empresariales
-
Un par de Public/Private claves configurado incluye un ID de cliente, un secreto de cliente, un ID de clave pública, un ID de clave privada, una contraseña y un ID empresarial para usar como credenciales de autenticación. Consulte Par de claves pública y privada para obtener más detalles.
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
-
Ha copiado el ID empresarial de Box de la configuración de la consola para desarrolladores de Box o de la aplicación Box. Por ejemplo, 801234567.
-
Ha comprobado que cada documento es único en Box y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. IDs Los documentos son globales para un índice y deben ser únicos por índice.
En el tuyoCuenta de AWS, asegúrate de tener:
-
Creó un Amazon Kendra índice y, si usa la API, anotó el ID del índice.
-
Creó un IAM rol para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.
Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.
-
Ha guardado sus credenciales de autenticación de Box en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.
Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).
Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de datos de BoxAmazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.
Instrucciones de conexión
Para conectarse Amazon Kendra a su fuente de datos de Box, debe proporcionar los detalles necesarios de su fuente de datos de Box para que Amazon Kendra pueda acceder a sus datos. Si todavía no has configurado Box forAmazon Kendra, consultaRequisitos previos.
- Console
-
Para conectarse Amazon Kendra a Box
-
Inicia sesión en la Amazon Kendraconsola Consola de administración de AWS y ábrela.
-
En el panel de navegación izquierdo, elija Índices y, a continuación, elija el índice que desee usar de la lista de índices.
Puede elegir configurar o editar los ajustes de Control de acceso de usuarios en la Configuración del índice.
-
En la página Introducción, seleccione Agregar origen de datos.
-
En la página Agregar origen de datos, seleccione el Conector de Box y, a continuación, seleccione Agregar conector. Si usa la versión 2 (si corresponde), elija el Conector de Box con la etiqueta “V2.0”.
-
En la página Especificar detalles del origen de datos, introduzca la siguiente información:
-
En Nombre y descripción, en Nombre del origen de datos: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.
-
(Opcional) Descripción: introduzca una descripción opcional para el origen de datos.
-
En Idioma predeterminado: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.
-
En Etiquetas, para añadir una nueva etiqueta: incluye etiquetas opcionales para buscar y filtrar tus recursos o realizar un seguimiento de tus AWS costes.
-
Elija Siguiente.
-
En la página Definir acceso y seguridad, introduzca la siguiente información:
-
ID empresarial de Box: introduzca el ID empresarial de Box. Por ejemplo, 801234567.
-
Autorización: active o desactive la información de la lista de control de acceso (ACL) para los documentos, si tiene una ACL y desea usarla para el control de acceso. La ACL especifica a qué documentos pueden acceder los usuarios y los grupos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.
-
AWS Secrets Managersecreto: elija un secreto existente o cree uno nuevo Secrets Manager para almacenar sus credenciales de autenticación de Box. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager.
-
Nombre del secreto: un nombre para su secreto. El prefijo «AmazonKendra-Box» se añade automáticamente a su nombre secreto.
-
Para el identificador de cliente, el secreto de cliente, el identificador de clave pública, el identificador de clave privada y la contraseña, introduzca los valores de la Public/Private clave que configuró en Box.
-
Agregue y guarde el secreto.
-
Nube privada virtual (VPC): puede optar por utilizar una VPC. Si es así, debe agregar Subredes y Grupos de seguridad de VPC.
-
Rastreador de identidades: especifique si se debe activar el rastreador de identidades de Amazon Kendra. El rastreador de identidades utiliza la información de la lista de control de acceso (ACL) de los documentos para filtrar los resultados de la búsqueda en función del acceso del usuario o del grupo a los documentos. Si tiene una ACL para sus documentos y decide utilizarla, también puede optar por activar el rastreador de identidades para configurar el filtrado Amazon Kendra de los resultados de búsqueda por contexto de usuario. De lo contrario, si el rastreador de identidades está desactivado, todos los documentos se pueden buscar públicamente. Si quieres usar el control de acceso para tus documentos y el rastreador de identidad está desactivado, también puedes usar la PutPrincipalMappingAPI para cargar información de acceso de usuarios y grupos para filtrar el contexto de los usuarios.
-
IAMrol: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.
IAMlos roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija Crear un nuevo rol para evitar errores.
-
Elija Siguiente.
-
En la página Configurar ajustes de sincronización, introduzca la siguiente información:
-
Archivos de Box: elija si desea rastrear los enlaces web, los comentarios y las tareas.
-
En Configuración adicional: añada patrones de expresión regular para incluir o excluir determinado contenido.
-
Modo de sincronización: elija cómo desea actualizar el índice cuando cambie el contenido del origen de datos. Al sincronizar la fuente de datos Amazon Kendra por primera vez, todo el contenido se rastrea e indexa de forma predeterminada. Debe ejecutar una sincronización completa de los datos si la sincronización inicial falló, incluso si no selecciona la sincronización completa como opción de modo de sincronización.
-
Sincronización completa: se vuelve a indexar todo el contenido, reemplazando el contenido existente cada vez que el origen de datos se sincronice con el índice.
-
Sincronización nueva y modificada: indexe solo el contenido nuevo y modificado cada vez que la fuente de datos se sincronice con el índice. Amazon Kendrapuede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido que ha cambiado desde la última sincronización.
-
Sincronización nueva y modificada: se indexa solo contenido nuevo y modificado cada vez que el origen de datos se sincronice con el índice. Amazon Kendra puede utilizar el mecanismo del origen de datos para realizar un seguimiento de los cambios en el contenido e indexar el contenido modificado desde la última sincronización.
-
En Programación de ejecución de sincronización en Frecuencia: elija la frecuencia con la que desea sincronizar el contenido del origen de datos y actualizar el índice.
-
Elija Siguiente.
-
En la página Establecer asignaciones de campos, especifique la siguiente información:
-
Campos de fuente de datos predeterminados: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.
-
Agregar campo: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.
-
Elija Siguiente.
-
En la página Revisar y crear, compruebe que la información que ha introducido es correcta y, a continuación, seleccione Añadir origen de datos. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página Orígenes de datos una vez que el origen de datos se haya agregado correctamente.
- API
-
Para conectarse Amazon Kendra a Box
Debe especificar lo siguiente mediante la BoxConfigurationAPI:
ID empresarial de Box: proporcione el ID empresarial de Box. Puede encontrar el ID empresarial en la configuración de la consola para desarrolladores de Box o al configurar una aplicación en Box.
-
Nombre secreto del recurso de Amazon (ARN): proporciona el nombre del recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de tu cuenta de Box. El secreto se almacena en una estructura JSON con las siguientes claves:
{
"clientID": "client-id",
"clientSecret": "client-secret",
"publicKeyID": "public-key-id",
"privateKey": "private-key",
"passphrase": "pass-phrase"
}
-
IAMrol: especifique RoleArn cuándo llama CreateDataSource para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar al público requerido APIs para el conector de Box y. Amazon Kendra Para obtener más información, consulte Roles de IAM para orígenes de datos de Box.
También puede añadir las siguientes características opcionales:
-
Nube privada virtual (VPC): especifique VpcConfiguration como parte de la configuración del origen de datos. Consulte Configuración de Amazon Kendra para utilizar una VPC.
-
Registro de cambios: si Amazon Kendra debe utilizar el mecanismo de registro de cambios del origen de datos de Box para determinar si un documento debe actualizarse en el índice.
Utilice el registro de cambios si no quiere que Amazon Kendra digitalice todos los documentos. Si el registro de cambios es grande, es posible que se Amazon Kendra tarde menos en escanear los documentos de la fuente de datos de Box que en procesar el registro de cambios. Si está sincronizando el origen de datos de Box con su índice por primera vez, se escanean todos los documentos.
-
Comentarios, tareas y enlaces web: especifique si desea rastrear este tipo de contenido.
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
-
Filtros de inclusión y exclusión: especifique si desea incluir o excluir determinados archivos y carpetas de Box.
La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.
-
Filtrado de contexto de usuario y control de acceso: si hay una lista de control de acceso (ACL) para los documentos, Amazon Kendra la rastreará. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.
-
Asignaciones de campos: elija asignar los campos del origen de datos de Box a los campos de índice de Amazon Kendra. Para obtener más información, consulte Asignación de campos de origen de datos.
El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en el origen de datos al nombre del campo del índice _document_body. Todos los demás campos son opcionales.
Más información
Para obtener más información sobre la integración Amazon Kendra con la fuente de datos de Box, consulte:
Notas
-
Cuando las listas de control de acceso (ACLs) están habilitadas, la opción «Sincronizar solo contenido nuevo o modificado» no está disponible debido a las limitaciones de la API de Box. Recomendamos usar los modos «Sincronización completa» o «Sincronización de contenido nuevo, modificado o eliminado» en su lugar, o desactivarlos ACLs si necesita usar este modo de sincronización.