View a markdown version of this page

Conéctese a Microsoft SharePoint para su base de conocimientos - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conéctese a Microsoft SharePoint para su base de conocimientos

Microsoft SharePoint es un servicio colaborativo basado en la web para trabajar en documentos, páginas web, sitios web, listas y mucho más. Puede conectarse a su SharePoint instancia para su base de conocimientos de Amazon Bedrock mediante la consola de AWS administración de Amazon Bedrock o la CreateDataSourceAPI (consulte los SDK compatibles con Amazon Bedrock y). AWS CLI

nota

SharePoint El conector de la fuente de datos se encuentra en versión preliminar y está sujeto a cambios.

Las fuentes de SharePoint datos de Microsoft no admiten datos multimodales, como tablas, gráficos, diagramas u otras imágenes.

Amazon Bedrock admite la conexión a instancias SharePoint en línea. Actualmente no se admite el rastreo de OneNote documentos. Actualmente, solo el almacén vectorial Amazon OpenSearch Serverless está disponible para su uso con esta fuente de datos.

Existen límites en cuanto al número de archivos y MB por archivo que pueden rastrearse. Consulte Cuotas de las bases de conocimientos.

Características admitidas

  • Detección automática de los campos principales del documento

  • Inclusion/exclusion filtros de contenido

  • El contenido incremental se sincroniza para añadir, actualizar o eliminar contenido

  • Autenticación de Microsoft Entra ID (credenciales de cliente OAuth2)

Requisitos previos

SharePoint (En línea)

importante

SharePoint App-Only Microsoft retiró la autenticación mediante Azure ACS el 2 de abril de 2026 y ya no funciona. En su lugar, utilice la autenticación Microsoft Entra ID (credenciales de cliente OAuth2). Al configurar la fuente de datos, establézcala enauthType. OAUTH2_CLIENT_CREDENTIALS

En su cuenta SharePoint (en línea), complete los siguientes pasos para configurar la autenticación de Microsoft Entra ID:

  • Tome nota de su sitio SharePoint en línea URL/URLs. Por ejemplo, https://yourdomain.sharepoint.com/sites/mysite. La URL debe empezar por https y contener sharepoint.com. La URL de su sitio debe ser el SharePoint sitio real, no sharepoint.com/ o sites/mysite/home.aspx

  • Toma nota del nombre de dominio de tu instancia SharePoint online URL/URLs.

  • Copie su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades de su portal de Microsoft Entra. Consulte Find your Microsoft 365 tenant ID para obtener más información.

  • Registre una aplicación en Microsoft Entra ID. Ve al centro de administración de Microsoft Entra, ve a Registros de aplicaciones y selecciona Nuevo registro. Anote el ID de la aplicación (cliente) y el ID del directorio (inquilino).

  • Configure los permisos de la API para la aplicación registrada. Agregue Microsoft GraphPermisos de aplicaciónSites.Read.All. A continuación, otorgue el consentimiento de administrador a su organización.

  • Crea un secreto de cliente. En el registro de la aplicación, vaya a Certificados y secretosNuevo secreto de cliente. Copia el valor secreto inmediatamente, ya que no se volverá a mostrar.

  • Guarde el ID del inquilino, el ID del cliente y el secreto del cliente en él AWS Secrets Manager. Su secreto debe contener los siguientes pares clave-valor:clientId,. clientSecret

Cuenta de AWS

En tu AWS cuenta, asegúrate de:

  • Almacenar sus credenciales de autenticación en un secreto de AWS Secrets Manager y tomar nota del nombre de recurso de Amazon (ARN) del secreto. Siga las instrucciones de la sección Configuración de la conexión que aparecen en esta página para incluir los pares clave-valor que deben incluirse en el secreto.

  • Incluya los permisos necesarios para conectarse a su fuente de datos en la role/permissions política AWS Identity and Access Management (IAM) de su base de conocimientos. Para obtener información sobre los permisos necesarios para que esta fuente de datos se añada a su IAM función de base de conocimientos, consulte Permisos para acceder a las fuentes de datos.

nota

Si usa la consola, puede ir AWS Secrets Manager a para agregar su secreto o usar uno existente como parte del paso de configuración de la fuente de datos. El IAM rol con todos los permisos necesarios se puede crear automáticamente como parte de los pasos de la consola para crear una base de conocimientos. Una vez que haya configurado la fuente de datos y otras configuraciones, el IAM rol con todos los permisos necesarios se aplicará a su base de conocimientos específica.

Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No recomendamos reutilizar las credenciales y los secretos en distintos orígenes de datos.

Configuración de la conexión

Para conectarse a su SharePoint instancia, debe proporcionar la información de configuración necesaria para que Amazon Bedrock pueda acceder a sus datos y rastrearlos. También debe seguir los Requisitos previos.

En esta sección se incluye un ejemplo de configuración para este origen de datos.

Para obtener más información sobre la detección automática de campos de documentos, inclusion/exclusion los filtros, la sincronización incremental, las credenciales de autenticación secretas y su funcionamiento, seleccione lo siguiente:

El conector del origen de datos detecta y rastrea automáticamente todos los campos de metadatos principales de sus documentos o del contenido. Por ejemplo, el conector del origen de datos puede rastrear el equivalente del cuerpo del documento de sus documentos, el título del documento, la fecha de creación o modificación del documento u otros campos principales que puedan aplicarse a los documentos.

importante

Si su contenido incluye información confidencial, Amazon Bedrock podría responder utilizando información confidencial.

Puede aplicar operadores de filtrado a los campos de metadatos para mejorar aún más la relevancia de las respuestas. Por ejemplo, documente “epoch_modification_time” o el número de segundos transcurridos desde el 1 de enero de 1970 hasta que se actualizó el documento por última vez. Puede filtrar por los datos más recientes, donde “epoch_modification_time” es mayor que un número determinado. Para obtener más información sobre los operadores de filtrado que puede aplicar a los campos de metadatos, consulte Metadatos y filtrado.

Puede incluir o excluir el rastreo de determinado contenido. Por ejemplo, puede especificar un patrón de prefix/regular expresión de exclusión para evitar el rastreo de cualquier archivo que contenga la palabra «privado» en el nombre del archivo. También puede especificar un patrón de prefix/regular expresión de inclusión para incluir determinadas entidades o tipos de contenido. Si especifica un filtro de inclusión y exclusión y ambos coinciden con un documento, el filtro de exclusión tiene prioridad y el documento no se rastrea.

Un ejemplo de patrón de expresiones regulares para excluir o filtrar archivos PDF que contienen la palabra “privado” en el nombre del archivo: ".*private.*\\.pdf".

Puede aplicar inclusion/exclusion filtros a los siguientes tipos de contenido:

  • Page: título de la página principal

  • Event: nombre del evento

  • File: nombre del archivo con su extensión para los archivos adjuntos y todos los archivos del documento

Actualmente no se admite el rastreo de OneNote documentos.

El conector de fuentes de datos rastrea el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincroniza con la base de conocimientos. Amazon Bedrock puede utilizar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido y rastrear el contenido modificado desde la última sincronización. Al sincronizar el origen de datos con la base de conocimientos por primera vez, todo el contenido se rastrea de forma predeterminada.

Para sincronizar la fuente de datos con la base de conocimientos, usa la StartIngestionJobAPI o selecciona tu base de conocimientos en la consola y selecciona Sincronizar en la sección de información general de la fuente de datos.

importante

Todos los datos que sincronice desde el origen de datos estarán disponibles para cualquier persona que tenga permisos bedrock:Retrieve para obtenerlos. Esto también puede incluir los datos con permisos de orígenes de datos controlados. Para obtener más información, consulte Permisos de la base de conocimientos.

Al utilizar la autenticación Microsoft Entra ID (OAUTH2_CLIENT_CREDENTIALS), tus credenciales de autenticación secretas AWS Secrets Manager deben incluir estos pares clave-valor:

  • clientId: Application (client) ID from your Microsoft Entra ID app registration

  • clientSecret: client secret value from your Microsoft Entra ID app registration

nota

Su clave secreta AWS Secrets Manager debe usar la misma región de su base de conocimientos.

Console
Conecta una SharePoint instancia a tu base de conocimientos
  1. Siga los pasos que se indican en Creación de una base de conocimiento conectándola a un origen de datos de Bases de conocimiento de Amazon Bedrock y elija SharePointla fuente de datos.

  2. Proporcione un nombre y una descripción opcional para el origen de datos.

  3. Proporcione su SharePoint sitio URL/URLs. Por ejemplo, para SharePoint Online,https://yourdomain.sharepoint.com/sites/mysite. La URL debe empezar por https y contener sharepoint.com. La URL de su sitio debe ser el SharePoint sitio real, no sharepoint.com/ o sites/mysite/home.aspx

  4. Proporcione el nombre de dominio de la SharePoint instancia.

  5. En la sección Configuración avanzada, si lo desea, puede configurar lo siguiente:

    • Clave de KMS para el almacenamiento de datos transitorios: — Puede cifrar los datos transitorios y, al mismo tiempo, convertirlos en incrustaciones con la clave KMS predeterminada Clave administrada de AWS o con su propia clave KMS. Para obtener más información, consulte Cifrado del almacenamiento de datos transitorios durante la ingesta de datos.

    • Política de eliminación de datos: puede eliminar las incrustaciones vectoriales de su origen de datos que están almacenadas en el almacén de vectores de forma predeterminada u optar por conservar los datos del almacén de vectores.

  6. Proporcione la información de autenticación para conectarse a la instancia. SharePoint Para la autenticación de Microsoft Entra ID:

    1. Proporcione el ID de inquilino. Puedes encontrar tu ID de inquilino en las propiedades del centro de administración de Microsoft Entra.

    2. Vaya AWS Secrets Manager a para añadir sus credenciales secretas o utilice un nombre de recurso de Amazon (ARN) existente para el secreto que ha creado. El secreto debe contener el ID de cliente y el secreto de cliente del registro de la aplicación Microsoft Entra ID.

  7. (Opcional) En la sección Análisis y fragmentación del contenido, puede personalizar la forma de analizar y fragmentar los datos. Para obtener más información sobre estas personalizaciones, consulte los siguientes recursos:

  8. Elige usar patrones de filters/regular expresiones para incluir o excluir cierto contenido. De lo contrario, se rastreará todo el contenido estándar.

  9. Continúe eligiendo un modelo de incrustación y un almacén de vectores. Para ver los pasos restantes, regrese a Creación de una base de conocimiento conectándola a un origen de datos de Bases de conocimiento de Amazon Bedrock y continúe desde allí después de conectar el origen de datos.

API

El siguiente es un ejemplo de configuración para conectarse a SharePoint Online para su base de conocimiento de Amazon Bedrock. La fuente de datos se configura mediante la API con el SDK compatible AWS CLI o compatible, como Python. Después de llamar CreateKnowledgeBase, llamas CreateDataSourcepara crear tu fuente de datos con la información de conexióndataSourceConfiguration.

Para obtener información sobre las personalizaciones que puede aplicar a la ingesta mediante la inclusión del campo vectorIngestionConfiguration opcional, consulte Personalización de la ingesta de un origen de datos.

AWS Command Line Interface

aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"

Contenido de sharepoint-bedrock-connector-configuration.json

{ "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_SHAREPOINT_APP_ONLY_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }
importante

SharePoint App-Only Microsoft retiró la autenticación mediante Azure ACS el 2 de abril de 2026. Utilice la autenticación Microsoft Entra ID (OAUTH2_CLIENT_CREDENTIALS) tal y como se describe en los requisitos previos anteriores.

Con OAuth 2.0, puedes autenticar y autorizar el acceso a SharePoint los recursos para los SharePoint conectores integrados en las bases de conocimiento.

Pre-requisites

En SharePoint, para la autenticación de OAuth 2.0, asegúrate de:

  • Toma nota de tu sitio SharePoint en línea. URL/URLs Por ejemplo, https://yourdomain.sharepoint.com/sites/mysite. La URL debe empezar por https y contener sharepoint.com. La URL de su sitio debe ser el SharePoint sitio real, no sharepoint.com/ o sites/mysite/home.aspx

  • Toma nota del nombre de dominio de tu instancia SharePoint online URL/URLs.

  • Copie su ID de inquilino de Microsoft 365. Puede encontrar su ID de inquilino en las propiedades del portal de Microsoft Entra o en la aplicación OAuth.

    Toma nota del nombre de usuario y la contraseña de la SharePoint cuenta de administrador y copia el ID de cliente y el valor secreto del cliente al registrar una aplicación.

    nota

    Para ver un ejemplo de aplicación, consulte Registro de una aplicación cliente en Microsoft Entra ID (anteriormente conocido como Azure Active Directory) en el sitio web de Microsoft Learn.

  • Se requieren ciertos permisos de lectura para poder conectarse SharePoint al registrar una aplicación.

    • SharePoint: AllSites.Read (Delegado) — Lee los elementos de todas las colecciones de sitios

  • Es posible que tenga que desactivar Valores predeterminados de seguridad en el portal de Azure mediante un usuario administrador. Para obtener más información sobre la administración de la configuración predeterminada de seguridad en el portal de Azure, consulte la documentación de Microsoft sobre cómo establecer la configuración predeterminada enable/disable de seguridad.

  • Es posible que tengas que desactivar la autenticación multifactor (MFA) en SharePoint tu cuenta para que Amazon Bedrock no pueda rastrear tu contenido. SharePoint

Para cumplir los requisitos previos, asegúrese de haber realizado los pasos que se detallan en Cuenta de AWS.

Credenciales de autenticación secretas

Para la configuración de la conexión OAuth2.0, puede realizar los mismos pasos para la detección automática de los campos principales del documento, los inclusion/exclusion filtros y la sincronización incremental, tal como se describe enConfiguración de la conexión.

Para la autenticación OAuth 2.0, tus credenciales de autenticación secretas AWS Secrets Manager deben incluir estos pares clave-valor.

  • username: SharePoint admin username

  • password: SharePoint admin password

  • clientId: OAuth app client ID

  • clientSecret: OAuth app client secret

Conecta una SharePoint instancia a tu base de conocimientos

Para conectar una SharePoint instancia a tu base de conocimientos cuando utilices OAuth2.0:

  • (consola) En la consola, sigue los mismos pasos que se describen en Conectar una SharePoint instancia a la base de conocimientos. Cuando desee proporcionar la información de autenticación para conectarse a su SharePoint instancia.

    • Proporcione el ID de inquilino. Puede encontrar su ID de inquilino en las propiedades del portal de Azure Active Directory.

    • Vaya AWS Secrets Manager a para añadir sus credenciales de autenticación secretas o utilice un nombre de recurso de Amazon (ARN) existente para el secreto que ha creado. Su secreto debe contener el nombre de usuario y la contraseña del SharePoint administrador, así como el ID de cliente y el secreto de cliente de la aplicación registrados. Para ver un ejemplo de aplicación, consulte Registro de una aplicación cliente en Microsoft Entra ID (anteriormente conocido como Azure Active Directory) en el sitio web de Microsoft Learn.

  • (API) El siguiente es un ejemplo del uso de la CreateDataSource API para crear la fuente de datos con la información de conexión OAuth2.0.

    aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"

    Contenido de sharepoint-bedrock-connector-configuration.json

    { "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }