Connect a Microsoft SharePoint per la tua knowledge base - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connect a Microsoft SharePoint per la tua knowledge base

Microsoft SharePoint è un servizio collaborativo basato sul Web per lavorare su documenti, pagine Web, siti Web, elenchi e altro ancora. Puoi connetterti alla tua SharePoint istanza per la tua knowledge base di Amazon Bedrock utilizzando la console di AWS gestione per Amazon Bedrock o l'CreateDataSourceAPI (vedi Amazon Bedrock supportata SDKs e). AWS CLI

Nota

SharePoint il connettore di origine dati è in versione di anteprima ed è soggetto a modifiche.

Le origini SharePoint dati Microsoft non supportano dati multimodali, come tabelle, grafici, diagrammi o altre immagini.

Amazon Bedrock supporta la connessione a istanze SharePoint online. La scansione dei OneNote documenti non è attualmente supportata. Attualmente, solo Amazon OpenSearch Serverless Vector Store è disponibile per l'uso con questa fonte di dati.

Il numero di file e le dimensioni in MB per file che è possibile sottoporre a crawling sono limitati. Consulta Quote per le knowledge base.

Funzionalità supportate

  • Rilevamento automatico dei campi principali dei documenti

  • Filtri per inclusione/esclusione del contenuto

  • Sincronizzazione incrementale dei contenuti per aggiunte, aggiornamenti ed eliminazioni

  • SharePoint Autenticazione solo tramite app

Prerequisiti

SharePoint (Online)

In SharePoint (Online), completa i seguenti passaggi per utilizzare l'autenticazione SharePoint solo per app:

  • Prendi nota dell'URL del tuo sito SharePoint Online/. URLs Ad esempio, https://yourdomain.sharepoint.com/sites/mysite. L’URL deve iniziare con https e contenere sharepoint.com. L'URL del tuo sito deve essere il SharePoint sito effettivo, non sharepoint.com/ o sites/mysite/home.aspx

  • Prendi nota del nome di dominio dell'URL dell'istanza SharePoint Online. URLs

  • Copia l’ID del tenant Microsoft 365. È possibile trovare l’ID del tenant nelle proprietà del portale di Microsoft Entra. Per i dettagli, consulta Trova il tuo ID tenant di Microsoft 365.

    Nota

    Per un’applicazione di esempio, vedi Registrare un’applicazione client in Microsoft Entra ID (precedentemente noto come Azure Active Directory) nel sito web Microsoft Learn.

  • Configura le SharePoint credenziali solo per le app.

  • Copia l'ID client e il valore segreto del client quando concedi l'autorizzazione a App-Only. SharePoint Per ulteriori informazioni, consulta Concessione dell'accesso tramite App-Only. SharePoint

    Nota

    Non è necessario configurare alcuna autorizzazione API per App-Only. SharePoint Tuttavia, è necessario configurare le autorizzazioni APP sul lato. SharePoint Per ulteriori informazioni sulle autorizzazioni APP richieste, consulta la documentazione Microsoft sulla concessione dell'accesso tramite SharePoint App-Only.

Account AWS

Nel tuo AWS account, assicurati di:

  • Archivia le credenziali di autenticazione in un segreto di AWS Secrets Manager e prendi nota del nome della risorsa Amazon (ARN) del segreto stesso. Segui le istruzioni nella sezione Configurazione della connessione in questa pagina per includere le coppie chiave-valore da inserire nel segreto.

  • Includi le autorizzazioni necessarie per connetterti alla tua fonte di dati nella role/permissions policy AWS Identity and Access Management (IAM) per la tua knowledge base. Per informazioni sulle autorizzazioni richieste per questa fonte di dati da aggiungere al IAM ruolo della knowledge base, consulta Autorizzazioni per l'accesso alle fonti di dati.

Nota

Se utilizzi la console, puoi andare AWS Secrets Manager a aggiungere il tuo segreto o utilizzare un segreto esistente come parte della fase di configurazione dell'origine dati. Il IAM ruolo con tutte le autorizzazioni richieste può essere creato automaticamente come parte dei passaggi della console per la creazione di una knowledge base. Dopo aver configurato l'origine dati e altre configurazioni, il IAM ruolo con tutte le autorizzazioni richieste viene applicato alla knowledge base specifica.

Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. e fornire solo il livello di accesso necessario per motivi di sicurezza. Il riutilizzo di credenziali e segreti tra origini dati diverse non è consigliato.

Configurazione della connessione

Per connetterti alla tua SharePoint istanza, devi fornire le informazioni di configurazione necessarie in modo che Amazon Bedrock possa accedere ai tuoi dati ed eseguirne la scansione. nonché rispettare le indicazioni presenti nella sezione Prerequisiti.

Un esempio di configurazione per l’origine dati è incluso in questa sezione.

Per ulteriori informazioni sul rilevamento automatico dei campi del documento, sui filtri di inclusione/esclusione, sulla sincronizzazione incrementale, sulle credenziali di autenticazione dei segreti e sul relativo funzionamento, consulta le sezioni seguenti:

Il connettore delle origini dati rileva automaticamente tutti i campi di metadati principali dei documenti o dei contenuti e li sottopone a crawling. Ad esempio, il connettore delle origini dati può sottoporre a crawling l’equivalente del corpo del documento, il titolo del documento, la data di creazione o di modifica del documento o altri campi principali che potrebbero essere applicati ai documenti.

Importante

Se i tuoi contenuti includono informazioni sensibili, allora Amazon Bedrock potrebbe rispondere utilizzando informazioni sensibili.

Per migliorare ulteriormente la pertinenza delle risposte, è possibile applicare operatori di filtro ai campi di metadati, ad esempio “epoch_modification_time” del documento oppure il numero di secondi trascorsi dal 1° gennaio 1970, data dell’ultimo aggiornamento del documento. È possibile filtrare in base ai dati più recenti, in cui “epoch_modification_time” è maggiore di un determinato numero. Per ulteriori informazioni sugli operatori di filtro che è possibile applicare ai campi di metadati, consulta Metadati e filtri.

È possibile includere o escludere il crawling di determinati contenuti, Ad esempio, puoi specificare un modello di prefix/regular espressione di esclusione per evitare la scansione di qualsiasi file che contenga «privato» nel nome del file. È inoltre possibile specificare un modello di prefix/regular espressione di inclusione per includere determinate entità di contenuto o tipi di contenuto. Se si specifica un filtro di inclusione ed esclusione ed entrambi corrispondono a un documento, il filtro di esclusione ha la precedenza e il documento non viene sottoposto a crawling.

Un esempio di modello di espressione regolare per escludere o filtrare i file PDF che contengono “privato” nel nome è il seguente: “.*privato.*\\.pdf”.

È possibile applicare inclusion/exclusion filtri ai seguenti tipi di contenuto:

  • Page: titolo principale della pagina

  • Event: nome dell’evento

  • File: nome del file con la relativa estensione per gli allegati e tutti i file del documento

La scansione OneNote dei documenti non è attualmente supportata.

Il connettore di origine dati esegue la ricerca per indicizzazione di contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con la Knowledge Base. Amazon Bedrock può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti ed eseguire la scansione dei contenuti modificati dall'ultima sincronizzazione. Quando sincronizzi per la prima volta l’origine dati con la knowledge base, per impostazione predefinita tutti i contenuti vengono sottoposti a crawling.

Per sincronizzare la fonte di dati con la knowledge base, utilizza l'StartIngestionJobAPI o seleziona la knowledge base nella console e seleziona Sincronizza nella sezione panoramica delle origini dati.

Importante

Tutti i dati sincronizzati dall’origine dati diventano disponibili per chiunque disponga delle autorizzazioni bedrock:Retrieve per recuperarli. Ciò può includere anche tutti i dati con autorizzazioni per l’origine dati controllate. Per ulteriori informazioni, consulta Autorizzazioni della knowledge base.

Quando si utilizza l'autenticazione SharePoint solo per app, le credenziali di autenticazione segrete AWS Secrets Manager devono includere queste coppie chiave-valore:

  • clientId: client ID associated with your Microsoft Entra SharePoint application

  • clientSecret: client secret associated with your Microsoft Entra SharePoint application

  • sharePointClientId: client ID generated when registering your SharePoint app for App-Only authentication

  • sharePointClientSecret: client secret generated when registering your SharePoint app for App-Only authentication

Nota

L'accesso segreto AWS Secrets Manager deve utilizzare la stessa regione della knowledge base.

Console
Connect un' SharePoint istanza alla knowledge base
  1. Segui i passaggi indicati Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock e scegli SharePointcome fonte di dati.

  2. Specifica un nome e una descrizione facoltativa per l’origine dati.

  3. Fornisci l'URL SharePoint del tuo sito/URLs. Ad esempio, per SharePoint Online,https://yourdomain.sharepoint.com/sites/mysite. L’URL deve iniziare con https e contenere sharepoint.com. L'URL del tuo sito deve essere il SharePoint sito effettivo, non sharepoint.com/ o sites/mysite/home.aspx

  4. Fornisci il nome di dominio della tua SharePoint istanza.

  5. Nella sezione Impostazioni avanzate, puoi configurare gli elementi seguenti (facoltativo):

    • Chiave KMS per l’archiviazione di dati transitori. — Puoi crittografare i dati transitori mentre li converti in incorporamenti con la chiave KMS predefinita Chiave gestita da AWS o con la tua chiave KMS. Per ulteriori informazioni, consulta Crittografia dell'archiviazione di dati transitoria durante l'importazione dei dati.

    • Policy di eliminazione dei dati: è possibile eliminare gli embedding vettoriali per l’origine dati corrente presenti nell’archivio vettoriale per impostazione predefinita oppure scegliere di mantenere i dati dell’archivio vettoriale.

  6. Fornisci le informazioni di autenticazione per connetterti alla tua istanza. SharePoint Per l' SharePoint autenticazione solo tramite app:

    1. Fornisci l’ID del tenant. Puoi trovare l’ID del tenant nelle proprietà del portale di Azure Active Directory.

    2. Vai AWS Secrets Manager a per aggiungere le tue credenziali segrete o usa un Amazon Resource Name (ARN) esistente per il segreto che hai creato. Il tuo segreto deve contenere l'ID SharePoint cliente e il segreto SharePoint client generati quando hai registrato l'app App-Only a livello di tenant o a livello di sito, e l'ID client Entra e il segreto client Entra generati quando registri l'app in Entra.

  7. (Facoltativo) Nella sezione relativa a chunking e analisi dei contenuti, puoi personalizzare il modo in cui analizzare i dati ed eseguirne il chunking. Per ulteriori informazioni su queste personalizzazioni, consulta le risorse seguenti:

  8. Scegliete di utilizzare modelli di filters/regular espressioni per includere o escludere determinati contenuti. Altrimenti, tutto il contenuto standard viene sottoposto a crawling.

  9. Continua a scegliere un modello di embedding e un archivio vettoriale. Per visualizzare le fasi rimanenti, torna a Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock e continua dalla fase successiva alla connessione all’origine dati.

API

Di seguito è riportato un esempio di configurazione per la connessione a SharePoint Online per la tua knowledge base Amazon Bedrock. Puoi configurare la tua origine dati utilizzando l'API con l'SDK AWS CLI o supportato, come Python. Dopo la chiamata CreateKnowledgeBase, chiami CreateDataSourceper creare la fonte di dati contenente le informazioni di connessione. dataSourceConfiguration

Per informazioni sulle personalizzazioni che è possibile applicare all’importazione includendo il campo vectorIngestionConfiguration opzionale, consulta Personalizzare l’importazione per un’origine dati.

AWS Command Line Interface

aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"

Contenuto di sharepoint-bedrock-connector-configuration.json:

{ "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_SHAREPOINT_APP_ONLY_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }
Importante

L'autenticazione OAuth2 2.0 non è consigliata. Ti consigliamo di utilizzare l'autenticazione solo per SharePoint app.

Utilizzando OAuth 2.0, è possibile autenticare e autorizzare l'accesso alle SharePoint risorse per i SharePoint connettori integrati con le Knowledge Base.

Prerequisiti

In SharePoint, per l'autenticazione OAuth 2.0, assicurati di:

  • Prendi nota dell'URL del tuo sito SharePoint Online/URLs. Ad esempio, https://yourdomain.sharepoint.com/sites/mysite. L’URL deve iniziare con https e contenere sharepoint.com. L'URL del tuo sito deve essere il SharePoint sito effettivo, non sharepoint.com/ o sites/mysite/home.aspx

  • Prendi nota del nome di dominio dell'URL dell'istanza SharePoint Online. URLs

  • Copia l’ID del tenant Microsoft 365. Puoi trovare il tuo ID tenant nelle Proprietà del tuo portale Microsoft Entra o nella tua OAuth applicazione.

    Prendi nota del nome utente e della password dell' SharePointaccount amministratore e copia l'ID cliente e il valore del segreto del cliente durante la registrazione di un'applicazione.

    Nota

    Per un’applicazione di esempio, vedi Registrare un’applicazione client in Microsoft Entra ID (precedentemente noto come Azure Active Directory) nel sito web Microsoft Learn.

  • Alcune autorizzazioni di lettura sono necessarie per connettersi SharePoint quando si registra un'applicazione.

    • SharePoint: AllSites .Read (delegato): legge gli elementi in tutte le raccolte del sito

  • Potrebbe essere necessario disattivare le impostazioni di sicurezza predefinite nel portale di Azure utilizzando un utente amministratore. Per altre informazioni sulla gestione delle impostazioni di sicurezza predefinite nel portale di Azure, consulta la documentazione Microsoft su come impostare le impostazioni di enable/disable sicurezza predefinite.

  • Potrebbe essere necessario disattivare l'autenticazione a più fattori (MFA) nel SharePoint tuo account, in modo che Amazon Bedrock non sia bloccato dalla scansione dei tuoi contenuti. SharePoint

Per completare i prerequisiti, verifica di aver completato la procedura in Account AWS.

Credenziali di autenticazione dei segreti

Per la configurazione della connessione per OAuth2 .0, è possibile eseguire gli stessi passaggi per il rilevamento automatico dei campi del documento principale, dei inclusion/exclusion filtri e della sincronizzazione incrementale, come descritto in. Configurazione della connessione

Per l'autenticazione OAuth 2.0, le credenziali di autenticazione segrete AWS Secrets Manager devono includere queste coppie chiave-valore.

  • username: SharePoint admin username

  • password: SharePoint admin password

  • clientId: OAuth app client ID

  • clientSecret: OAuth app client secret

Connect un' SharePoint istanza alla knowledge base

Per connettere un' SharePoint istanza alla tua knowledge base quando usi OAuth2 .0:

  • (console) Nella console, segui gli stessi passaggi descritti in Connect a SharePoint instance to your knowledge base. Quando desideri fornire le informazioni di autenticazione per connetterti alla tua SharePoint istanza.

    • Fornisci l’ID del tenant. Puoi trovare l’ID del tenant nelle proprietà del portale di Azure Active Directory.

    • Vai AWS Secrets Manager a per aggiungere le tue credenziali di autenticazione segrete o usa un Amazon Resource Name (ARN) esistente per il segreto che hai creato. Il tuo segreto deve contenere il nome utente e la password dell' SharePoint amministratore, l'ID client e il segreto del client dell'app registrata. Per un’applicazione di esempio, vedi Registrare un’applicazione client in Microsoft Entra ID (precedentemente noto come Azure Active Directory) nel sito web Microsoft Learn.

  • (API) Di seguito è riportato un esempio di utilizzo dell'CreateDataSourceAPI per creare un'origine dati con le informazioni di connessione per OAuth2 .0.

    aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"

    Contenuto di sharepoint-bedrock-connector-configuration.json:

    { "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }