Connettersi a Microsoft SharePoint per una knowledge base - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connettersi a Microsoft SharePoint per una knowledge base

Microsoft SharePoint è un servizio collaborativo basato sul web per lavorare su documenti, pagine web, siti web, elenchi e altro ancora. Per connetterti all’istanza SharePoint per Knowledge Base per Amazon Bedrock, utilizza la Console di gestione AWS per Amazon Bedrock oppure l’API CreateDataSource (consulta gli SDK supportati di Amazon Bedrock e l’AWS CLI).

Nota

Il connettore delle origini dati in SharePoint è disponibile nella versione di anteprima ed è soggetto a modifiche.

Le origini dati Microsoft SharePoint non supportano dati multimodali, come tabelle, grafici, diagrammi o altre immagini.

Amazon Bedrock supporta la connessione a istanze di SharePoint Online. Il crawling dei documenti di OneNote non è attualmente supportato. Attualmente, solo l’archivio vettoriale Amazon OpenSearch serverless è disponibile per l’utilizzo con questa origine dati.

Il numero di file e le dimensioni in MB per file che è possibile sottoporre a crawling sono limitati. Consulta Quote per le knowledge base.

Funzionalità supportate

  • Rilevamento automatico dei campi principali dei documenti

  • Filtri per inclusione/esclusione del contenuto

  • Sincronizzazione incrementale dei contenuti per aggiunte, aggiornamenti ed eliminazioni

  • Autenticazione SharePoint App-Only

Prerequisiti

SharePoint (Online)

In SharePoint (Online), attieniti alla seguente procedura per utilizzare l’autenticazione SharePoint App-Only:

  • Prendi nota degli URL del sito SharePoint Online. Ad esempio, https://yourdomain.sharepoint.com/sites/mysite. L’URL deve iniziare con https e contenere sharepoint.com. L’URL del sito deve essere il sito effettivo di SharePoint, non sharepoint.com/ o sites/mysite/home.aspx

  • Prendi nota del nome di dominio degli URL dell’istanza di SharePoint Online.

  • Copia l’ID del tenant Microsoft 365. È possibile trovare l’ID del tenant nelle proprietà del portale di Microsoft Entra. Per i dettagli, consulta Trova il tuo ID tenant di Microsoft 365.

    Nota

    Per un’applicazione di esempio, vedi Registrare un’applicazione client in Microsoft Entra ID (precedentemente noto come Azure Active Directory) nel sito web Microsoft Learn.

  • Configura le credenziali SharePoint App-Only.

  • Copia l’ID client e il valore del segreto del client quando concedi l’autorizzazione a SharePoint App-Only. Per ulteriori informazioni, consulta Granting access using SharePoint App-Only.

    Nota

    Non è necessario configurare alcuna autorizzazione API per SharePoint App-Only. Tuttavia, è necessario configurare le autorizzazioni APP sul lato SharePoint. Per ulteriori informazioni sulle autorizzazioni APP richieste, consulta l’articolo della documentazione Microsoft Granting access using SharePoint App-Only.

Account AWS

Nell’account AWS, verifica quanto segue:

  • Archivia le credenziali di autenticazione in un segreto di Gestione dei segreti AWS e prendi nota del nome della risorsa Amazon (ARN) del segreto stesso. Segui le istruzioni nella sezione Configurazione della connessione in questa pagina per includere le coppie chiave-valore da inserire nel segreto.

  • Includi le autorizzazioni necessarie per la connessione all’origine dati nella policy di ruolo/autorizzazioni di AWS Identity and Access Management (IAM) per la knowledge base corrente. Per informazioni sulle autorizzazioni necessarie per aggiungere l’origine dati al ruolo IAM della knowledge base, consulta Autorizzazioni per accedere alle origini dati.

Nota

Se utilizzi la console, è possibile passare ad Gestione dei segreti AWS per aggiungere il segreto oppure utilizzare un segreto esistente nell’ambito della fase di configurazione dell’origine dati. Il ruolo IAM e tutte le autorizzazioni richieste possono essere creati automaticamente durante le fasi di creazione di una knowledge base nella console. Dopo la configurazione dell’origine dati e delle altre impostazioni, il ruolo IAM e tutte le autorizzazioni vengono applicati alla knowledge base specifica.

Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. e fornire solo il livello di accesso necessario per motivi di sicurezza. Il riutilizzo di credenziali e segreti tra origini dati diverse non è consigliato.

Configurazione della connessione

Per connetterti all’istanza di SharePoint corrente, devi fornire le informazioni di configurazione richieste per consentire ad Amazon Bedrock di accedere ai dati e di sottoporli a crawling, nonché rispettare le indicazioni presenti nella sezione Prerequisiti.

Un esempio di configurazione per l’origine dati è incluso in questa sezione.

Per ulteriori informazioni sul rilevamento automatico dei campi del documento, sui filtri di inclusione/esclusione, sulla sincronizzazione incrementale, sulle credenziali di autenticazione dei segreti e sul relativo funzionamento, consulta le sezioni seguenti:

Il connettore delle origini dati rileva automaticamente tutti i campi di metadati principali dei documenti o dei contenuti e li sottopone a crawling. Ad esempio, il connettore delle origini dati può sottoporre a crawling l’equivalente del corpo del documento, il titolo del documento, la data di creazione o di modifica del documento o altri campi principali che potrebbero essere applicati ai documenti.

Importante

Se i contenuti includono informazioni sensibili, Amazon Bedrock potrebbe rispondere utilizzando informazioni di questo tipo.

Per migliorare ulteriormente la pertinenza delle risposte, è possibile applicare operatori di filtro ai campi di metadati, ad esempio “epoch_modification_time” del documento oppure il numero di secondi trascorsi dal 1° gennaio 1970, data dell’ultimo aggiornamento del documento. È possibile filtrare in base ai dati più recenti, in cui “epoch_modification_time” è maggiore di un determinato numero. Per ulteriori informazioni sugli operatori di filtro che è possibile applicare ai campi di metadati, consulta Metadati e filtri.

È possibile includere o escludere il crawling di determinati contenuti, specificando ad esempio un prefisso di esclusione o un modello di espressione regolare per ignorare il crawling dei file che contengono il termine “privato” nel nome. È anche possibile specificare un prefisso di inclusione oppure un modello di espressione regolare per includere determinate entità o tipi di contenuto. Se si specifica un filtro di inclusione ed esclusione ed entrambi corrispondono a un documento, il filtro di esclusione ha la precedenza e il documento non viene sottoposto a crawling.

Un esempio di modello di espressione regolare per escludere o filtrare i file PDF che contengono “privato” nel nome è il seguente: “.*privato.*\\.pdf”.

I filtri di inclusione/esclusione possono essere applicati ai seguenti tipi di contenuto:

  • Page: titolo principale della pagina

  • Event: nome dell’evento

  • File: nome del file con la relativa estensione per gli allegati e tutti i file del documento

Il crawling dei documenti di OneNote non è attualmente supportato.

Il connettore delle origini dati sottopone a crawling il contenuto nuovo, modificato ed eliminato ogni volta che l’origine dati si sincronizza con la knowledge base. Amazon Bedrock può utilizzare il meccanismo dell’origine dati per tenere traccia delle modifiche al contenuto e sottoporre a crawling il contenuto modificato dall’ultima sincronizzazione. Quando sincronizzi per la prima volta l’origine dati con la knowledge base, per impostazione predefinita tutti i contenuti vengono sottoposti a crawling.

Per sincronizzare l’origine dati con la knowledge base, utilizza l’API StartIngestionJob o seleziona la knowledge base nella console, quindi scegli Sincronizza nella sezione di panoramica dell’origine dati.

Importante

Tutti i dati sincronizzati dall’origine dati diventano disponibili per chiunque disponga delle autorizzazioni bedrock:Retrieve per recuperarli. Ciò può includere anche tutti i dati con autorizzazioni per l’origine dati controllate. Per ulteriori informazioni, consulta Autorizzazioni della knowledge base.

Quando si utilizza l’autenticazione SharePoint App-Only, le credenziali di autenticazione dei segreti in Gestione dei segreti AWS devono includere le seguenti coppie chiave-valore:

  • clientId: ID del client associato all’applicazione Microsoft Entra SharePoint

  • clientSecret: segreto del client associato all’applicazione Microsoft Entra SharePoint

  • sharePointClientId: ID del client generato durante la registrazione dell’app SharePoint per l’autenticazione App-Only

  • sharePointClientSecret: segreto del client generato durante la registrazione dell’app SharePoint per l’autenticazione App-Only

Nota

Il segreto in Gestione dei segreti AWS deve utilizzare la stessa Regione della knowledge base.

Console
Connettere un’istanza SharePoint alla knowledge base
  1. Segui la procedura in Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock e scegli SharePoint come origine dati.

  2. Specifica un nome e una descrizione facoltativa per l’origine dati.

  3. Fornisci gli URL del tuo sito di SharePoint. Ad esempio, per SharePoint Online, https://yourdomain.sharepoint.com/sites/mysite. L’URL deve iniziare con https e contenere sharepoint.com. L’URL del sito deve essere il sito effettivo di SharePoint, non sharepoint.com/ o sites/mysite/home.aspx

  4. Fornisci il nome di dominio della tua istanza di SharePoint.

  5. Nella sezione Impostazioni avanzate, puoi configurare gli elementi seguenti (facoltativo):

    • Chiave KMS per l’archiviazione di dati transitori. Puoi crittografare i dati transitori durante la conversione in embedding con la chiave Chiave gestita da AWS predefinita o con la chiave KMS in uso. Per ulteriori informazioni, consulta Crittografia dell'archiviazione di dati transitoria durante l'importazione dei dati.

    • Policy di eliminazione dei dati: è possibile eliminare gli embedding vettoriali per l’origine dati corrente presenti nell’archivio vettoriale per impostazione predefinita oppure scegliere di mantenere i dati dell’archivio vettoriale.

  6. Fornisci le informazioni di autenticazione per connetterti alla tua istanza di SharePoint. Per l’autenticazione SharePoint App-Only:

    1. Fornisci l’ID del tenant. Puoi trovare l’ID del tenant nelle proprietà del portale di Azure Active Directory.

    2. Passa ad Gestione dei segreti AWS per aggiungere le tue credenziali di autenticazione dei segreti o utilizza un nome della risorsa Amazon (ARN) esistente per il segreto che hai creato. Il tuo segreto deve contenere l’ID e il segreto del client di SharePoint generati quando hai registrato App-Only a livello di tenant o a livello di sito, nonché l’ID e il segreto del client Entra generati quando registri l’app in Entra.

  7. (Facoltativo) Nella sezione relativa a chunking e analisi dei contenuti, puoi personalizzare il modo in cui analizzare i dati ed eseguirne il chunking. Per ulteriori informazioni su queste personalizzazioni, consulta le risorse seguenti:

  8. Scegli di utilizzare filtri o modelli di espressione regolare per includere o escludere determinati contenuti. Altrimenti, tutto il contenuto standard viene sottoposto a crawling.

  9. Continua a scegliere un modello di embedding e un archivio vettoriale. Per visualizzare le fasi rimanenti, torna a Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock e continua dalla fase successiva alla connessione all’origine dati.

API

Di seguito è riportato un esempio di configurazione per la connessione a SharePoint Online per Knowledge Base per Amazon Bedrock. Per configurare l’origine dati, utilizza l’API con la AWS CLI o con il componente SDK supportato, ad esempio Python. Dopo aver chiamato CreateKnowledgeBase, chiama CreateDataSource per creare l’origine dati con le informazioni di connessione in dataSourceConfiguration.

Per informazioni sulle personalizzazioni che è possibile applicare all’importazione includendo il campo vectorIngestionConfiguration opzionale, consulta Personalizzare l’importazione per un’origine dati.

AWS Command Line Interface

aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"

Contenuto di sharepoint-bedrock-connector-configuration.json

{ "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_SHAREPOINT_APP_ONLY_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }
Importante

L’autenticazione OAuth2.0 non è consigliata. È consigliabile utilizzare l’autenticazione SharePoint App-Only.

Utilizzando OAuth 2.0, è possibile autenticare e autorizzare l’accesso alle risorse di SharePoint per i connettori SharePoint integrati con le knowledge base.

Prerequisiti

In SharePoint, per l’autenticazione OAuth 2.0, verifica quanto segue:

  • Prendi nota degli URL del sito SharePoint Online. Ad esempio, https://yourdomain.sharepoint.com/sites/mysite. L’URL deve iniziare con https e contenere sharepoint.com. L’URL del sito deve essere il sito effettivo di SharePoint, non sharepoint.com/ o sites/mysite/home.aspx

  • Prendi nota del nome di dominio degli URL dell’istanza di SharePoint Online.

  • Copia l’ID del tenant Microsoft 365. È possibile trovare l’ID del tenant nelle proprietà del portale di Microsoft Entra o nell’applicazione OAuth.

    Prendi nota del nome utente e della password dell’account amministratore di SharePoint e copia l’ID e il segreto del client durante la registrazione di un’applicazione.

    Nota

    Per un’applicazione di esempio, vedi Registrare un’applicazione client in Microsoft Entra ID (precedentemente noto come Azure Active Directory) nel sito web Microsoft Learn.

  • Alcune autorizzazioni di lettura sono necessarie per connettersi a SharePoint quando si registra un’applicazione.

    • SharePoint: AllSites.Read (Delegato): lettura degli elementi in tutte le raccolte di siti

  • Potrebbe essere necessario disattivare le impostazioni di sicurezza predefinite nel portale di Azure utilizzando un utente amministratore. Per altre informazioni sulla gestione delle impostazioni di sicurezza predefinite nel portale di Azure, consulta la documentazione Microsoft su come abilitare/disabilitare le impostazioni di sicurezza predefinite.

  • Potresti dover disattivare l’autenticazione a più fattori (MFA) nell’account SharePoint, in modo che ad Amazon Bedrock non sia impedito il crawling dei contenuti SharePoint.

Per completare i prerequisiti, verifica di aver completato la procedura in Account AWS.

Credenziali di autenticazione dei segreti

Per la configurazione della connessione per OAuth2.0, è possibile eseguire la stessa procedura per il rilevamento automatico dei campi dei documenti principale, dei filtri di inclusione/esclusione e della sincronizzazione incrementale come descritto in Configurazione della connessione.

Per l’autenticazione OAuth 2.0, le credenziali di autenticazione dei segreti in Gestione dei segreti AWS devono includere queste coppie chiave-valore.

  • username: nome utente dell’amministratore di SharePoint

  • password: password dell’amministratore di SharePoint

  • clientId: ID del client dell’app OAuth

  • clientSecret: segreto del client dell’app OAuth

Connettere un’istanza SharePoint alla knowledge base

Per connettere un’istanza SharePoint alla knowledge base in caso di utilizzo di OAuth2.0:

  • (console) Nella console, segui la stessa procedura descritta in Connettere un’istanza SharePoint a una knowledge base. Quando vuoi fornire le informazioni di autenticazione per connetterti alla tua istanza di SharePoint:

    • Fornisci l’ID del tenant. Puoi trovare l’ID del tenant nelle proprietà del portale di Azure Active Directory.

    • Passa ad Gestione dei segreti AWS per aggiungere le tue credenziali di autenticazione dei segreti o utilizza un nome della risorsa Amazon (ARN) esistente per il segreto che hai creato. Il tuo segreto deve contenere il nome utente e la password dell’amministratore di SharePoint, l’ID del client dell’app registrata e il segreto del client. Per un’applicazione di esempio, vedi Registrare un’applicazione client in Microsoft Entra ID (precedentemente noto come Azure Active Directory) nel sito web Microsoft Learn.

  • (API) Di seguito è riportato un esempio di utilizzo dell’API CreateDataSource per creare un’origine dati con le informazioni di connessione per OAuth2.0.

    aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"

    Contenuto di sharepoint-bedrock-connector-configuration.json

    { "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }