Funzionalità supportate Prerequisiti Configurazione della connessione

Connettersi a Confluence per utilizzare la knowledge base

Atlassian Confluence è uno strumento collaborativo di gestione del lavoro progettato per condividere, archiviare e lavorare sulla pianificazione dei progetti, sullo sviluppo del software e sulla gestione dei prodotti. Puoi connetterti alla tua istanza Confluence per la tua knowledge base di Amazon Bedrock utilizzando la console di AWS gestione per Amazon Bedrock o l'API CreateDataSource(vedi SDK supportati da Amazon Bedrock e). AWS CLI

Nota

Il connettore dell’origine dati in Confluence è disponibile nella versione di anteprima ed è soggetto a modifiche.

Le origini dati Confluence non supportano dati multimodali, come tabelle, grafici, diagrammi o altre immagini.

Amazon Bedrock supporta la connessione a istanze di Confluence Cloud. Attualmente, solo Amazon OpenSearch Serverless Vector Store è disponibile per l'uso con questa fonte di dati.

Il numero di file e le dimensioni in MB per file che è possibile sottoporre a crawling sono limitati. Consulta Quote per le knowledge base.

Funzionalità supportate

Rilevamento automatico dei campi principali dei documenti
Inclusion/exclusion filtri di contenuto
Sincronizzazione incrementale dei contenuti per aggiunte, aggiornamenti ed eliminazioni
Autenticazione OAuth 2.0 e autenticazione con token API Confluence

Prerequisiti

In Confluence, assicurati di:

Prendere nota dell’URL dell’istanza di Confluence, Ad esempio, per Confluence Cloud,. https://example.atlassian.net L'URL di Confluence Cloud deve essere l'URL di base, che termina con. .atlassian.net
Configurare le credenziali di autenticazione di base contenenti un nome utente (indirizzo e-mail dell’account amministratore) e una password (token API Confluence) per consentire ad Amazon Bedrock di connettersi all’istanza di Confluence Cloud corrente. Per informazioni sulla creazione di un token API Confluence, consulta Manage API tokens for your Atlassian account sul sito web di Atlassian.
(Facoltativo) Configurare un’applicazione OAuth 2.0 con le credenziali di una chiave e di un segreto dell’app, di un token di accesso e di uno di aggiornamento. Per ulteriori informazioni, consulta OAuth 2.0 apps sul sito web di Atlassian.
Abilitare determinati ambiti o autorizzazioni di lettura per consentire all’app OAuth 2.0 di connettersi a Confluence.

API Confluence:
- offline_access
- read:content:confluence: consente di visualizzare i contenuti dettagliati
- read:content-details:confluence: consente di visualizzare i dettagli del contenuto
- read:space-details:confluence: consente di visualizzare i dettagli dello spazio
- read:audit-log:confluence: consente di visualizzare i record di audit
- read:page:confluence: consente di visualizzare le pagine
- read:attachment:confluence: consente di visualizzare e di scaricare gli allegati al contenuto
- read:blogpost:confluence: consente di visualizzare i post di blog
- read:custom-content:confluence: consente di visualizzare contenuto personalizzato
- read:comment:confluence: consente di visualizzare i commenti
- read:template:confluence: consente di visualizzare i modelli di contenuto
- read:label:confluence: consente di visualizzare le etichette
- read:watcher:confluence: consente di visualizzare gli osservatori del contenuto
- read:relation:confluence: consente di visualizzare le relazioni tra entità
- read:user:confluence: consente di visualizzare i dettagli dell’utente
- read:configuration:confluence: consente di visualizzare le impostazioni di Confluence
- read:space:confluence: consente di visualizzare i dettagli dello spazio
- read:space.property:confluence: consente di visualizzare le proprietà dello spazio
- read:user.property:confluence: consente di visualizzare le proprietà dell’utente
- read:space.setting:confluence: consente di visualizzare le impostazioni dello spazio
- read:analytics.content:confluence: consente di visualizzare l’analisi del contenuto
- read:content.property:confluence: consente di visualizzare le proprietà del contenuto
- read:content.metadata:confluence: consente di visualizzare i riepiloghi del contenuto
- read:inlinetask:confluence: consente di visualizzare le attività
- read:task:confluence: consente di visualizzare le attività
- read:whiteboard:confluence: consente di visualizzare le lavagne
- read:app-data:confluence: consente di leggere i dati dell’app
- read:folder:confluence: consente di visualizzare le cartelle
- read:embed:confluence: consente di visualizzare i dati Smartlink

Nel tuo AWS account, assicurati di:

Archivia le credenziali di autenticazione in un segreto di Gestione dei segreti AWS e prendi nota del nome della risorsa Amazon (ARN) del segreto stesso. Segui le istruzioni nella sezione Configurazione della connessione in questa pagina per includere le coppie chiave-valore da inserire nel segreto.
Includi le autorizzazioni necessarie per connetterti alla tua fonte di dati nella role/permissions policy AWS Identity and Access Management (IAM) per la tua knowledge base. Per informazioni sulle autorizzazioni richieste per questa fonte di dati da aggiungere al IAM ruolo della knowledge base, consulta Autorizzazioni per l'accesso alle fonti di dati.

Nota

Se utilizzi la console, puoi andare Gestione dei segreti AWS a aggiungere il tuo segreto o utilizzare un segreto esistente come parte della fase di configurazione dell'origine dati. Il IAM ruolo con tutte le autorizzazioni richieste può essere creato automaticamente come parte dei passaggi della console per la creazione di una knowledge base. Dopo aver configurato l'origine dati e altre configurazioni, il IAM ruolo con tutte le autorizzazioni richieste viene applicato alla knowledge base specifica.

Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. e fornire solo il livello di accesso necessario per motivi di sicurezza. Il riutilizzo di credenziali e segreti tra origini dati diverse non è consigliato.

Configurazione della connessione

Per connettersi all’istanza di Confluence corrente, è necessario fornire le informazioni di configurazione richieste per consentire ad Amazon Bedrock di accedere ai dati e di sottoporli a crawling, nonché rispettare le indicazioni presenti nella sezione Prerequisiti.

Un esempio di configurazione per l’origine dati è incluso in questa sezione.

Per ulteriori informazioni sul rilevamento automatico dei campi del documento, sui inclusion/exclusion filtri, sulla sincronizzazione incrementale, sulle credenziali di autenticazione segrete e sul loro funzionamento, seleziona quanto segue:

Il connettore delle origini dati rileva automaticamente tutti i campi di metadati principali dei documenti o dei contenuti e li sottopone a crawling. Ad esempio, il connettore delle origini dati può sottoporre a crawling l’equivalente del corpo del documento, il titolo del documento, la data di creazione o di modifica del documento o altri campi principali che potrebbero essere applicati ai documenti.

Importante

Se i tuoi contenuti includono informazioni sensibili, allora Amazon Bedrock potresti rispondere utilizzando informazioni sensibili.

Per migliorare ulteriormente la pertinenza delle risposte, è possibile applicare operatori di filtro ai campi di metadati, ad esempio “epoch_modification_time” del documento oppure il numero di secondi trascorsi dal 1° gennaio 1970, data dell’ultimo aggiornamento del documento. È possibile filtrare in base ai dati più recenti, in cui “epoch_modification_time” è maggiore di un determinato numero. Per ulteriori informazioni sugli operatori di filtro che è possibile applicare ai campi di metadati, consulta Metadati e filtri.

È possibile includere o escludere il crawling di determinati contenuti, Ad esempio, è possibile specificare un modello di prefix/regular espressione di esclusione per ignorare la scansione di qualsiasi file che contenga «privato» nel nome del file. È inoltre possibile specificare un modello di prefix/regular espressione di inclusione per includere determinate entità di contenuto o tipi di contenuto. Se si specifica un filtro di inclusione ed esclusione ed entrambi corrispondono a un documento, il filtro di esclusione ha la precedenza e il documento non viene sottoposto a crawling.

Un esempio di modello di espressione regolare per escludere o filtrare i file PDF che contengono “privato” nel nome è il seguente: “.*privato.*\\.pdf”.

È possibile applicare inclusion/exclusion filtri ai seguenti tipi di contenuto:

Space: chiave dello spazio univoca
Page: titolo principale della pagina
Blog: titolo principale del blog
Comment: commenti che appartengono a una pagina oppure a un blog specifico. Specifica Re: Page/Blog Title
Attachment: nome del file allegato con relativa estensione

Il connettore di origine dati esegue la ricerca per indicizzazione dei contenuti nuovi, modificati ed eliminati ogni volta che l'origine dati si sincronizza con la Knowledge Base. Amazon Bedrock può utilizzare il meccanismo dell'origine dati per tenere traccia delle modifiche ai contenuti ed eseguire la scansione dei contenuti modificati dall'ultima sincronizzazione. Quando sincronizzi per la prima volta l’origine dati con la knowledge base, per impostazione predefinita tutti i contenuti vengono sottoposti a crawling.

Per sincronizzare la fonte di dati con la knowledge base, utilizza l'StartIngestionJobAPI o seleziona la knowledge base nella console e seleziona Sincronizza nella sezione panoramica delle origini dati.

Importante

Tutti i dati sincronizzati dall’origine dati diventano disponibili per chiunque disponga delle autorizzazioni bedrock:Retrieve per recuperarli. Ciò può includere anche tutti i dati con autorizzazioni per l’origine dati controllate. Per ulteriori informazioni, consulta Autorizzazioni della knowledge base.

(Se si utilizza l’autenticazione di base) Le credenziali di autenticazione segrete in Gestione dei segreti AWS devono includere queste coppie chiave-valore:

username: admin user email address of Atlassian account
password: Confluence API token

(Se si utilizza l’autenticazione OAuth 2.0) Le credenziali di autenticazione segrete in Gestione dei segreti AWS devono includere queste coppie chiave-valore:

confluenceAppKey: app key
confluenceAppSecret: app secret
confluenceAccessToken: app access token
confluenceRefreshToken: app refresh token

Nota

Il token di OAuth2.0 accesso Confluence ha una scadenza predefinita di 60 minuti. Se il token di accesso scade durante la sincronizzazione dell’origine dati (processo di sincronizzazione), Amazon Bedrock utilizza il token di aggiornamento fornito per rigenerarlo. In questo caso vengono rigenerati sia i token di accesso sia quelli di aggiornamento. Per mantenere i token aggiornati dal processo di sincronizzazione corrente al processo di sincronizzazione successivo, Amazon Bedrock richiede write/put le autorizzazioni per le tue credenziali segrete come parte del tuo ruolo IAM della knowledge base.

Nota

Il tuo account segreto Gestione dei segreti AWS deve utilizzare la stessa regione della tua knowledge base.

Console

Connettere un’istanza di Confluence alla knowledge base

Segui i passaggi indicati in Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock e scegli Confluence come origine dati.
Specifica un nome e una descrizione facoltativa per l’origine dati.
Indica l’URL dell’istanza di Confluence corrente, Ad esempio, per Confluence Cloud,. https://example.atlassian.net L'URL di Confluence Cloud deve essere l'URL di base, che termina con. .atlassian.net
Nella sezione Impostazioni avanzate, puoi configurare gli elementi seguenti (facoltativo):
- Chiave KMS per l’archiviazione di dati transitori. — Puoi crittografare i dati transitori mentre li converti in incorporamenti con la chiave KMS predefinita o con la tua chiave KMS. Chiave gestita da AWS Per ulteriori informazioni, consulta Crittografia dell'archiviazione di dati transitoria durante l'importazione dei dati.
- Policy di eliminazione dei dati: è possibile eliminare gli embedding vettoriali per l’origine dati corrente presenti nell’archivio vettoriale per impostazione predefinita oppure scegliere di mantenere i dati dell’archivio vettoriale.
Fornisci le informazioni di autenticazione per connetterti all’istanza di Confluence corrente:
- Per l'autenticazione di base, vai Gestione dei segreti AWS a aggiungere le tue credenziali di autenticazione segrete o usa un Amazon Resource Name (ARN) esistente per il segreto che hai creato. Il segreto deve contenere l’indirizzo e-mail dell’utente amministratore dell’account Atlassian come nome utente e un token API Confluence come password. Per informazioni sulla creazione di un token API Confluence, consulta Manage API tokens for your Atlassian account sul sito web di Atlassian.
- Per l'autenticazione OAuth 2.0, vai Gestione dei segreti AWS a aggiungere le tue credenziali di autenticazione segrete o usa un Amazon Resource Name (ARN) esistente per il segreto che hai creato. Il segreto deve contenere la chiave dell’app Confluence, il segreto dell’app, il token di accesso e quello di aggiornamento. Per ulteriori informazioni, consulta OAuth 2.0 apps sul sito web di Atlassian.
(Facoltativo) Nella sezione Chunking e analisi dei contenuti, puoi personalizzare il modo in cui analizzare i dati ed eseguirne il chunking. Per ulteriori informazioni su queste personalizzazioni, consulta le risorse seguenti:
- Per ulteriori informazioni sulle opzioni di analisi, consulta Opzioni di analisi per l’origine dati.
- Per ulteriori informazioni sulle strategie di chunking, consulta Come funziona il chunking dei contenuti per le knowledge base.
  
  avvertimento
  Dopo la connessione all’origine dati, non è possibile modificare la strategia di chunking.
- Per ulteriori informazioni sulla personalizzazione del chunking dei dati e sull’elaborazione dei metadati con una funzione Lambda, consulta Utilizzo di una funzione Lambda di trasformazione personalizzata per definire come vengono importati i dati.
Scegli di utilizzare modelli di filters/regular espressioni per includere o escludere determinati contenuti. Altrimenti, tutto il contenuto standard viene sottoposto a crawling.
Continua a scegliere un modello di embedding e un archivio vettoriale. Per visualizzare le fasi rimanenti, torna a Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock e continua dalla fase successiva alla connessione all’origine dati.

API

Di seguito è riportato un esempio di configurazione per la connessione a Confluence Cloud per Knowledge Base per Amazon Bedrock. Puoi configurare la tua origine dati utilizzando l'API con l'SDK AWS CLI o supportato, come Python. Dopo la chiamata CreateKnowledgeBase, chiami CreateDataSourceper creare la fonte di dati contenente le informazioni di connessione. dataSourceConfiguration

Per informazioni sulle personalizzazioni che è possibile applicare all’importazione includendo il campo vectorIngestionConfiguration opzionale, consulta Personalizzare l’importazione per un’origine dati.

AWS Command Line Interface


aws bedrock create-data-source \
 --name "Confluence Cloud/SaaS connector" \
 --description "Confluence Cloud/SaaS data source connector for Amazon Bedrock to use content in Confluence" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://confluence-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}'

confluence-bedrock-connector-configuration.json
{
    "confluenceConfiguration": {
        "sourceConfiguration": {
            "hostUrl": "https://example.atlassian.net",
            "hostType": "SAAS",
            "authType": "OAUTH2_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Confluence"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "Attachment",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "CONFLUENCE"
}

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Simple Storage Service (Amazon S3)

Microsoft SharePoint

Connettersi a Confluence per utilizzare la knowledge base

Nota

Argomenti

Funzionalità supportate

Prerequisiti

Nota

Configurazione della connessione

Importante

Importante

Nota

Nota

Connettere un’istanza di Confluence alla knowledge base

avvertimento