Choisissez et mettez à jour le modèle de construction du graphe Synchronisation de votre source de données Ingestion des modifications dans votre base de connaissances Test de votre base de connaissances

Création d’une base de connaissances Amazon Bedrock avec des graphiques d’analytique Amazon Neptune

GraphRAG est entièrement intégré à Amazon Bedrock Knowledge Bases et utilise l’analytique Amazon Neptune pour le stockage de graphiques et de vecteurs. Vous pouvez commencer à utiliser GraphRag dans vos bases de connaissances avec le AWS Management Console AWS CLI, le ou le AWS SDK.

Vous n’avez besoin d’aucune infrastructure graphique existante pour commencer à utiliser GraphRAG. Amazon Bedrock Knowledge Bases gère automatiquement la création et la maintenance des graphiques d’Amazon Neptune. Le système crée et met à jour automatiquement un graphique en extrayant les entités, les faits et les relations des documents que vous chargez dans votre compartiment Amazon S3. Vous pouvez ainsi fournir des réponses pertinentes à vos utilisateurs finaux, sans aucune connaissance préalable en modélisation de graphiques. Le graphique est stocké dans l’analytique Amazon Neptune.

Lorsque vous créez une base de connaissances, vous configurez ou spécifiez les éléments suivants :

Informations générales qui définissent et identifient la base de connaissances
Rôle de service avec autorisations d’accès à la base de connaissances
Configurations pour la base de connaissances, y compris le modèle de vectorisation à utiliser lors de la conversion des données à partir de la source de données et les configurations de stockage pour le service dans lequel les vectorisations doivent être stockées

Note

Vous ne pouvez créer aucune base de connaissances avec un utilisateur racine. Connectez-vous avec un utilisateur IAM avant de commencer ces étapes.

L’exemple suivant montre comment créer une base de connaissances pour l’utilisation de Neptune GraphRAG à partir de la console et à l’aide de la CLI.

Console

Pour créer une base de connaissances pour l’analytique Neptune à partir de la console

Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à https://console.aws.amazon.com/bedrockl'adresse.
Dans le volet de navigation de gauche, sélectionnez Bases de connaissances.
Dans la section Bases de connaissances, choisissez Créer, puis sélectionnez Base de connaissances avec magasin de vecteurs.
(Facultatif) Sous Détails de la base de connaissances, modifiez le nom par défaut et fournissez une description de votre base de connaissances.
Sous Autorisations IAM, choisissez un rôle IAM qui fournit à Amazon Bedrock les autorisations nécessaires pour accéder à d’autres Services AWS requis. Vous pouvez soit laisser Amazon Bedrock créer le rôle de service pour vous, soit choisir d’utiliser votre rôle personnalisé que vous avez créé pour l’analytique Neptune. Pour obtenir un exemple, consultez Autorisations permettant d’accéder à votre base de données vectorielles dans l’analytique Amazon Neptune.
Veillez à choisir Amazon S3 comme source de données et cliquer sur Suivant pour configurer votre source de données.
Indiquez l’URI S3 du fichier utilisé comme source de données pour connecter votre base de connaissances à l’analytique Amazon Neptune et l’y intégrer. Pour connaître les étapes supplémentaires et les informations facultatives que vous pouvez fournir, consultez Connexion d’une source de données à votre base de connaissances.
Dans la section Modèle de vectorisation, choisissez un modèle de vectorisation pour convertir vos données en vectorisations. Vous pouvez éventuellement spécifier les dimensions vectorielles à l’aide de la section Configurations supplémentaires. Pour le type de vectorisations, nous vous recommandons d’utiliser des vectorisations à virgule flottante.

Note
Les dimensions vectorielles du modèle de vectorisation doivent correspondre à celles que vous avez spécifiées lors de la création du graphe d’analytique Neptune.
Dans la section Base de données vectorielles, choisissez la méthode de création du magasin de vecteurs, puis Analytique Amazon Neptune (GraphRAG) comme magasin de vecteurs pour stocker les vectorisations utilisées pour la requête. Vous pouvez créer votre magasin de vecteurs à l’aide de l’une des méthodes suivantes :
- Nous vous recommandons d’utiliser la méthode Création rapide d’un magasin de vecteurs pour commencer rapidement à créer votre magasin de vecteurs. Choisissez Analytique Amazon Neptune (GraphRAG) comme magasin de vecteurs. Cette option ne nécessite pas que vous disposiez de ressources d’analytique Neptune existantes. La base de connaissances génère et stocke automatiquement les vectorisations de documents dans Amazon Neptune, ainsi qu’une représentation graphique des entités et de leurs relations dérivée du corpus de documents.
- Sinon, si vous avez déjà créé votre graphique et votre index vectoriel d’analytique Neptune, vous pouvez utiliser l’option Choisir un magasin de vecteurs que vous avez créé. Choisissez Analytique Amazon Neptune (GraphRAG) comme magasin de vecteurs et identifiez l’ARN du graphique, les noms des champs vectoriels et les noms des champs de métadonnées dans l’index vectoriel. Pour de plus amples informations, veuillez consulter Conditions préalables à l’utilisation d’un magasin de vecteurs que vous avez créé pour une base de connaissances.
Dans la section Modèle pour la construction de graphes, choisissez le modèle de base à utiliser pour extraire les entités et les relations de vos documents lors de l'ingestion. Les autorisations requises pour le modèle sélectionné sont automatiquement ajoutées au rôle de service de la base de connaissances.

Note
Certains modèles ne sont pris en charge que par le biais de profils d'inférence interrégionaux. Lorsque vous invoquez un profil d'inférence interrégional dans Amazon Bedrock, votre demande et les données à ingérer proviennent d'une région source et sont automatiquement acheminées vers l'une des régions de destination définies dans ce profil, optimisant ainsi les performances. Les régions de destination pour les profils d’inférence interrégionaux mondiaux incluent toutes les régions commerciales. Par exemple, vous pouvez spécifier le modelArn pour un appel interrégional basé aux États-Unis depuis la région us-west-2 en utilisant le format. arn:aws:bedrock:us-west-2:account-id:inference-profile/us.anthropic.claude-haiku-4-5-20251001-v1:0

Pour savoir comment utiliser les profils d'inférence pour sélectionner les régions source et de destination, voir Régions et modèles pris en charge pour les profils d'inférence. Vos données sont stockées uniquement dans votre région source correspondant à la base de connaissances Amazon Bedrock et à l'instance Amazon Neptune Analytics. La région de destination est utilisée à des fins d'inférence uniquement.
Cliquez sur Suivant et passez en revue les détails de votre base de connaissances. Vous pouvez modifier toute section avant de créer votre base de connaissances.

Note
Le temps nécessaire pour créer la base de connaissances dépend de vos configurations spécifiques. Une fois la base de connaissances créée, son statut change pour indiquer qu’elle est prête ou disponible.
Une fois votre base de connaissances prête et disponible, synchronisez votre source de données pour la première fois et chaque fois que vous souhaitez tenir votre contenu à jour. Sélectionnez votre base de connaissances dans la console, puis cliquez sur Synchroniser dans la section de présentation des sources de données.
Cliquez sur Créer une base de connaissances. Pendant qu’Amazon Bedrock crée la base de connaissances, vous devriez voir le statut En cours. Vous devez attendre la fin de la création avant de synchroniser une source de données.
Une fois qu’Amazon Bedrock a fini de créer la base de connaissances, pour configurer une source de données, suivez les instructions sous Connexion d’une source de données à votre base de connaissances.

API

Pour créer une base de connaissances pour Neptune Analytics à l'aide du AWS CLI

Créez d’abord une source de données à l’aide de la configuration d’enrichissement du contexte. Pour effectuer cette opération, envoyez une demande CreateDataSource avec un point de terminaison de compilation pour agents Amazon Bedrock. Voici un exemple de commande CLI.
```
aws bedrock-agent create-data-source \
    --name graph_rag_source \
    --description data_source_for_graph_rag \
    --knowledge-base-id LDBBY2K5AG \
    --cli-input-json "file://input.json"
```
Le code suivant affiche le contenu du fichier input.json.
```
{
    "dataSourceConfiguration": { 
        "s3Configuration": { 
            "bucketArn": "arn:aws:s3:::<example-graphrag-datasets>",
            "bucketOwnerAccountId": "<ABCDEFGHIJ>",
            "inclusionPrefixes": [ <"example-dataset"> ]
        },
        "type": "S3",
    },
    "VectorIngestionConfiguration": {
        "contextEnrichmentConfiguration":
            "type": "BEDROCK_FOUNDATION_MODEL",
            "bedrockFoundationModelConfiguration": {
                "modelArn": "arn:aws:bedrock:<region>::foundation-model/anthropic.claude-3-haiku-20240307-v1:0",
                "enrichmentStrategyConfiguration": {
                    "method": "CHUNK_ENTITY_EXTRACTION"
            }
        }
    }
}
```
Pour créer le modelArn graphique à partir de vos documents, vous pouvez utiliser Claude 3 Haiku (comme indiqué dans l'exemple précédent), Claude Haiku 4.5 et la famille Amazon Nova (y compris les modèles Nova 2 et Nova avec modalité de saisie de texte). Pour connaître les modèles de fondation disponibles dans votre région, consultez la section Modèles de fondation pris en charge dans Amazon Bedrock.

Note
Certains modèles ne sont pris en charge que par le biais de profils d'inférence interrégionaux. Lorsque vous invoquez un profil d'inférence interrégional dans Amazon Bedrock, votre demande et les données à ingérer proviennent d'une région source et sont automatiquement acheminées vers l'une des régions de destination définies dans ce profil, optimisant ainsi les performances. Les régions de destination pour les profils d’inférence interrégionaux mondiaux incluent toutes les régions commerciales. Par exemple, vous pouvez spécifier le modelArn pour un appel interrégional basé aux États-Unis depuis la région us-west-2 en utilisant le format. arn:aws:bedrock:us-west-2:account-id:inference-profile/us.anthropic.claude-haiku-4-5-20251001-v1:0

Pour connaître les règles relatives à l'utilisation des profils d'inférence par votre rôle, consultez la section Conditions requises pour les profils d'inférence interrégionaux. Pour savoir comment utiliser les profils d'inférence pour sélectionner les régions source et de destination, voir Régions et modèles pris en charge pour les profils d'inférence. Vos données sont stockées uniquement dans votre région source correspondant à la base de connaissances Amazon Bedrock et à l'instance Amazon Neptune Analytics. La région de destination est utilisée à des fins d'inférence uniquement.

Pour créer une base de connaissances, envoyez une demande CreateKnowledgeBase avec un point de terminaison de compilation pour agents Amazon Bedrock. Voici un exemple de commande CLI.


aws bi create-knowledge-base \
--name <"knowledge-base-graphrag"> \
--role-arn arn:aws:iam::<accountId>:role/<BedrockExecutionRoleForKnowledgeBase> \
--cli-input-json "file://input.json"

Voici le contenu du fichier input.json.


{
    "storageConfiguration": {
        "type": "NEPTUNE_ANALYTICS"
        "neptuneAnalyticsConfiguration": {
            "graphArn": "arn:aws:neptune-graph:<region>:<>:graph/<graphID>",
            "fieldMapping": {
                "metadataField": "metadata",
                "textField": "text"
            },
        }
    },
    "knowledgeBaseConfiguration": {
        "type": "VECTOR",
        "vectorKnowledgeBaseConfiguration": {
            "embeddingModelArn": "arn:aws:bedrock:<region>::foundation-model/cohere.embed-english-v3"
        }
    }
}

Lorsque votre GraphRAG-based application est en cours d'exécution, vous pouvez continuer à utiliser les opérations de l'API des bases de connaissances pour fournir aux utilisateurs finaux des réponses plus complètes, pertinentes et explicables. Les sections suivantes expliquent comment démarrer l’ingestion et effectuer des requêtes de récupération à l’aide de commandes CLI.

Choisissez et mettez à jour le modèle de construction du graphe

GraphRag utilise un modèle de base lors de l'ingestion pour extraire les entités et les relations de vos documents. Vous choisissez ce modèle lorsque vous créez une base de connaissances ou lorsque vous configurez une source de données. La sélection d'un modèle de construction de graphe permet automatiquement un enrichissement contextuel.

Important

Les modèles de base peuvent atteindre la fin de leur durée de vie ou être déconseillés. Par exemple, Claude 3 Haiku est passé au statut Legacy. Nous vous recommandons de sélectionner un modèle actuellement pris en charge pour la construction de graphes. Pour vérifier l'état des modèles disponibles, consultez la section Cycle de vie des modèles.

Lorsque vous sélectionnez un modèle de construction de graphe, les autorisations requises sont automatiquement ajoutées au rôle de service de base de connaissances.

Certains modèles ne sont disponibles que par le biais de profils d'inférence interrégionaux.

Note

Lors de l'utilisation de l'inférence entre régions, les données à ingérer proviennent d'une région source et sont acheminées vers une région de destination à des fins d'inférence. Les données sont stockées uniquement dans la région source correspondant à la base de connaissances Amazon Bedrock et à l'instance Amazon Neptune Analytics.

Choisissez un modèle lors de la création de la base de connaissances (console)

À l'étape 3 du flux de travail de création d'une base de connaissances (configuration du stockage et du traitement des données), lorsque vous sélectionnez Amazon Neptune Analytics (GraphRag) comme type de magasin vectoriel, une section Modèle pour la construction de graphes apparaît. Choisissez Sélectionner un modèle pour choisir le modèle à utiliser pour extraire les entités et les relations de vos documents lors de l'ingestion.

Mettre à jour le modèle sur une source de données existante (console)

Accédez à la page détaillée de la base de connaissances. Dans la section Source de données, sélectionnez la source de données et choisissez Modifier. Dans la page d'édition, sous Modèle pour la construction de graphes, choisissez un nouveau modèle. Choisissez Soumettre pour enregistrer vos modifications.

Choisissez un modèle lors de la création de la base de connaissances (API)

Lorsque vous créez une source de données via l'CreateDataSourceAPI, spécifiez la source modelArn bedrockFoundationModelConfiguration dans le champcontextEnrichmentConfiguration. Consultez l'onglet API dans la section de création ci-dessus pour un exemple complet.

Mettre à jour le modèle sur une source de données existante (API)

Pour mettre à jour le modèle de construction du graphe sur une source de données existante, utilisez la update-data-source commande. L'exemple suivant montre comment spécifier un nouvel ARN de modèle dans lecontextEnrichmentConfiguration.


aws bedrock-agent update-data-source \
    --data-source-id data-source-id \
    --knowledge-base-id knowledge-base-id \
    --name data-source-name \
    --data-source-configuration '{"type":"S3","s3Configuration":{"bucketArn":"arn:aws:s3:::bucket-name"}}' \
    --vector-ingestion-configuration '{"contextEnrichmentConfiguration":{"type":"BEDROCK_FOUNDATION_MODEL","bedrockFoundationModelConfiguration":{"modelArn":"model-arn","enrichmentStrategyConfiguration":{"method":"CHUNK_ENTITY_EXTRACTION"}}}}' \
    --region region

Par exemple, pour utiliser Claude Haiku 4.5 via un profil d'inférence US-based interrégional à partir de la us-west-2 région, spécifiez le modelArn dans le format suivant :


arn:aws:bedrock:us-west-2:account-id:inference-profile/us.anthropic.claude-haiku-4-5-20251001-v1:0

Pour connaître les règles relatives à l'utilisation des profils d'inférence par votre rôle, consultez la section Conditions requises pour les profils d'inférence interrégionaux. Pour savoir comment utiliser les profils d'inférence pour sélectionner les régions source et de destination, voir Régions et modèles pris en charge pour les profils d'inférence.

Synchronisation de votre source de données

Après avoir créé votre base de connaissances, vous devez ingérer ou synchroniser vos données afin qu’elles puissent être interrogées. L’ingestion extrait la structure graphique et convertit les données brutes de votre source de données en vectorisations, sur la base du modèle de vectorisation et des configurations que vous avez spécifiés.

La commande suivante montre un exemple de la façon de démarrer une tâche d’ingestion à l’aide de la CLI.


aws bedrock-agent start-ingestion-job \
--data-source-id <"ABCDEFGHIJ"> \
--knowledge-base-id <"EFGHIJKLMN">

Pour plus d’informations et pour découvrir comment synchroniser votre source de données à l’aide de la console et de l’API, consultez Synchronisation de vos données avec votre base de connaissances Amazon Bedrock.

Ingestion des modifications dans votre base de connaissances

Lorsque vous utilisez Amazon S3 comme source de données, vous pouvez modifier votre source de données et synchroniser les modifications en une seule étape. Grâce à l’ingestion directe, vous pouvez directement ajouter, mettre à jour ou supprimer des fichiers dans une base de connaissances en une seule action et votre base de connaissances peut accéder aux documents sans avoir besoin de les synchroniser. L’ingestion directe utilise les opérations d’API KnowledgeBaseDocuments pour indexer les documents que vous soumettez directement dans le magasin de vecteurs configuré pour la base de connaissances. Vous pouvez également consulter les documents de votre base de connaissances directement à l’aide de ces opérations, sans avoir à accéder à la source de données connectée. Pour de plus amples informations, veuillez consulter Ingestion des modifications directement dans une base de connaissances.

Test de votre base de connaissances

Après avoir configuré votre base de connaissances, vous pouvez la tester en envoyant des requêtes et en générant des réponses.

Le code suivant présente un exemple de commande CLI.


aws bedrock-agent-runtime retrieve \
--knowledge-base-id <"ABCDEFGHIJ"> \
--retrieval-query="{\"text\": \"What are the top three video games available now?\"}"

Pour de plus amples informations, veuillez consulter Interrogation d’une base de connaissances connectée à un graphe d’analytique Amazon Neptune.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Création d’une base de connaissances avec des graphiques d’analytique Amazon Neptune

Test de votre base de connaissances avec des requêtes et des réponses