View a markdown version of this page

Déploiement de la solution - Générateur d'applications d'IA générative sur AWS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déploiement de la solution

Cette solution utilise des CloudFormation modèles et des piles AWS pour automatiser son déploiement. Le CloudFormation modèle indique les ressources AWS incluses dans cette solution et leurs propriétés. La CloudFormation pile fournit les ressources décrites dans le modèle.

Vue d'ensemble du processus de déploiement

Avant de lancer la solution, examinez le coût, l'architecture, la sécurité et les autres considérations abordées dans ce guide.

Important

Si vous prévoyez d'utiliser Amazon Bedrock, vous devez demander l'accès aux modèles avant qu'ils ne soient disponibles. Reportez-vous à la section Accès aux modèles dans le guide de l'utilisateur d'Amazon Bedrock pour plus de détails.

Temps de déploiement : environ 10 minutes

Étape 1 : Lancer la pile de tableaux de bord de déploiement

Étape 2 : Déployer un cas d'utilisation

Étape 3 : Déployer un cas d'utilisation à l'aide de l'assistant du tableau de bord de déploiement

Étape 4 : Configuration après le déploiement

Vous pouvez éventuellement déployer les cas d'utilisation séparément de la solution, si vous préférez ne pas avoir l'interface utilisateur du tableau de bord de déploiement ou APIs.

Vous pouvez également fournir une configuration de chat DynamoDB.

Important

Cette solution envoie des métriques opérationnelles à AWS (les « données ») concernant l'utilisation de cette solution. Nous utilisons ces données pour mieux comprendre comment les clients utilisent cette solution et les services et produits associés. La collecte de ces données par AWS est soumise à la politique de confidentialité d'AWS.

Fourniture d'une configuration de chat DynamoDB

Lors du déploiement d'un cas d'utilisation, UseCaseConfigRecordKeyUseCaseConfigTableNameles CloudFormation paramètres requis sont normalement renseignés par le tableau de bord de déploiement. La pile des tableaux de bord de déploiement gère la création et la configuration de cette table, tandis que les appels à l'API de déploiement déclenchent le peuplement des paramètres.

Lorsque vous effectuez un déploiement autonome, vous devez effectuer les opérations suivantes :

  1. Créez une table DynamoDB avec une clé de hachage.

  2. Créez un enregistrement dans le tableau contenant la configuration pour le cas d'utilisation sous forme d'enregistrement au format : {key: some_use_case_key, config: {your_configuration}.

  3. Transmettez les paramètres choisis UseCaseConfigTableNameet UseCaseConfigRecordKey(some_use_case_keydans cet exemple) à la pile de cas d'utilisation lors du déploiement.

Pour créer une configuration adaptée à un déploiement autonome, vous pouvez créer un cas d'utilisation requis à partir du tableau de bord de déploiement et copier l'enregistrement depuis le tableau de configuration. Sinon, vous pouvez créer votre propre configuration en vous basant sur l'exemple suivant pour un déploiement de Bedrock :

{ "UseCaseName": "SampleUseCase", "ConversationMemoryParams": { "ConversationMemoryType": "DynamoDB", "HumanPrefix": "H", "AiPrefix": "A", "ChatHistoryLength": 20 }, "KnowledgeBaseParams": { "KnowledgeBaseType": "Bedrock", "NumberOfDocs": 2, "ScoreThreshold": 0, "ReturnSourceDocs": false, "BedrockKnowledgeBaseParams": { "BedrockKnowledgeBaseId": "SOME_ID", "OverrideSearchType": null } }, "LlmParams": { "ModelProvider": "Bedrock", "BedrockLlmParams": { "ModelId": "anthropic.claude-v2" }, "PromptParams": { "PromptTemplate": "some prompt", "MaxPromptTemplateLength": 187500, "MaxInputTextLength": 187500, "UserPromptEditingEnabled": true, "DisambiguationEnabled": true, "DisambiguationPromptTemplate": "some prompt" }, "ModelParams": {}, "Temperature": 1, "RAGEnabled": true, "Streaming": true, "Verbose": false } }