View a markdown version of this page

Déploiement d'un cas d'utilisation de texte autonome - Générateur d'applications d'IA générative sur AWS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déploiement d'un cas d'utilisation de texte autonome

Suivez les step-by-step instructions de cette section pour configurer et déployer la solution dans votre compte.

Temps de déploiement : environ 10 à 30 minutes

  1. Connectez-vous à l'AWS Management Console et sélectionnez le bouton pour lancer le CloudFront modèle que vous souhaitez déployer.

    BedrockChat.modèle Launch solution

    SageMakerChat.modèle

    Launch solution

  2. Le modèle est lancé par défaut dans la région USA Est (Virginie du Nord). Pour lancer la solution dans une autre région AWS, utilisez le sélecteur de région dans la barre de navigation de la console.

    Remarque : Cette solution utilise Amazon Kendra et Amazon Bedrock, qui ne sont actuellement pas disponibles dans toutes les régions AWS. Si vous utilisez ces fonctionnalités, vous devez lancer cette solution dans une région AWS où ces services sont disponibles. Pour connaître la disponibilité la plus récente par région, consultez la liste des services régionaux AWS.

  3. Sur la page Create stack *, vérifiez que l'URL du modèle correcte se trouve dans la zone de texte *Amazon S3 URL *et choisissez *Next.

  4. Sur la page *Spécifier les détails de la pile *, attribuez un nom à votre pile de solutions. Pour plus d'informations sur les limites relatives aux caractères de dénomination, consultez les limites IAM et STS dans le guide de l'utilisateur d'AWS Identity and Access Management.

  5. Sous Paramètres, passez en revue les paramètres de ce modèle de solution et modifiez-les si nécessaire. Cette solution utilise les valeurs par défaut suivantes.

    UseCaseUUID

    <_Requires input_>

    36 caractères UUIDv4 pour identifier ce cas d'utilisation déployé au sein d'une application.

    UseCaseConfigRecordKey

    <_Requires input_>

    Clé correspondant à l'enregistrement contenant les configurations requises par le fournisseur de chat Lambda lors de l'exécution. L'enregistrement de la table doit avoir un attribut clé correspondant à cette valeur et un attribut de configuration contenant la configuration souhaitée. Cet enregistrement sera renseigné par la plateforme de déploiement s'il est utilisé. Pour les déploiements autonomes de ce cas d'utilisation, une entrée créée manuellement dans le tableau défini dans UseCaseConfigTableNameest requise.

    UseCaseConfigTableName

    <_Requires input_>

    La pile lira la configuration à partir de la table avec ce nom comme clé UseCaseConfigRecordKey

    ExistingRestApiId

    (Entrée facultative)

    ID d'API REST API Gateway existant à utiliser. Si elle n'est pas fournie, une nouvelle API REST API Gateway sera créée. Généralement fourni lors du déploiement depuis le tableau de bord de déploiement.

    Remarque : L'utilisation d' APIs Existing peut contribuer à réduire la duplication des ressources et à simplifier la gestion APIs lorsque vous devez déployer plusieurs cas d'utilisation autonomes. Lorsque vous fournissez APIs des données existantes pour un cas d'utilisation autonome, vous devez vous assurer que l'API est configurée avec les routes requises avec les modèles attendus. Une route /details préconfigurée obligatoire (récupère les détails des cas d'utilisation pendant le chat) et éventuellement une route /feedback (si elle FeedbackEnabledest définie pour permettre la collecte de commentaires pour les réponses de chat LLM) doivent Yes être configurées. En outre ExistingApiRootResourceId, ExistingCognitoUserPoolIdet ExistingCognitoGroupPolicyTableNamedoit également être fourni.

    ExistingApiRootResourceId

    (Entrée facultative)

    ID de ressource racine de l'API REST API Gateway existant à utiliser. L'ID de ressource racine de l'API REST peut être obtenu depuis la console AWS en sélectionnant la ressource racine (/) dans la section « Ressources » de l'API. L'ID de ressource sera ensuite affiché dans le panneau des détails de la ressource. Vous pouvez également exécuter un appel d'API de description sur votre API REST pour trouver l'ID de ressource racine.

    FeedbackEnabled

    No

    Si ce paramètre est défini sur Non, la pile de cas d'utilisation déployée n'aura pas accès à la fonctionnalité de feedback.

    ExistingModelInfoTableName

    (Entrée facultative)

    Nom de la table DynamoDB pour la table contenant les informations sur le modèle et les valeurs par défaut. Utilisé par la plateforme de déploiement. En cas d'omission, une nouvelle table sera créée pour héberger les valeurs par défaut du modèle.

    DefaultUserEmail

    placeholder@example.com

    Adresse e-mail de l'utilisateur par défaut pour ce cas d'utilisation. Un utilisateur Amazon Cognito pour cet e-mail est créé pour accéder au cas d'utilisation. S'ils ne sont pas fournis, le groupe Cognito et l'utilisateur ne seront pas créés. Vous pouvez également l'utiliser placeholder@example.com pour créer le groupe, mais pas l'utilisateur. Reportez-vous à la section Configuration manuelle du groupe d'utilisateurs pour plus d'informations sur la configuration de votre groupe d'utilisateurs.

    ExistingCognitoUserPoolId

    (Entrée facultative)

    UserPoolIdd'un groupe d'utilisateurs Amazon Cognito existant auprès duquel ce cas d'utilisation sera authentifié. Généralement fourni lors du déploiement depuis le tableau de bord de déploiement, mais peut être omis lors du déploiement de cette pile de cas d'utilisation autonome.

    CognitoDomainPrefix

    (Entrée facultative)

    Entrez une valeur si vous souhaitez fournir un domaine au client du pool d'utilisateurs Cognito. Si vous ne fournissez aucune valeur, le déploiement en générera une.

    ExistingCognitoUserPoolClient

    (Entrée facultative)

    Fournissez un client de groupe d'utilisateurs (client d'application) pour utiliser un client existant. Si vous ne fournissez pas de client de groupe d'utilisateurs, un nouveau client sera créé. Ce paramètre ne peut être fourni que si un identifiant de groupe d'utilisateurs existant est fourni.

    ExistingCognitoGroupPolicyTableName

    (Entrée facultative)

    Nom de la table DynamoDB contenant les politiques de groupe d'utilisateurs. Ceci est utilisé par l'autorisateur personnalisé sur l'API du cas d'utilisation. En règle générale, vous pouvez fournir une entrée lors du déploiement depuis la plate-forme de déploiement, mais vous pouvez l'omettre lors du déploiement de cette pile de cas d'utilisation autonome.

    RAGEnabled

    true

    Si ce paramètre est défini sur true, la pile de cas d'utilisation déployée utilise l'index Amazon Kendra fourni, créé pour fournir les fonctionnalités RAG. Si ce paramètre est défini surfalse, l'utilisateur interagit directement avec le LLM.

    KnowledgeBaseType

    Bedrock

    Type de base de connaissances à utiliser pour RAG. Ne définissez que si RAGEnabled c'est le castrue. Cela peut être Bedrock ou Kendra.

    Remarque : pertinent uniquement si RAGEnabledc'est vrai.

    ExistingKendraIndexId

    (Entrée facultative)

    ID d'index d'un index Kendra existant à utiliser pour le cas d'utilisation. Si aucun index n'est fourni et KnowledgeBaseTypequ'il s'agit de Kendra, un nouvel index sera créé pour vous.

    Remarque : N'est pertinent que s'il RAGEnabledest true et s'KnowledgeBaseTypeil estKendra.

    NewKendraIndexName

    (Entrée facultative)

    Nom du nouvel index Kendra à créer pour ce cas d'utilisation. Ne s'applique que s'ExistingKendraIndexIdil n'est pas fourni.

    Remarque : Uniquement pertinent si RAGEnabledc'est vrai et si c'KnowledgeBaseTypeest le cas de Kendra.

    NewKendraQueryCapacityUnits

    0

    Des unités de capacité de requête supplémentaires pour le nouvel index Amazon Kendra seront créées pour ce cas d'utilisation. Ne s'applique que s'ExistingKendraIndexIdil n'est pas fourni, voir CapacityUnitsConfiguration.

    Remarque : N'est pertinent que s'il RAGEnabledest true et s'KnowledgeBaseTypeil estKendra.

    NewKendraStorageCapacityUnits

    0

    Des unités de capacité de stockage supplémentaires pour le nouvel index Amazon Kendra seront créées pour ce cas d'utilisation. Ne s'applique que s'ExistingKendraIndexIdil n'est pas fourni, voir CapacityUnitsConfiguration.

    Remarque : N'est pertinent que s'il RAGEnabledest true et s'KnowledgeBaseTypeil estKendra.

    NewKendraIndexEdition

    (Entrée facultative)

    L'édition d'Amazon Kendra à utiliser pour le nouvel index Amazon Kendra qui sera créé pour ce cas d'utilisation. S'applique uniquement s'il n'ExistingKendraIndexIdest pas fourni, voir Amazon Kendra Editions.

    Remarque : N'est pertinent que s'il RAGEnabledest true et s'KnowledgeBaseTypeil estKendra.

    BedrockKnowledgeBaseId

    (Entrée facultative)

    Identifiant de la base de connaissances sur le socle à utiliser dans un cas d'utilisation de RAG. Ne peut pas être fourni si ExistingKendraIndexIdou NewKendraIndexNamesont fournis.

    Remarque : N'est pertinent que s'il RAGEnabledest true et s'KnowledgeBaseTypeil estBedrock.

    VpcEnabled

    No

    Les ressources de la pile doivent-elles être déployées au sein d'un VPC ?

    CreateNewVpc

    No

    SélectionnezYes, si vous souhaitez que la solution crée un nouveau VPC pour vous et qu'elle soit utilisée pour ce cas d'utilisation.

    Remarque : pertinent uniquement si tel VpcEnabledest le casYes.

    IPAMPoolId

    (Entrée facultative)

    Si vous souhaitez attribuer la plage d'adresses CIDR à l'aide du gestionnaire d'adresses IP Amazon VPC, fournissez l'ID du pool IPAM à utiliser.

    Remarque : N'est pertinent que s'il VpcEnabledest Yes et s'CreateNewVpcil estNo.

    ExistingVpcId

    (Entrée facultative)

    ID VPC d'un VPC existant à utiliser pour le cas d'utilisation.

    Remarque : N'est pertinent que s'il VpcEnabledest Yes et s'CreateNewVpcil estNo.

    ExistingPrivateSubnetIds

    (Entrée facultative)

    Liste séparée par des virgules IDs des sous-réseaux privés existants à utiliser pour déployer la fonction Lambda.

    Remarque : N'est pertinent que s'il VpcEnabledest Yes et s'CreateNewVpcil estNo.

    ExistingSecurityGroupIds

    (Entrée facultative)

    Liste séparée par des virgules des groupes de sécurité du VPC existant à utiliser pour configurer les fonctions Lambda.

    Remarque : N'est pertinent que s'il VpcEnabledest Yes et s'CreateNewVpcil estNo.

    VpcAzs

    (Entrée facultative)

    Liste séparée par des AZs virgules indiquant dans laquelle les sous-réseaux du VPCs sont créés

    Remarque : N'est pertinent que s'il VpcEnabledest Yes et s'CreateNewVpcil estNo.

    UseInferenceProfile

    No

    Si le modèle configuré est Bedrock, vous pouvez indiquer si vous utilisez le profil d'inférence Bedrock. Cela garantira que les politiques IAM requises seront configurées lors du déploiement de la pile. Pour plus de détails, reportez-vous au https://docs.aws.amazon.com/bedrock/ latest/userguide/cross fichier -region-inference.html suivant

    Interface utilisateur de déploiement

    Oui

    Sélectionnez l'option permettant de déployer l'interface utilisateur frontale pour ce déploiement. Si vous sélectionnez Non, vous ne créerez que l'infrastructure pour héberger le APIs traitement principal APIs, l'authentification et le traitement principal.

  6. Choisissez Next (Suivant).

  7. Sur la page Configurer les options de pile, choisissez Suivant.

  8. Sur la page Vérification, vérifiez et confirmez les paramètres. Cochez la case indiquant que le modèle créera des ressources AWS Identity and Access Management (IAM).

  9. Sélectionnez Create stack (Créer une pile) pour déployer la pile.

Vous pouvez consulter l'état de la pile dans la CloudFormation console AWS dans la colonne Status. Vous devriez recevoir le statut CREATE_COMPLETE dans 10 à 30 minutes environ.