Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Implementazione di un caso d'uso di testo autonomo
Segui le step-by-step istruzioni in questa sezione per configurare e distribuire la soluzione nel tuo account.
Tempo di implementazione: circa 10-30 minuti
-
Accedi alla Console di gestione AWS
e seleziona il pulsante per avviare il CloudFront modello che desideri distribuire. -
Per impostazione predefinita, il modello viene avviato nella regione Stati Uniti orientali (Virginia settentrionale). Per avviare la soluzione in un'altra regione AWS, utilizza il selettore della regione nella barra di navigazione della console.
Nota: questa soluzione utilizza Amazon Kendra e Amazon Bedrock, che attualmente non sono disponibili in tutte le regioni AWS. Se utilizzi queste funzionalità, devi avviare questa soluzione in una regione AWS in cui questi servizi sono disponibili. Per la disponibilità più aggiornata per regione, consulta l'AWS Regional Services List
. -
Nella pagina Create stack *, verifica che l'URL del modello corretto sia nella casella di testo*Amazon S3 URL*e scegli *Avanti.
-
Nella pagina *Specificare i dettagli dello stack *, assegna un nome allo stack di soluzioni. Per informazioni sulle limitazioni dei caratteri di denominazione, consulta IAM e STS Limits nella AWS Identity and Access Management User Guide.
-
In Parametri, esamina i parametri per questo modello di soluzione e modificali se necessario. Questa soluzione utilizza i seguenti valori predefiniti.
UseCaseUUID
<_Requires input_>36 caratteri di lunghezza UUIDv4 per identificare questo caso d'uso distribuito all'interno di un'applicazione.
UseCaseConfigRecordKey
<_Requires input_>Chiave corrispondente al record contenente le configurazioni richieste dal provider di chat Lambda in fase di esecuzione. Il record nella tabella deve avere un attributo chiave che corrisponda a questo valore e un attributo config contenente la configurazione desiderata. Questo record verrà compilato dalla piattaforma di distribuzione se in uso. Per le distribuzioni autonome di questo caso d'uso, è richiesta una voce creata manualmente nella tabella definita in. UseCaseConfigTableName
UseCaseConfigTableName
<_Requires input_>Lo stack leggerà la configurazione dalla tabella con questo nome come chiave UseCaseConfigRecordKey
ExistingRestApiId
(Input opzionale)
ID API REST API Gateway esistente da utilizzare. Se non viene fornita, verrà creata una nuova API API Gateway REST. In genere viene fornita durante la distribuzione dalla dashboard di distribuzione.
Nota: l'utilizzo di APIs Existing può aiutare a ridurre la duplicazione delle risorse e semplificare la gestione APIs quando è necessario implementare più casi d'uso autonomi. Quando si fornisce una soluzione esistente APIs per un caso d'uso indipendente, è responsabilità dell'utente garantire che l'API sia configurata con le route richieste con i modelli previsti. È necessario configurare un percorso /details preconfigurato obbligatorio (recupera i dettagli dei casi d'uso durante la chat) e, facoltativamente, un percorso /feedback (se impostato per consentire FeedbackEnabledla raccolta di feedback per le risposte
Yesalle chat LLM). Inoltre, e deve anche essere ExistingApiRootResourceIdfornito ExistingCognitoUserPoolId. ExistingCognitoGroupPolicyTableNameExistingApiRootResourceId
(Input opzionale)
ID risorsa principale dell'API REST di API Gateway esistente da utilizzare. Il Root Resource ID dell'API REST può essere ottenuto dalla console AWS selezionando la risorsa root (/) nella sezione «Risorse» dell'API. L'ID della risorsa verrà quindi visualizzato nel pannello dei dettagli della risorsa. In alternativa, puoi eseguire una chiamata API di descrizione sull'API REST per trovare il Root Resource ID.
FeedbackEnabled
NoSe impostato su No, lo stack di use case distribuito non avrà accesso alla funzionalità di feedback.
ExistingModelInfoTableName
(Input opzionale)
Nome della tabella DynamoDB per la tabella che contiene informazioni sul modello e valori predefiniti. Utilizzato dalla piattaforma di distribuzione. Se omessa, verrà creata una nuova tabella per contenere le impostazioni predefinite del modello.
DefaultUserEmail
placeholder@example.comE-mail dell'utente predefinito per questo caso d'uso. Viene creato un utente Amazon Cognito per questa e-mail per accedere allo use case. Se non vengono forniti, il Gruppo e l'Utente di Cognito non verranno creati. Puoi anche utilizzare
placeholder@example.comper creare il gruppo ma non l'utente. Per informazioni sulla configurazione del pool di utenti, fare riferimento alla sezione Configurazione manuale del pool di utenti.ExistingCognitoUserPoolId
(Input opzionale)
UserPoolIddi un pool di utenti Amazon Cognito esistente con cui verrà autenticato questo caso d'uso. In genere viene fornito durante la distribuzione dalla dashboard di Deployment, ma può essere omesso quando si distribuisce questo stack di use case in modo autonomo.
CognitoDomainPrefix
(Input opzionale)
Inserisci un valore se desideri fornire un dominio per il client del pool di utenti di Cognito. Se non fornisci un valore, l'implementazione ne genererà uno.
ExistingCognitoUserPoolClient
(Input opzionale)
Fornisci un client del pool di utenti (App Client) per utilizzarne uno esistente. Se non fornisci un User Pool Client, ne verrà creato uno nuovo. Questo parametro può essere fornito solo se viene fornito un ID del pool di utenti esistente.
ExistingCognitoGroupPolicyTableName
(Input opzionale)
Nome della tabella DynamoDB contenente le politiche dei gruppi di utenti. Viene utilizzato dall'autorizzatore personalizzato sull'API del caso d'uso. In genere, è possibile fornire un input durante la distribuzione dalla piattaforma di distribuzione, ma può essere omesso quando si distribuisce questo stack di casi d'uso in modo autonomo.
RAGEnabled
trueSe impostato su true, lo stack di use case distribuito utilizza l'indice Amazon Kendra fornito creato per fornire la funzionalità RAG. Se impostato su
false, l'utente interagisce direttamente con il LLM.KnowledgeBaseType
Bedrock
Tipo di knowledge base da utilizzare per RAG. Imposta solo se lo RAGEnabled è
true. Può essere Bedrock o Kendra.Nota: Rilevante solo se RAGEnabledè vero.
ExistingKendraIndexId
(Input opzionale)
ID indice di un indice Kendra esistente da utilizzare per il caso d'uso. Se non ne viene fornito nessuno ed KnowledgeBaseTypeè Kendra, verrà creato un nuovo indice per te.
Nota: rilevante solo se RAGEnabledè
trueed KnowledgeBaseTypeè.KendraNewKendraIndexName
(Inserimento opzionale)
Nome per il nuovo indice Kendra da creare per questo caso d'uso. Si applica solo se non ExistingKendraIndexIdviene fornito.
Nota: rilevante solo se RAGEnabledè vero ed KnowledgeBaseTypeè Kendra.
NewKendraQueryCapacityUnits
0
Unità di capacità di query aggiuntive per il nuovo indice Amazon Kendra da creare per questo caso d'uso. Si applica solo se non ExistingKendraIndexIdviene fornito, vedi. CapacityUnitsConfiguration
Nota: rilevante solo se RAGEnabledè
trueed KnowledgeBaseTypeèKendra.NewKendraStorageCapacityUnits
0Unità di capacità di storage aggiuntive per il nuovo indice Amazon Kendra da creare per questo caso d'uso. Si applica solo se non ExistingKendraIndexIdviene fornito, vedi. CapacityUnitsConfiguration
Nota: rilevante solo se RAGEnabledè
trueed KnowledgeBaseTypeèKendra.NewKendraIndexEdition
(Inserimento opzionale)
L'edizione di Amazon Kendra da utilizzare per il nuovo indice Amazon Kendra da creare per questo caso d'uso. Si applica solo se non ExistingKendraIndexIdviene fornito, vedi Amazon Kendra Editions.
Nota: rilevante solo se RAGEnabledè
trueed KnowledgeBaseTypeè.KendraBedrockKnowledgeBaseId
(Inserimento opzionale)
ID della knowledge base da utilizzare in un caso d'uso RAG. Non può essere fornito se ExistingKendraIndexIdo NewKendraIndexNameviene fornito.
Nota: rilevante solo se RAGEnabledè
trueed KnowledgeBaseTypeèBedrock.VpcEnabled
NoSe le risorse degli stack devono essere distribuite all'interno di un VPC.
CreateNewVpc
NoSeleziona
Yes, se desideri che la soluzione crei un nuovo VPC per te e venga utilizzata per questo caso d'uso.Nota: rilevante solo se lo VpcEnabledè
Yes.IPAMPoolId
(Inserimento opzionale)
Se desideri assegnare l'intervallo CIDR utilizzando Amazon VPC IP Address Manager, fornisci l'ID del pool IPAM da utilizzare.
Nota: rilevante solo se VpcEnabledè ed è.
YesCreateNewVpcNoExistingVpcId
(Inserimento opzionale)
ID VPC di un VPC esistente da utilizzare per lo use case.
Nota: rilevante solo se VpcEnabledè
Yesed CreateNewVpcè.NoExistingPrivateSubnetIds
(Inserimento opzionale)
Elenco separato da virgole IDs di sottoreti private esistenti da utilizzare per distribuire la funzione Lambda.
Nota: rilevante solo se è ed è. VpcEnabled
YesCreateNewVpcNoExistingSecurityGroupIds
(Inserimento opzionale)
Elenco separato da virgole dei gruppi di sicurezza del VPC esistente da utilizzare per configurare le funzioni Lambda.
Nota: rilevante solo se VpcEnabledè ed è
Yes. CreateNewVpcNoVpcAzs
(Inserimento opzionale)
Elenco separato da virgole AZs in cui vengono create le sottoreti di VPCs
Nota: rilevante solo se VpcEnabledè
Yesed CreateNewVpcè.NoUseInferenceProfile
NoSe il modello configurato è Bedrock, puoi indicare se stai utilizzando Bedrock Inference Profile. Ciò garantirà che le politiche IAM richieste vengano configurate durante la distribuzione dello stack. Per maggiori dettagli, consulta il seguente file -region-inference.html https://docs.aws.amazon.com/bedrock/ latest/userguide/cross
Implementa UI
Sì
Seleziona l'opzione per distribuire l'interfaccia utente frontend per questa distribuzione. Selezionando No, verrà creata solo l'infrastruttura per ospitare l' APIselaborazione, l'autenticazione e il APIs backend.
-
Scegli Next (Successivo).
-
Nella pagina Configure stack options (Configura opzioni pila), scegliere Next (Successivo).
-
Nella pagina Rivedi, verifica e conferma le impostazioni. Seleziona la casella per confermare che il modello creerà risorse AWS Identity and Access Management (IAM).
-
Seleziona Create (Crea) per implementare lo stack.
Puoi visualizzare lo stato dello stack nella CloudFormation console AWS nella colonna Status. Dovresti ricevere lo stato CREATE_COMPLETE in circa 10-30 minuti.