View a markdown version of this page

Bereitstellung eines eigenständigen Text-Anwendungsfalls - Generativer KI-Anwendungsgenerator auf AWS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bereitstellung eines eigenständigen Text-Anwendungsfalls

Folgen Sie den step-by-step Anweisungen in diesem Abschnitt, um die Lösung zu konfigurieren und in Ihrem Konto bereitzustellen.

Zeit bis zur Bereitstellung: Ungefähr 10-30 Minuten

  1. Melden Sie sich bei der AWS-Managementkonsole an und klicken Sie auf die Schaltfläche, um die CloudFront Vorlage zu starten, die Sie bereitstellen möchten.

    BedrockChat.vorlage Launch solution

    SageMakerChat. Vorlage

    Launch solution

  2. Die Vorlage wird standardmäßig in der Region USA Ost (Nord-Virginia) gestartet. Um die Lösung in einer anderen AWS-Region zu starten, verwenden Sie die Regionsauswahl in der Navigationsleiste der Konsole.

    Hinweis: Diese Lösung verwendet Amazon Kendra und Amazon Bedrock, die derzeit nicht in allen AWS-Regionen verfügbar sind. Wenn Sie diese Funktionen verwenden, müssen Sie diese Lösung in einer AWS-Region starten, in der diese Services verfügbar sind. Die aktuelle Verfügbarkeit nach Regionen finden Sie in der Liste der regionalen AWS-Dienste.

  3. Vergewissern Sie sich auf der Seite Stack erstellen *, dass sich die richtige Vorlagen-URL im Textfeld *Amazon S3-URL * befindet, und wählen Sie *Weiter aus.

  4. Weisen Sie auf der Seite *Stack-Details angeben *Ihrem Lösungs-Stack einen Namen zu. Informationen zu Einschränkungen bei der Benennung von Zeichen finden Sie unter IAM- und STS-Grenzwerte im AWS Identity and Access Management-Benutzerhandbuch.

  5. Überprüfen Sie unter Parameter die Parameter für diese Lösungsvorlage und ändern Sie sie nach Bedarf. Diese Lösung verwendet die folgenden Standardwerte.

    UseCaseUUID

    <_Requires input_>

    36 Zeichen lang UUIDv4 , um diesen bereitgestellten Anwendungsfall innerhalb einer Anwendung zu identifizieren.

    UseCaseConfigRecordKey

    <_Requires input_>

    Schlüssel, der dem Datensatz entspricht, der Konfigurationen enthält, die der Chat-Anbieter Lambda zur Laufzeit benötigt. Der Datensatz in der Tabelle muss ein Schlüsselattribut haben, das diesem Wert entspricht, und ein Konfigurationsattribut, das die gewünschte Konfiguration enthält. Dieser Datensatz wird von der Bereitstellungsplattform aufgefüllt, falls er verwendet wird. Für eigenständige Bereitstellungen dieses Anwendungsfalls ist ein manuell erstellter Eintrag in der in definierten Tabelle UseCaseConfigTableNameerforderlich.

    UseCaseConfigTableName

    <_Requires input_>

    Der Stack liest die Konfiguration aus der Tabelle mit diesem Namen als Schlüssel UseCaseConfigRecordKey

    ExistingRestApiId

    (Optionale Eingabe)

    Bestehende API-Gateway-REST-API-ID, die verwendet werden soll. Falls nicht angegeben, wird eine neue API-Gateway-REST-API erstellt. Wird normalerweise bei der Bereitstellung über das Deployment-Dashboard bereitgestellt.

    Hinweis: Die Verwendung von APIs Existing kann dazu beitragen, die Duplizierung von Ressourcen zu reduzieren und die Verwaltung zu vereinfachen, APIs wenn Sie mehrere eigenständige Anwendungsfälle bereitstellen müssen. Bei der Bereitstellung vorhandener Daten APIs für einen eigenständigen Anwendungsfall sind Sie dafür verantwortlich, sicherzustellen, dass die API mit den erforderlichen Routen und den erwarteten Modellen konfiguriert ist. Eine erforderliche vorkonfigurierte /details-Route (ruft Anwendungsfalldetails während des Chats ab) und optional eine /feedback-Route (falls FeedbackEnabledso eingestellt, dass sie die Erfassung von Feedback für LLM-Chat-Antworten ermöglicht) Yes müssen konfiguriert werden. Zusätzlich ExistingCognitoUserPoolIdund ExistingCognitoGroupPolicyTableNamemuss ebenfalls ExistingApiRootResourceIdangegeben werden.

    ExistingApiRootResourceId

    (Optionale Eingabe)

    Bestehende API-Gateway-REST-API-Root-Ressourcen-ID, die verwendet werden soll. Die REST-API-Root-Ressourcen-ID kann von der AWS-Konsole abgerufen werden, indem Sie die Root-Ressource (/) im Abschnitt „Ressourcen“ der API auswählen. Die Ressourcen-ID wird dann im Bereich mit den Ressourcendetails angezeigt. Sie können alternativ einen API-Aufruf zur Beschreibung Ihrer REST-API ausführen, um die Root-Ressourcen-ID zu ermitteln.

    FeedbackEnabled

    No

    Wenn diese Option auf Nein gesetzt ist, hat der bereitgestellte Anwendungsfallstapel keinen Zugriff auf die Feedback-Funktion.

    ExistingModelInfoTableName

    (Optionale Eingabe)

    DynamoDB-Tabellenname für die Tabelle, die Modellinformationen und Standardwerte enthält. Wird von der Bereitstellungsplattform verwendet. Wenn nicht angegeben, wird eine neue Tabelle erstellt, die die Standardwerte des Modells enthält.

    DefaultUserEmail

    placeholder@example.com

    E-Mail-Adresse des Standardbenutzers für diesen Anwendungsfall. Ein Amazon Cognito Cognito-Benutzer für diese E-Mail wird erstellt, um auf den Anwendungsfall zuzugreifen. Wenn nicht angegeben, werden die Cognito-Gruppe und der Cognito-Benutzer nicht erstellt. Sie können die Gruppe auch verwendenplaceholder@example.com, um die Gruppe zu erstellen, aber nicht den Benutzer. Informationen zur Einrichtung Ihres Benutzerpools finden Sie unter Manuelle Konfiguration des Benutzerpools.

    ExistingCognitoUserPoolId

    (Optionale Eingabe)

    UserPoolIdeines vorhandenen Amazon Cognito Cognito-Benutzerpools, mit dem dieser Anwendungsfall authentifiziert wird. Wird normalerweise bei der Bereitstellung über das Deployment-Dashboard bereitgestellt, kann aber weggelassen werden, wenn dieser Anwendungsfall-Stack eigenständig bereitgestellt wird.

    CognitoDomainPrefix

    (Optionale Eingabe)

    Geben Sie einen Wert ein, wenn Sie eine Domäne für den Cognito User Pool Client bereitstellen möchten. Wenn Sie keinen Wert angeben, generiert die Bereitstellung einen Wert.

    ExistingCognitoUserPoolClient

    (Optionale Eingabe)

    Stellen Sie einen Benutzerpool-Client (App Client) bereit, um einen vorhandenen zu verwenden. Wenn Sie keinen Benutzerpool-Client bereitstellen, wird ein neuer erstellt. Dieser Parameter kann nur angegeben werden, wenn eine vorhandene Benutzerpool-ID angegeben wird.

    ExistingCognitoGroupPolicyTableName

    (Optionale Eingabe)

    Name der DynamoDB-Tabelle, die Benutzergruppenrichtlinien enthält. Dies wird vom benutzerdefinierten Autorisierer für die API des Anwendungsfalls verwendet. In der Regel können Sie bei der Bereitstellung über die Bereitstellungsplattform eine Eingabe vornehmen, bei der eigenständigen Bereitstellung dieses Anwendungsfall-Stacks kann diese jedoch weggelassen werden.

    RAGEnabled

    true

    Wenn auf true gesetzt, verwendet der bereitgestellte Anwendungsfallstapel den bereitgestellten Amazon Kendra Kendra-Index, der für die Bereitstellung von RAG-Funktionen erstellt wurde. Wenn auf gesetztfalse, interagiert der Benutzer direkt mit dem LLM.

    KnowledgeBaseType

    Bedrock

    Wissensdatenbanktyp, der für RAG verwendet werden soll. Nur gesetzt, wenn RAGEnabled es isttrue. Kann Bedrock oder Kendra sein.

    Hinweis: Nur relevant, wenn es wahr RAGEnabledist.

    ExistingKendraIndexId

    (Optionale Eingabe)

    Index-ID eines vorhandenen Kendra-Indexes, der für den Anwendungsfall verwendet werden soll. Wenn keiner angegeben ist und Kendra KnowledgeBaseTypeist, wird ein neuer Index für Sie erstellt.

    Hinweis: Nur relevant, wenn RAGEnabledist true und KnowledgeBaseTypeistKendra.

    NewKendraIndexName

    (Optionale Eingabe)

    Name für den neuen Kendra-Index, der für diesen Anwendungsfall erstellt werden soll. Gilt nur, ExistingKendraIndexIdwenn nicht angegeben.

    Hinweis: Nur relevant, wenn RAGEnabledes wahr ist und Kendra KnowledgeBaseTypeist.

    NewKendraQueryCapacityUnits

    0

    Zusätzliche Abfragekapazitätseinheiten für den neuen Amazon Kendra Kendra-Index, die für diesen Anwendungsfall erstellt werden sollen. Gilt nur, ExistingKendraIndexIdwenn nicht angegeben, siehe CapacityUnitsConfiguration.

    Hinweis: Nur relevant, wenn RAGEnabledes ist true und KnowledgeBaseTypeistKendra.

    NewKendraStorageCapacityUnits

    0

    Zusätzliche Speicherkapazitätseinheiten für den neuen Amazon Kendra Kendra-Index sollen für diesen Anwendungsfall erstellt werden. Gilt nur, wenn ExistingKendraIndexIdes nicht mitgeliefert wird, siehe CapacityUnitsConfiguration.

    Hinweis: Nur relevant, wenn RAGEnabledes ist true und KnowledgeBaseTypeistKendra.

    NewKendraIndexEdition

    (Optionale Eingabe)

    Die Edition von Amazon Kendra, die für den neuen Amazon Kendra Kendra-Index verwendet werden soll, der für diesen Anwendungsfall erstellt werden soll. Gilt nur, wenn ExistingKendraIndexIdnicht im Lieferumfang enthalten, siehe Amazon Kendra Editions.

    Hinweis: Nur relevant, wenn RAGEnabledes ist true und KnowledgeBaseTypeistKendra.

    BedrockKnowledgeBaseId

    (Optionale Eingabe)

    ID der Bedrock-Wissensdatenbank, die in einem RAG-Anwendungsfall verwendet werden soll. Kann nicht angegeben werden, wenn ExistingKendraIndexIdoder angegeben NewKendraIndexNamewerden.

    Hinweis: Nur relevant, wenn RAGEnabledist true und KnowledgeBaseTypeistBedrock.

    VpcEnabled

    No

    Sollen die Stack-Ressourcen innerhalb einer VPC bereitgestellt werden.

    CreateNewVpc

    No

    Wählen Sie ausYes, ob die Lösung eine neue VPC für Sie erstellen und für diesen Anwendungsfall verwenden soll.

    Hinweis: Nur relevant, wenn ja VpcEnabled. Yes

    IPAMPoolId

    (Optionale Eingabe)

    Wenn Sie den CIDR-Bereich mithilfe von Amazon VPC IP Address Manager zuweisen möchten, geben Sie die zu verwendende IPAM-Pool-ID an.

    Hinweis: Nur relevant, wenn VpcEnabledist und istYes. CreateNewVpcNo

    ExistingVpcId

    (Optionale Eingabe)

    VPC-ID einer vorhandenen VPC, die für den Anwendungsfall verwendet werden soll.

    Hinweis: Nur relevant, wenn VpcEnabledist Yes und CreateNewVpcist. No

    ExistingPrivateSubnetIds

    (Optionale Eingabe)

    Durch Kommas getrennte Liste der Subnetze IDs vorhandener privater Subnetze, die für die Bereitstellung der Lambda-Funktion verwendet werden sollen.

    Hinweis: Nur relevant, wenn VpcEnabledist und ist. Yes CreateNewVpcNo

    ExistingSecurityGroupIds

    (Optionale Eingabe)

    Durch Kommas getrennte Liste von Sicherheitsgruppen der vorhandenen VPC, die für die Konfiguration von Lambda-Funktionen verwendet werden sollen.

    Hinweis: Nur relevant, wenn VpcEnabledist und istYes. CreateNewVpcNo

    VpcAzs

    (Optionale Eingabe)

    Durch Kommas getrennte Liste, AZs in welcher Subnetze von erstellt wurden VPCs

    Hinweis: Nur relevant, wenn VpcEnabledist Yes und CreateNewVpcist. No

    UseInferenceProfile

    No

    Wenn das konfigurierte Modell Bedrock ist, können Sie angeben, ob Sie Bedrock Inference Profile verwenden. Dadurch wird sichergestellt, dass die erforderlichen IAM-Richtlinien während der Stack-Bereitstellung konfiguriert werden. Weitere Informationen finden Sie in der folgenden Datei -region-inference.html https://docs.aws.amazon.com/bedrock/ latest/userguide/cross

    Stellen Sie die Benutzeroberfläche bereit

    Ja

    Wählen Sie die Option zur Bereitstellung der Frontend-Benutzeroberfläche für diese Bereitstellung aus. Wenn Sie Nein auswählen, wird nur die Infrastruktur für das APIs Hosten der Authentifizierung und die APIs Backend-Verarbeitung erstellt.

  6. Wählen Sie Weiter aus.

  7. Wählen Sie auf der Seite Configure stack options (Stack-Optionen konfigurieren) Next (Weiter) aus.

  8. Überprüfen und bestätigen Sie die Einstellungen auf der Seite Review. Markieren Sie das Kästchen, um zu bestätigen, dass die Vorlage AWS Identity and Access Management (IAM) -Ressourcen erstellt.

  9. Wählen Sie Stack erstellen aus, um den Stack bereitzustellen.

Sie können den Status des Stacks in der CloudFormation AWS-Konsole in der Spalte Status anzeigen. Sie sollten in etwa 10 bis 30 Minuten den Status CREATE_COMPLETE erhalten.