View a markdown version of this page

독립 실행형 텍스트 사용 사례 배포 - AWS의 생성형 AI 애플리케이션 빌더

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

독립 실행형 텍스트 사용 사례 배포

이 섹션의 단계별 지침에 따라 솔루션을 구성하고 계정에 배포합니다.

배포 시간: 약 10~30분

  1. AWS Management Console에 로그인하고 버튼을 선택하여 배포하려는 CloudFront 템플릿을 시작합니다.

    BedrockChat.template Launch solution

    SageMakerChat.template

    Launch solution

  2. 이 템플릿은 기본적으로 미국 동부(버지니아 북부) 리전에서 시작됩니다. 다른 AWS 리전에서 솔루션을 실행하려면 콘솔 탐색 표시줄의 리전 선택기를 사용합니다.

    참고:이 솔루션은 현재 일부 AWS 리전에서 사용할 수 없는 Amazon Kendra 및 Amazon Bedrock을 사용합니다. 이러한 기능을 사용하는 경우 이러한 서비스를 사용할 수 있는 AWS 리전에서이 솔루션을 시작해야 합니다. 리전별 최신 가용성은 AWS 리전 서비스 목록을 참조하세요.

  3. 스택 생성 * 페이지에서 *Amazon S3 URL *텍스트 상자에 올바른 템플릿 URL이 있는지 확인하고 *다음을 선택합니다.

  4. *스택 세부 정보 지정 * 페이지에서 솔루션 스택에 이름을 할당합니다. 문자 제한 이름 지정에 대한 자세한 내용은 AWS Identity and Access Management 사용 설명서의 IAM 및 STS 제한을 참조하세요.

  5. 파라미터에서 이 솔루션 템플릿의 파라미터를 검토하고 필요에 따라 수정합니다. 이 솔루션은 다음과 같은 기본값을 사용합니다.

    UseCaseUUID

    <_input_>

    애플리케이션 내에 배포된이 사용 사례를 식별하기 위한 36자 길이의 UUIDv4입니다.

    UseCaseConfigRecordKey

    <_input_>

    런타임 시 채팅 공급자 Lambda에 필요한 구성을 포함하는 레코드에 해당하는 키입니다. 테이블의 레코드에는이 값과 일치하는 속성과 원하는 구성을 포함하는 구성 속성이 있어야 합니다. 이 레코드는 사용 중인 경우 배포 플랫폼에 의해 채워집니다. 이 사용 사례의 독립 실행형 배포의 경우 UseCaseConfigTableName에 정의된 테이블에 수동으로 생성된 항목이 필요합니다.

    UseCaseConfigTableName

    <_Requires input_>

    스택은 UseCaseConfigRecordKey 키에서이 이름을 사용하여 테이블에서 구성을 읽습니다.

    ExistingRestApiId

    (선택 사항 입력)

    사용할 기존 API Gateway REST API ID입니다. 제공되지 않으면 새 API Gateway REST API가 생성됩니다. 일반적으로 배포 대시보드에서 배포할 때 제공됩니다.

    참고: 기존 APIs 사용하면 여러 독립 실행형 사용 사례를 배포해야 할 때 리소스 중복을 줄이고 APIs 관리를 간소화할 수 있습니다. 독립 실행형 사용 사례에 기존 APIs를 제공할 때는 API가 예상 모델과 함께 필요한 경로(들)로 구성되어 있는지 확인해야 합니다. 사전 구성된 필수 /details 경로(채팅 중에 사용 사례 세부 정보 가져오기)와 선택적으로 /feedback 경로(LLM 채팅 응답에 대한 피드백 수집을 활성화Yes하기 위해 FeedbackEnabled가 로 설정된 경우)를 구성해야 합니다. 또한 ExistingApiRootResourceId, ExistingCognitoUserPoolIdExistingCognitoGroupPolicyTableName도 제공해야 합니다.

    ExistingApiRootResourceId

    (선택 사항 입력)

    사용할 기존 API Gateway REST API 루트 리소스 ID입니다. REST API 루트 리소스 ID는 API의 "리소스" 섹션에서 루트 리소스(/)를 선택하여 AWS 콘솔에서 가져올 수 있습니다. 그러면 리소스 ID가 리소스 세부 정보 패널에 표시됩니다. 또는 REST API에서 설명 API 호출을 실행하여 루트 리소스 ID를 찾을 수 있습니다.

    FeedbackEnabled

    No

    아니요로 설정하면 배포된 사용 사례 스택은 피드백 기능에 액세스할 수 없습니다.

    ExistingModelInfoTableName

    (선택 사항 입력)

    모델 정보 및 기본값을 포함하는 테이블의 DynamoDB 테이블 이름입니다. 배포 플랫폼에서 사용됩니다. 생략하면 모델 기본값을 저장할 새 테이블이 생성됩니다.

    DefaultUserEmail

    placeholder@example.com

    이 사용 사례에 대한 기본 사용자의 이메일입니다. 이 이메일의 Amazon Cognito 사용자가 생성되어 사용 사례에 액세스합니다. 제공되지 않으면 Cognito 그룹 및 사용자가 생성되지 않습니다. placeholder@example.com를 사용하여 그룹을 생성할 수도 있지만 사용자는 생성할 수 없습니다. 사용자 풀 설정에 대한 자세한 내용은 수동 사용자 풀 구성을 참조하세요.

    ExistingCognitoUserPoolId

    (선택 사항 입력)

    이 사용 사례가 인증될 기존 Amazon Cognito 사용자 풀의 UserPoolId입니다. 일반적으로 배포 대시보드에서 배포할 때 제공되지만이 사용 사례 스택을 독립적으로 배포할 때는 생략할 수 있습니다.

    CognitoDomainPrefix

    (선택 사항 입력)

    Cognito 사용자 풀 클라이언트에 도메인을 제공하려면 값을 입력합니다. 값을 제공하지 않으면 배포가 값을 생성합니다.

    ExistingCognitoUserPoolClient

    (선택 사항 입력)

    기존 사용자 풀 클라이언트(앱 클라이언트)를 사용할 사용자 풀 클라이언트를 제공합니다. 사용자 풀 클라이언트를 제공하지 않으면 새 클라이언트가 생성됩니다. 이 파라미터는 기존 사용자 풀 ID가 제공된 경우에만 제공할 수 있습니다.

    ExistingCognitoGroupPolicyTableName

    (선택 사항 입력)

    사용자 그룹 정책이 포함된 DynamoDB 테이블의 이름입니다. 이는 사용 사례의 API에서 사용자 지정 권한 부여자가 사용합니다. 일반적으로 배포 플랫폼에서 배포할 때 입력을 제공할 수 있지만이 사용 사례 스택을 독립적으로 배포할 때는 생략할 수 있습니다.

    RAGEnabled

    true

    true로 설정하면 배포된 사용 사례 스택은 RAG 기능을 제공하기 위해 생성된 제공된 Amazon Kendra 인덱스를 사용합니다. 로 설정하면 false사용자가 LLM과 직접 상호 작용합니다.

    KnowledgeBaseType

    Bedrock

    RAG에 사용할 지식 기반 유형입니다. RAGEnabled가 인 경우에만 설정합니다true. Bedrock 또는 Kendra일 수 있습니다.

    참고: RAGEnabled가 true인 경우에만 관련이 있습니다.

    ExistingKendraIndexId

    (선택 사항 입력)

    사용 사례에 사용할 기존 Kendra 인덱스의 인덱스 ID입니다. 제공되지 않고 KnowledgeBaseType이 Kendra인 경우 새 인덱스가 생성됩니다.

    참고: RAGEnabledtrue 이고 KnowledgeBaseType이 인 경우에만 관련이 있습니다Kendra.

    NewKendraIndexName

    (선택 사항 입력)

    이 사용 사례에 대해 생성할 새 Kendra 인덱스의 이름입니다. ExistingKendraIndexId가 제공되지 않은 경우에만 적용됩니다.

    참고: RAGEnabled가 true이고 KnowledgeBaseType이 Kendra인 경우에만 관련이 있습니다.

    NewKendraQueryCapacityUnits

    0

    이 사용 사례에 대해 생성할 새 Amazon Kendra 인덱스의 추가 쿼리 용량 단위입니다. ExistingKendraIndexId가 제공되지 않은 경우에만 적용됩니다. CapacityUnitsConfiguration을 참조하세요.

    참고: RAGEnabledtrue 이고 KnowledgeBaseType이 인 경우에만 관련이 있습니다Kendra.

    NewKendraStorageCapacityUnits

    0

    이 사용 사례에 대해 생성할 새 Amazon Kendra 인덱스의 추가 스토리지 용량 단위입니다. ExistingKendraIndexId가 제공되지 않은 경우에만 적용됩니다. CapacityUnitsConfiguration을 참조하세요.

    참고: RAGEnabledtrue 이고 KnowledgeBaseType이 인 경우에만 관련이 있습니다Kendra.

    NewKendraIndexEdition

    (선택 사항 입력)

    이 사용 사례에 대해 생성할 새 Amazon Kendra 인덱스에 사용할 Amazon Kendra 에디션입니다. ExistingKendraIndexId가 제공되지 않은 경우에만 적용됩니다. Amazon Kendra Editions를 참조하세요.

    참고: RAGEnabledtrue 이고 KnowledgeBaseType이 인 경우에만 관련이 있습니다Kendra.

    BedrockKnowledgeBaseId

    (선택 사항 입력)

    RAG 사용 사례에 사용할 Bedrock 지식 기반의 ID입니다. ExistingKendraIndexId 또는 NewKendraIndexName이 제공된 경우 제공할 수 없습니다.

    참고: RAGEnabledtrue 이고 KnowledgeBaseType이 인 경우에만 관련이 있습니다Bedrock.

    VpcEnabled

    No

    스택 리소스를 VPC 내에 배포해야 하는지 여부.

    CreateNewVpc

    No

    솔루션이 새 VPC를 생성하고이 사용 사례에 사용되도록 Yes하려면를 선택합니다.

    참고: VpcEnabled가 인 경우에만 관련이 있습니다Yes.

    IPAMPoolId

    (선택 사항 입력)

    Amazon VPC IP 주소 관리자를 사용하여 CIDR 범위를 할당하려면 사용할 IPAM 풀 ID를 제공합니다.

    참고: VpcEnabledYes 이고 CreateNewVpc가 인 경우에만 관련이 있습니다No.

    ExistingVpcId

    (선택 사항 입력)

    사용 사례에 사용할 기존 VPC의 VPC ID입니다.

    참고: VpcEnabledYes 이고 CreateNewVpc가 인 경우에만 관련이 있습니다No.

    ExistingPrivateSubnetIds

    (선택 사항 입력)

    Lambda 함수를 배포하는 데 사용할 기존 프라이빗 서브넷IDs를 쉼표로 구분한 목록입니다.

    참고: VpcEnabledYes 이고 CreateNewVpc가 인 경우에만 관련이 있습니다No.

    ExistingSecurityGroupIds

    (선택 사항 입력)

    Lambda 함수를 구성하는 데 사용할 기존 VPC의 쉼표로 구분된 보안 그룹 목록입니다.

    참고: VpcEnabledYes 이고 CreateNewVpc가 인 경우에만 관련이 있습니다No.

    VpcAzs

    (선택 사항 입력)

    VPCs의 서브넷이 생성되는 AZs의 쉼표로 구분된 목록

    참고: VpcEnabledYes 이고 CreateNewVpc가 인 경우에만 관련이 있습니다No.

    UseInferenceProfile

    No

    구성된 모델이 Bedrock인 경우 Bedrock 추론 프로파일을 사용하고 있는지 여부를 표시할 수 있습니다. 이렇게 하면 스택 배포 중에 필요한 IAM 정책을 구성할 수 있습니다. 자세한 내용은 다음 https://docs.aws.amazon.com/bedrock/latest/userguide/cross-region-inference.html 참조하십시오.

    DeployUI

    이 배포에 대한 프런트엔드 UI를 배포하는 옵션을 선택합니다. 아니요를 선택하면는 APIs를 호스팅하기 위한 인프라, API에 대한 인증 APIs 및 백엔드 처리만 생성합니다.

  6. 다음을 선택합니다.

  7. 스택 옵션 구성 페이지에서 다음을 선택합니다.

  8. 검토 페이지에서 설정을 검토하고 확인합니다. 템플릿이 AWS Identity and Access Management(IAM) 리소스를 생성할 것임을 확인하는 상자를 선택합니다.

  9. 스택 생성을 선택하여 스택을 배포합니다.

AWS CloudFormation 콘솔의 상태 열에서 스택의 상태를 볼 수 있습니다. 약 10~30분 후에 CREATE_COMPLETE 상태를 받게 됩니다.