View a markdown version of this page

Menerapkan kasus penggunaan Teks mandiri - Pembuat Aplikasi AI Generatif di AWS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menerapkan kasus penggunaan Teks mandiri

Ikuti step-by-step petunjuk di bagian ini untuk mengonfigurasi dan menyebarkan solusi ke akun Anda.

Waktu untuk menyebarkan: Sekitar 10-30 menit

  1. Masuk ke AWS Management Console dan pilih tombol untuk meluncurkan CloudFront template yang ingin Anda terapkan.

    BedrockChat.template Launch solution

    SageMakerChat.template

    Launch solution

  2. Template diluncurkan di Wilayah AS Timur (Virginia N.) secara default. Untuk meluncurkan solusi di Wilayah AWS yang berbeda, gunakan pemilih Wilayah di bilah navigasi konsol.

    Catatan: Solusi ini menggunakan Amazon Kendra dan Amazon Bedrock, yang saat ini tidak tersedia di semua Wilayah AWS. Jika menggunakan fitur-fitur ini, Anda harus meluncurkan solusi ini di Wilayah AWS tempat layanan ini tersedia. Untuk ketersediaan terbaru menurut Wilayah, lihat Daftar Layanan Regional AWS.

  3. Pada halaman Create stack *, verifikasi bahwa URL template yang benar ada di kotak teks*Amazon S3 URL *dan pilih *Next.

  4. Pada halaman *Tentukan detail tumpukan*, tetapkan nama ke tumpukan solusi Anda. Untuk informasi tentang batasan penamaan karakter, lihat Batas IAM dan STS di Panduan Pengguna AWS Identity and Access Management.

  5. Di bawah Parameter, tinjau parameter untuk templat solusi ini dan modifikasi sesuai kebutuhan. Solusi ini menggunakan nilai default berikut.

    UseCaseUUID

    <_Requires input_>

    Panjang 36 karakter UUIDv4 untuk mengidentifikasi kasus penggunaan yang diterapkan ini dalam suatu aplikasi.

    UseCaseConfigRecordKey

    <_Requires input_>

    Kunci yang sesuai dengan catatan yang berisi konfigurasi yang diperlukan oleh penyedia obrolan Lambda saat runtime. Catatan dalam tabel harus memiliki atribut kunci yang cocok dengan nilai ini, dan atribut config yang berisi konfigurasi yang diinginkan. Catatan ini akan diisi oleh platform penyebaran jika digunakan. Untuk penerapan mandiri dari kasus penggunaan ini, diperlukan entri yang dibuat secara manual dalam tabel yang ditentukan. UseCaseConfigTableName

    UseCaseConfigTableName

    <_Requires input_>

    Tumpukan akan membaca konfigurasi dari tabel dengan nama ini di kuncinya UseCaseConfigRecordKey

    ExistingRestApiId

    (Masukan opsional)

    ID API Gateway REST API yang ada untuk digunakan. Jika tidak disediakan, API API Gateway REST API baru akan dibuat. Biasanya disediakan saat menerapkan dari dasbor Deployment.

    Catatan: Menggunakan Existing APIs dapat membantu mengurangi duplikasi sumber daya dan menyederhanakan pengelolaan APIs kapan Anda perlu menerapkan beberapa kasus penggunaan mandiri. Saat menyediakan yang ada APIs untuk kasus penggunaan mandiri, Anda bertanggung jawab untuk memastikan bahwa API dikonfigurasi dengan rute yang diperlukan dengan model yang diharapkan. Rute /detail pra-konfigurasi yang diperlukan (mengambil detail kasus penggunaan selama obrolan) dan secara opsional, rute /umpan balik (jika FeedbackEnableddiatur untuk mengaktifkan pengumpulan umpan balik Yes untuk respons obrolan LLM) harus dikonfigurasi. Selain itu ExistingApiRootResourceId,, ExistingCognitoUserPoolIddan juga ExistingCognitoGroupPolicyTableNameharus disediakan.

    ExistingApiRootResourceId

    (Masukan opsional)

    API Gateway REST API Root Resource ID yang ada untuk digunakan. REST API Root Resource ID dapat diperoleh dari konsol AWS dengan memilih sumber daya root (/) di bagian “Sumber Daya” dari API. Resource ID kemudian akan ditampilkan di panel Resource details. Sebagai alternatif, Anda dapat menjalankan panggilan describe API di REST API untuk menemukan ID Sumber Daya Root.

    FeedbackEnabled

    No

    Jika disetel ke Tidak, tumpukan kasus penggunaan yang diterapkan tidak akan memiliki akses ke fitur umpan balik.

    ExistingModelInfoTableName

    (Masukan opsional)

    Nama tabel DynamoDB untuk tabel yang berisi info model dan default. Digunakan oleh platform penyebaran. Jika dihilangkan, tabel baru akan dibuat untuk menampung default model.

    DefaultUserEmail

    placeholder@example.com

    Email pengguna default untuk kasus penggunaan ini. Pengguna Amazon Cognito untuk email ini dibuat untuk mengakses kasus penggunaan. Jika tidak disediakan, Grup dan Pengguna Cognito tidak akan dibuat. Anda juga dapat menggunakan placeholder@example.com untuk membuat Grup tetapi bukan Pengguna. Lihat Konfigurasi Kumpulan Pengguna Manual untuk informasi tentang pengaturan kumpulan pengguna Anda.

    ExistingCognitoUserPoolId

    (Masukan opsional)

    UserPoolIddari kumpulan pengguna Amazon Cognito yang ada yang akan diautentikasi dengan kasus penggunaan ini. Biasanya disediakan saat menerapkan dari dasbor Deployment, tetapi dapat dihilangkan saat menerapkan tumpukan kasus penggunaan ini secara mandiri.

    CognitoDomainPrefix

    (Masukan opsional)

    Masukkan nilai jika Anda ingin memberikan domain untuk Klien Kumpulan Pengguna Cognito. Jika Anda tidak memberikan nilai, penerapan akan menghasilkannya.

    ExistingCognitoUserPoolClient

    (Masukan opsional)

    Menyediakan Klien Kumpulan Pengguna (Klien Aplikasi) untuk menggunakan yang sudah ada. Jika Anda tidak menyediakan Klien Kumpulan Pengguna, yang baru akan dibuat. Parameter ini hanya dapat diberikan jika User Pool Id yang ada disediakan.

    ExistingCognitoGroupPolicyTableName

    (Masukan opsional)

    Nama tabel DynamoDB yang berisi kebijakan grup pengguna. Ini digunakan oleh otorisasi khusus pada API kasus penggunaan. Biasanya, Anda dapat memberikan input saat menerapkan dari platform penerapan, tetapi dapat dihilangkan saat menerapkan tumpukan kasus penggunaan ini secara mandiri.

    RAGEnabled

    true

    Jika disetel ke true, tumpukan kasus penggunaan yang diterapkan menggunakan indeks Amazon Kendra yang disediakan yang dibuat untuk menyediakan fungsionalitas RAG. Jika diatur kefalse, pengguna berinteraksi langsung dengan LLM.

    KnowledgeBaseType

    Batuan dasar

    Tipe dasar pengetahuan yang akan digunakan untuk RAG. Hanya atur jika RAGEnabled adatrue. Bisa berupa Bedrock atau Kendra.

    Catatan: Hanya relevan jika RAGEnabledbenar.

    ExistingKendraIndexId

    (Masukan opsional)

    ID indeks indeks Kendra yang ada untuk digunakan untuk kasus penggunaan. Jika tidak ada yang KnowledgeBaseTypedisediakan dan Kendra, indeks baru akan dibuat untuk Anda.

    Catatan: Hanya relevan jika RAGEnabledada true dan KnowledgeBaseTypeadalahKendra.

    NewKendraIndexName

    (Masukan opsional)

    Nama untuk indeks Kendra baru yang akan dibuat untuk kasus penggunaan ini. Hanya berlaku jika ExistingKendraIndexIdtidak disediakan.

    Catatan: Hanya relevan jika RAGEnabledbenar dan KnowledgeBaseTypeKendra.

    NewKendraQueryCapacityUnits

    0

    Unit kapasitas kueri tambahan untuk indeks Amazon Kendra baru yang akan dibuat untuk kasus penggunaan ini. Hanya berlaku jika ExistingKendraIndexIdtidak disediakan, lihat CapacityUnitsConfiguration.

    Catatan: Hanya relevan jika RAGEnabledada true dan KnowledgeBaseTypeadalahKendra.

    NewKendraStorageCapacityUnits

    0

    Unit kapasitas penyimpanan tambahan untuk indeks Amazon Kendra baru yang akan dibuat untuk kasus penggunaan ini. Hanya berlaku jika ExistingKendraIndexIdtidak disediakan, lihat CapacityUnitsConfiguration.

    Catatan: Hanya relevan jika RAGEnabledada true dan KnowledgeBaseTypeadalahKendra.

    NewKendraIndexEdition

    (Masukan opsional)

    Edisi Amazon Kendra yang akan digunakan untuk indeks Amazon Kendra baru yang akan dibuat untuk kasus penggunaan ini. Hanya berlaku jika tidak ExistingKendraIndexIddisediakan, lihat Edisi Amazon Kendra.

    Catatan: Hanya relevan jika RAGEnabledada true dan KnowledgeBaseTypeadalahKendra.

    BedrockKnowledgeBaseId

    (Masukan opsional)

    ID basis pengetahuan batuan dasar untuk digunakan dalam kasus penggunaan RAG. Tidak dapat diberikan jika ExistingKendraIndexIdatau NewKendraIndexNamedisediakan.

    Catatan: Hanya relevan jika RAGEnabledada true dan KnowledgeBaseTypeadalahBedrock.

    VpcEnabled

    No

    Haruskah sumber daya tumpukan digunakan dalam VPC.

    CreateNewVpc

    No

    PilihYes, jika Anda ingin solusi untuk membuat VPC baru untuk Anda dan digunakan untuk kasus penggunaan ini.

    Catatan: Hanya relevan jika VpcEnabledadaYes.

    IPAMPoolId

    (Masukan opsional)

    Jika Anda ingin menetapkan rentang CIDR menggunakan Amazon VPC IP Address Manager, berikan Id kolam IPAM untuk digunakan.

    Catatan: Hanya relevan jika VpcEnabledada Yes dan CreateNewVpcadalahNo.

    ExistingVpcId

    (Masukan opsional)

    ID VPC dari VPC yang ada untuk digunakan untuk kasus penggunaan.

    Catatan: Hanya relevan jika VpcEnabledada Yes dan CreateNewVpcadalahNo.

    ExistingPrivateSubnetIds

    (Masukan opsional)

    Daftar subnet yang dipisahkan koma dari subnet IDs pribadi yang ada untuk digunakan untuk menyebarkan fungsi Lambda.

    Catatan: Hanya relevan jika VpcEnabledada Yes dan CreateNewVpcadalahNo.

    ExistingSecurityGroupIds

    (Masukan opsional)

    Daftar grup keamanan yang dipisahkan koma dari VPC yang ada yang akan digunakan untuk mengkonfigurasi fungsi Lambda.

    Catatan: Hanya relevan jika VpcEnabledada Yes dan CreateNewVpcadalahNo.

    VpcAzs

    (Masukan opsional)

    Daftar dipisahkan koma AZs di mana subnet dibuat VPCs

    Catatan: Hanya relevan jika VpcEnabledada Yes dan CreateNewVpcadalahNo.

    UseInferenceProfile

    No

    Jika model yang dikonfigurasi adalah Bedrock, Anda dapat menunjukkan apakah Anda menggunakan Profil Inferensi Batuan Dasar. Ini akan memastikan bahwa kebijakan IAM yang diperlukan akan dikonfigurasi selama penerapan tumpukan. Untuk lebih jelasnya, lihat https://docs.aws.amazon.com/bedrock/ latest/userguide/cross -region-inference.html berikut

    DeployUI

    Ya

    Pilih opsi untuk menerapkan UI frontend untuk penerapan ini. Memilih Tidak, hanya akan membuat infrastruktur untuk meng-host APIs, otentikasi untuk APIs, dan pemrosesan backend.

  6. Pilih Berikutnya.

  7. Pada halaman Konfigurasikan opsi tumpukan, pilih Berikutnya.

  8. Pada halaman Ulasan, tinjau dan konfirmasikan pengaturan. Pilih kotak yang menyatakan bahwa template akan membuat sumber daya AWS Identity and Access Management (IAM).

  9. Pilih Membuat tumpukan untuk menerapkannya.

Anda dapat melihat status tumpukan di CloudFormation konsol AWS di kolom Status. Anda akan menerima status CREATE_COMPLETE dalam waktu sekitar 10-30 menit.