View a markdown version of this page

Menambahkan Entitas Kosakata Baru - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menambahkan Entitas Kosakata Baru

Anda dapat menambahkan kosakata ke perpustakaan Anda menggunakan API. InvokeDataAutomationLibraryIngestionJob Anda dapat memberikan kosakata melalui file manifes S3 atau muatan inline.

penting

Operasi UPSERT menggunakan pengganti gaya clobber di tingkat entitas, yang berarti seluruh entitas diganti daripada digabungkan dengan konten yang ada.

Opsi 1: Menggunakan File Manifest S3

Langkah 1: Buat file manifes JSONL

Contoh: vocabulary-manifest.json

{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Persyaratan File Manifest:

  • Format File: JSONL (Garis JSON)

  • Entitas JSON:

    • EntityId (wajib): Pengidentifikasi unik (maks 128 karakter)

    • deskripsi (opsional): Deskripsi EntityID

    • bahasa (wajib): Kode bahasa ISO (Bahasa yang didukung)

    • frase (wajib): Array objek teks. Setiap objek berisi:

      • teks (wajib): Kata atau frasa individual

      • displayAsText(opsional): Gunakan ini untuk mengganti kata yang sebenarnya dalam transkrip (CATATAN: Peka huruf besar/kecil)

Langkah 2: Unggah manifes ke S3

aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Langkah 3: Mulai pekerjaan konsumsi

Gunakan InvokeDataAutomationLibraryIngestionJobuntuk memulai pekerjaan menelan kosakata.

Contoh AWS CLI:

Permintaan

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Tanggapan:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

Contoh Konsol AWS:

  1. Arahkan ke halaman “Detail perpustakaan”

  2. Pilih “Tambahkan daftar kosakata khusus”

  3. Pilih “Unggah/pilih manifes”

  4. Pilih apakah akan mengunggah file manifes secara langsung atau dari lokasi S3

Opsi 2: Menggunakan Payload Inline

Opsi ini dapat digunakan untuk pembaruan cepat hingga 100 frasa.

Gunakan InvokeDataAutomationLibraryIngestionJobuntuk memulai pekerjaan menelan kosakata.

Contoh AWS CLI:

Permintaan

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Tanggapan:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

Contoh Konsol AWS:

  1. Arahkan ke halaman “Detail perpustakaan”

  2. Pilih “Tambahkan daftar kosakata khusus”

  3. Pilih “Tambahkan secara manual”