Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menambahkan Entitas Kosakata Baru
Anda dapat menambahkan kosakata ke perpustakaan Anda menggunakan API. InvokeDataAutomationLibraryIngestionJob Anda dapat memberikan kosakata melalui file manifes S3 atau muatan inline.
penting
Operasi UPSERT menggunakan pengganti gaya clobber di tingkat entitas, yang berarti seluruh entitas diganti daripada digabungkan dengan konten yang ada.
Opsi 1: Menggunakan File Manifest S3
Langkah 1: Buat file manifes JSONL
Contoh: vocabulary-manifest.json
{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}
Persyaratan File Manifest:
Format File: JSONL (Garis JSON)
-
Entitas JSON:
EntityId (wajib): Pengidentifikasi unik (maks 128 karakter)
deskripsi (opsional): Deskripsi EntityID
bahasa (wajib): Kode bahasa ISO (Bahasa yang didukung)
-
frase (wajib): Array objek teks. Setiap objek berisi:
teks (wajib): Kata atau frasa individual
displayAsText(opsional): Gunakan ini untuk mengganti kata yang sebenarnya dalam transkrip (CATATAN: Peka huruf besar/kecil)
Langkah 2: Unggah manifes ke S3
aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/
Langkah 3: Mulai pekerjaan konsumsi
Gunakan InvokeDataAutomationLibraryIngestionJobuntuk memulai pekerjaan menelan kosakata.
Contoh AWS CLI:
Permintaan
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'
Tanggapan:
{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }
Contoh Konsol AWS:
Arahkan ke halaman “Detail perpustakaan”
Pilih “Tambahkan daftar kosakata khusus”
Pilih “Unggah/pilih manifes”
Pilih apakah akan mengunggah file manifes secara langsung atau dari lokasi S3
Opsi 2: Menggunakan Payload Inline
Opsi ini dapat digunakan untuk pembaruan cepat hingga 100 frasa.
Gunakan InvokeDataAutomationLibraryIngestionJobuntuk memulai pekerjaan menelan kosakata.
Contoh AWS CLI:
Permintaan
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'
Tanggapan:
{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }
Contoh Konsol AWS:
Arahkan ke halaman “Detail perpustakaan”
Pilih “Tambahkan daftar kosakata khusus”
Pilih “Tambahkan secara manual”