Opsi 1: Menggunakan File Manifest S3 Opsi 2: Menggunakan Payload Inline

Menambahkan Entitas Kosakata Baru

Anda dapat menambahkan kosakata ke perpustakaan Anda menggunakan API. InvokeDataAutomationLibraryIngestionJob Anda dapat memberikan kosakata melalui file manifes S3 atau muatan inline.

penting

Operasi UPSERT menggunakan pengganti gaya clobber di tingkat entitas, yang berarti seluruh entitas diganti daripada digabungkan dengan konten yang ada.

Opsi 1: Menggunakan File Manifest S3

Langkah 1: Buat file manifes JSONL

Contoh: vocabulary-manifest.json


{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"}
{"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Persyaratan File Manifest:

Format File: JSONL (Garis JSON)
Entitas JSON:
- EntityId (wajib): Pengidentifikasi unik (maks 128 karakter)
- deskripsi (opsional): Deskripsi EntityID
- bahasa (wajib): Kode bahasa ISO (Bahasa yang didukung)
- frase (wajib): Array objek teks. Setiap objek berisi:
  - teks (wajib): Kata atau frasa individual
  - displayAsText(opsional): Gunakan ini untuk mengganti kata yang sebenarnya dalam transkrip (CATATAN: Peka huruf besar/kecil)

Langkah 2: Unggah manifes ke S3


aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Langkah 3: Mulai pekerjaan konsumsi

Gunakan InvokeDataAutomationLibraryIngestionJobuntuk memulai pekerjaan menelan kosakata.

Contoh AWS CLI:

Permintaan


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \
    --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Tanggapan:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Contoh Konsol AWS:

Arahkan ke halaman “Detail perpustakaan”
Pilih “Tambahkan daftar kosakata khusus”
Pilih “Unggah/pilih manifes”
Pilih apakah akan mengunggah file manifes secara langsung atau dari lokasi S3

Opsi 2: Menggunakan Payload Inline

Opsi ini dapat digunakan untuk pembaruan cepat hingga 100 frasa.

Gunakan InvokeDataAutomationLibraryIngestionJobuntuk memulai pekerjaan menelan kosakata.

Contoh AWS CLI:

Permintaan


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \
    --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Tanggapan:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Contoh Konsol AWS:

Arahkan ke halaman “Detail perpustakaan”
Pilih “Tambahkan daftar kosakata khusus”
Pilih “Tambahkan secara manual”

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Mengelola Entitas Kosakata Kustom

Memperbarui Entitas Kosakata