Opzione 1: utilizzo del file manifesto S3 Opzione 2: utilizzo del payload in linea

Aggiungere nuove entità di vocabolario

Puoi aggiungere un vocabolario alla tua libreria utilizzando l'API. InvokeDataAutomationLibraryIngestionJob Puoi fornire il vocabolario tramite un file manifest S3 o un payload in linea.

Importante

Le operazioni UPSERT utilizzano un metodo sostitutivo in stile clobber a livello di entità, il che significa che l'intera entità viene sostituita anziché unita al contenuto esistente.

Opzione 1: utilizzo del file manifesto S3

Passaggio 1: creare un file manifest JSONL

Ad esempio: vocabulary-manifest.json


{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"}
{"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Requisiti del file manifesto:

Formato di file: JSONL (linee JSON)
Entità JSON:
- EntityID (richiesto): identificatore univoco (max 128 caratteri)
- descrizione (opzionale): descrizione dell'EntityID
- lingua (richiesta): codice della lingua ISO (lingue supportate)
- frasi (richiesto): matrice di oggetti di testo. Ogni oggetto contiene:
  - testo (richiesto): singola parola o frase
  - displayAsText(opzionale): Utilizzatelo per sostituire la parola effettiva nella trascrizione (NOTA: distinzione tra maiuscole e minuscole)

Passaggio 2: carica il manifesto su S3


aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Fase 3: Avviare il processo di ingestione

Usa il InvokeDataAutomationLibraryIngestionJobper iniziare un lavoro di ingestione del vocabolario.

Esempio di CLI AWS:

Richiesta


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \
    --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Risposta:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Esempio di console AWS:

Vai alla pagina «Dettagli della libreria»
Scegli «Aggiungi un elenco di vocaboli personalizzato»
Scegli «Carica/seleziona manifesto»
Scegli se caricare il file manifest direttamente o da una posizione S3

Opzione 2: utilizzo del payload in linea

Questa opzione può essere utilizzata per aggiornamenti rapidi con un massimo di 100 frasi.

Usa il InvokeDataAutomationLibraryIngestionJobper iniziare un lavoro di inserimento del vocabolario.

Esempio di CLI AWS:

Richiesta


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \
    --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Risposta:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Esempio di console AWS:

Vai alla pagina «Dettagli della libreria»
Scegli «Aggiungi un elenco di vocaboli personalizzato»
Scegli «Aggiungi manualmente»

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Gestione delle entità di vocabolario personalizzate

Aggiornamento delle entità del vocabolario