View a markdown version of this page

Aggiungere nuove entità di vocabolario - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aggiungere nuove entità di vocabolario

Puoi aggiungere un vocabolario alla tua libreria utilizzando l'API. InvokeDataAutomationLibraryIngestionJob Puoi fornire il vocabolario tramite un file manifest S3 o un payload in linea.

Importante

Le operazioni UPSERT utilizzano un metodo sostitutivo in stile clobber a livello di entità, il che significa che l'intera entità viene sostituita anziché unita al contenuto esistente.

Opzione 1: utilizzo del file manifesto S3

Passaggio 1: creare un file manifest JSONL

Ad esempio: vocabulary-manifest.json

{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Requisiti del file manifesto:

  • Formato di file: JSONL (linee JSON)

  • Entità JSON:

    • EntityID (richiesto): identificatore univoco (max 128 caratteri)

    • descrizione (opzionale): descrizione dell'EntityID

    • lingua (richiesta): codice della lingua ISO (lingue supportate)

    • frasi (richiesto): matrice di oggetti di testo. Ogni oggetto contiene:

      • testo (richiesto): singola parola o frase

      • displayAsText(opzionale): Utilizzatelo per sostituire la parola effettiva nella trascrizione (NOTA: distinzione tra maiuscole e minuscole)

Passaggio 2: carica il manifesto su S3

aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Fase 3: Avviare il processo di ingestione

Usa il InvokeDataAutomationLibraryIngestionJobper iniziare un lavoro di ingestione del vocabolario.

Esempio di CLI AWS:

Richiesta

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Risposta:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

Esempio di console AWS:

  1. Vai alla pagina «Dettagli della libreria»

  2. Scegli «Aggiungi un elenco di vocaboli personalizzato»

  3. Scegli «Carica/seleziona manifesto»

  4. Scegli se caricare il file manifest direttamente o da una posizione S3

Opzione 2: utilizzo del payload in linea

Questa opzione può essere utilizzata per aggiornamenti rapidi con un massimo di 100 frasi.

Usa il InvokeDataAutomationLibraryIngestionJobper iniziare un lavoro di inserimento del vocabolario.

Esempio di CLI AWS:

Richiesta

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Risposta:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

Esempio di console AWS:

  1. Vai alla pagina «Dettagli della libreria»

  2. Scegli «Aggiungi un elenco di vocaboli personalizzato»

  3. Scegli «Aggiungi manualmente»