As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Adicionando novas entidades de vocabulário
Você pode adicionar vocabulário à sua biblioteca usando a InvokeDataAutomationLibraryIngestionJobAPI. Você pode fornecer vocabulário por meio de um arquivo de manifesto do S3 ou de uma carga embutida.
Importante
As operações UPSERT usam uma substituição no estilo clobber no nível da entidade, o que significa que a entidade inteira é substituída em vez de mesclada com o conteúdo existente.
Opção 1: usando o arquivo de manifesto do S3
Etapa 1: criar um arquivo de manifesto JSONL
Exemplo: vocabulary-manifest.json
{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}
Requisitos de arquivo do manifesto:
Formato de arquivo: JSONL (linhas JSON)
-
Entidade JSON:
entityID (obrigatório): identificador exclusivo (máximo 128 caracteres)
descrição (opcional): Descrição do EntityID
idioma (obrigatório): código de idioma ISO (idiomas suportados)
-
frases (obrigatório): matriz de objetos de texto. Cada objeto contém:
texto (obrigatório): palavra ou frase individual
displayAsText(opcional): Use isso para substituir a palavra real na transcrição (NOTA: diferencia maiúsculas de minúsculas)
Etapa 2: Carregar o manifesto no S3
aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/
Etapa 3: iniciar o trabalho de ingestão
Use o InvokeDataAutomationLibraryIngestionJobpara iniciar um trabalho de ingestão de vocabulário.
Exemplo de AWS CLI:
Solicitação
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'
Resposta:
{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }
Exemplo de console da AWS:
Navegue até a página “Detalhes da biblioteca”
Escolha “Adicionar lista de vocabulário personalizada”
Escolha “Carregar/selecionar manifesto”
Escolha se deseja carregar o arquivo de manifesto diretamente ou de um local do S3
Opção 2: Usando a carga em linha
Essa opção pode ser usada para atualizações rápidas com até 100 frases.
Use o InvokeDataAutomationLibraryIngestionJobpara iniciar um trabalho de ingestão de vocabulário.
Exemplo de AWS CLI:
Solicitação
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'
Resposta:
{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }
Exemplo de console da AWS:
Navegue até a página “Detalhes da biblioteca”
Escolha “Adicionar lista de vocabulário personalizada”
Escolha “Adicionar manualmente”