Opção 1: usando o arquivo de manifesto do S3 Opção 2: Usando a carga em linha

Adicionando novas entidades de vocabulário

Você pode adicionar vocabulário à sua biblioteca usando a InvokeDataAutomationLibraryIngestionJobAPI. Você pode fornecer vocabulário por meio de um arquivo de manifesto do S3 ou de uma carga embutida.

Importante

As operações UPSERT usam uma substituição no estilo clobber no nível da entidade, o que significa que a entidade inteira é substituída em vez de mesclada com o conteúdo existente.

Opção 1: usando o arquivo de manifesto do S3

Etapa 1: criar um arquivo de manifesto JSONL

Exemplo: vocabulary-manifest.json


{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"}
{"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

Requisitos de arquivo do manifesto:

Formato de arquivo: JSONL (linhas JSON)
Entidade JSON:
- entityID (obrigatório): identificador exclusivo (máximo 128 caracteres)
- descrição (opcional): Descrição do EntityID
- idioma (obrigatório): código de idioma ISO (idiomas suportados)
- frases (obrigatório): matriz de objetos de texto. Cada objeto contém:
  - texto (obrigatório): palavra ou frase individual
  - displayAsText(opcional): Use isso para substituir a palavra real na transcrição (NOTA: diferencia maiúsculas de minúsculas)

Etapa 2: Carregar o manifesto no S3


aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

Etapa 3: iniciar o trabalho de ingestão

Use o InvokeDataAutomationLibraryIngestionJobpara iniciar um trabalho de ingestão de vocabulário.

Exemplo de AWS CLI:

Solicitação


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \
    --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

Resposta:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Exemplo de console da AWS:

Navegue até a página “Detalhes da biblioteca”
Escolha “Adicionar lista de vocabulário personalizada”
Escolha “Carregar/selecionar manifesto”
Escolha se deseja carregar o arquivo de manifesto diretamente ou de um local do S3

Opção 2: Usando a carga em linha

Essa opção pode ser usada para atualizações rápidas com até 100 frases.

Use o InvokeDataAutomationLibraryIngestionJobpara iniciar um trabalho de ingestão de vocabulário.

Exemplo de AWS CLI:

Solicitação


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \
    --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

Resposta:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

Exemplo de console da AWS:

Navegue até a página “Detalhes da biblioteca”
Escolha “Adicionar lista de vocabulário personalizada”
Escolha “Adicionar manualmente”

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Gerenciando entidades de vocabulário personalizadas

Atualizando entidades de vocabulário