オプション 1: S3 マニフェストファイルの使用オプション 2: インラインペイロードの使用

新しい語彙エンティティの追加

InvokeDataAutomationLibraryIngestionJob API を使用して、ライブラリに語彙を追加できます。語彙は、S3 マニフェストファイルまたはインラインペイロードを使用して指定できます。

重要

UPSERT オペレーションでは、エンティティレベルでクローバー形式の置換を使用します。つまり、エンティティ全体が既存のコンテンツとマージされるのではなく置き換えられます。

オプション 1: S3 マニフェストファイルの使用

ステップ 1: JSONL マニフェストファイルを作成する

例: vocabulary-manifest.json


{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"}
{"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

マニフェストファイルの要件:

ファイル形式: JSONL (JSON 行)
エンティティ JSON:
- entityId (必須): 一意の識別子 (最大 128 文字)
- description (オプション): entityId の説明
- 言語 (必須): ISO 言語コード (サポートされている言語)
- phrases (必須): テキストオブジェクトの配列。各オブジェクトには以下が含まれます。
  - text (必須): 個々の単語またはフレーズ
  - displayAsText (オプション): これを使用してトランスクリプト内の実際の単語を置き換えます (注: 大文字と小文字が区別されます)

ステップ 2: マニフェストを S3 にアップロードする


aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

ステップ 3: 取り込みジョブを開始する

InvokeDataAutomationLibraryIngestionJob を使用して語彙取り込みジョブを開始します。

AWS CLI の例:

[リクエスト]


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \
    --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

レスポンス:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

AWS コンソールの例:

「ライブラリの詳細」ページに移動する
「カスタム語彙リストの追加」を選択します。
「マニフェストのアップロード/選択」を選択します。
マニフェストファイルを直接アップロードするか、S3 の場所からアップロードするかを選択します。

オプション 2: インラインペイロードの使用

このオプションは、最大 100 フレーズのクイック更新に使用できます。

InvokeDataAutomationLibraryIngestionJob を使用して語彙取り込みジョブを開始します。

AWS CLI の例:

[リクエスト]


aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \
    --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \
    --entity-type "VOCABULARY" \
    --operation-type "UPSERT" \
    --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \
    --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

レスポンス:


{
  "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345"
}

AWS コンソールの例:

「ライブラリの詳細」ページに移動する
「カスタム語彙リストの追加」を選択します。
「手動で追加」を選択します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

カスタム語彙エンティティの管理

語彙エンティティの更新