翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
新しい語彙エンティティの追加
InvokeDataAutomationLibraryIngestionJob API を使用して、ライブラリに語彙を追加できます。語彙は、S3 マニフェストファイルまたはインラインペイロードを使用して指定できます。
重要
UPSERT オペレーションでは、エンティティレベルでクローバー形式の置換を使用します。つまり、エンティティ全体が既存のコンテンツとマージされるのではなく置き換えられます。
オプション 1: S3 マニフェストファイルの使用
ステップ 1: JSONL マニフェストファイルを作成する
例: vocabulary-manifest.json
{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}
マニフェストファイルの要件:
ファイル形式: JSONL (JSON 行)
-
エンティティ JSON:
entityId (必須): 一意の識別子 (最大 128 文字)
description (オプション): entityId の説明
言語 (必須): ISO 言語コード (サポートされている言語)
-
phrases (必須): テキストオブジェクトの配列。各オブジェクトには以下が含まれます。
text (必須): 個々の単語またはフレーズ
displayAsText (オプション): これを使用してトランスクリプト内の実際の単語を置き換えます (注: 大文字と小文字が区別されます)
ステップ 2: マニフェストを S3 にアップロードする
aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/
ステップ 3: 取り込みジョブを開始する
InvokeDataAutomationLibraryIngestionJob を使用して語彙取り込みジョブを開始します。
AWS CLI の例:
[リクエスト]
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'
レスポンス:
{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }
AWS コンソールの例:
「ライブラリの詳細」ページに移動する
「カスタム語彙リストの追加」を選択します。
「マニフェストのアップロード/選択」を選択します。
マニフェストファイルを直接アップロードするか、S3 の場所からアップロードするかを選択します。
オプション 2: インラインペイロードの使用
このオプションは、最大 100 フレーズのクイック更新に使用できます。
InvokeDataAutomationLibraryIngestionJob を使用して語彙取り込みジョブを開始します。
AWS CLI の例:
[リクエスト]
aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'
レスポンス:
{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }
AWS コンソールの例:
「ライブラリの詳細」ページに移動する
「カスタム語彙リストの追加」を選択します。
「手動で追加」を選択します。