View a markdown version of this page

新しい語彙エンティティの追加 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

新しい語彙エンティティの追加

InvokeDataAutomationLibraryIngestionJob API を使用して、ライブラリに語彙を追加できます。語彙は、S3 マニフェストファイルまたはインラインペイロードを使用して指定できます。

重要

UPSERT オペレーションでは、エンティティレベルでクローバー形式の置換を使用します。つまり、エンティティ全体が既存のコンテンツとマージされるのではなく置き換えられます。

オプション 1: S3 マニフェストファイルの使用

ステップ 1: JSONL マニフェストファイルを作成する

例: vocabulary-manifest.json

{"entityId":"medical-en","description":"Medication terms in English language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"EN"} {"entityId":"medical-es","description":"Medication terms in Spanish language","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"},{"text":"acetaminophen","displayAsText":"acetaminophen"}],"language":"ES"}

マニフェストファイルの要件:

  • ファイル形式: JSONL (JSON 行)

  • エンティティ JSON:

    • entityId (必須): 一意の識別子 (最大 128 文字)

    • description (オプション): entityId の説明

    • 言語 (必須): ISO 言語コード (サポートされている言語)

    • phrases (必須): テキストオブジェクトの配列。各オブジェクトには以下が含まれます。

      • text (必須): 個々の単語またはフレーズ

      • displayAsText (オプション): これを使用してトランスクリプト内の実際の単語を置き換えます (注: 大文字と小文字が区別されます)

ステップ 2: マニフェストを S3 にアップロードする

aws s3 cp vocabulary-manifest.json s3://my-bucket/manifests/

ステップ 3: 取り込みジョブを開始する

InvokeDataAutomationLibraryIngestionJob を使用して語彙取り込みジョブを開始します。

AWS CLI の例:

[リクエスト]

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"s3Object":{"s3Uri":"s3://my-bucket/manifests/vocabulary-manifest.json"}}' \ --output-configuration '{"s3Uri":"s3://my-bucket/outputs/"}'

レスポンス:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

AWS コンソールの例:

  1. 「ライブラリの詳細」ページに移動する

  2. 「カスタム語彙リストの追加」を選択します。

  3. 「マニフェストのアップロード/選択」を選択します。

  4. マニフェストファイルを直接アップロードするか、S3 の場所からアップロードするかを選択します。

オプション 2: インラインペイロードの使用

このオプションは、最大 100 フレーズのクイック更新に使用できます。

InvokeDataAutomationLibraryIngestionJob を使用して語彙取り込みジョブを開始します。

AWS CLI の例:

[リクエスト]

aws bedrock-data-automation-data-automation invoke-data-automation-library-ingestion-job \ --library-arn "arn:aws:bedrock:us-east-1:123456789012:data-automation-library/healthcare-vocabulary" \ --entity-type "VOCABULARY" \ --operation-type "UPSERT" \ --input-configuration '{"inlinePayload":{"upsertEntitiesInfo":[{"vocabulary":{"entityId":"medical-en","language":"EN","phrases":[{"text":"paracetamol"},{"text":"ibuprofen"}]}}]}}' \ --output-configuration '{"s3Uri":"s3://bda-data-bucket/output/"}'

レスポンス:

{ "jobArn": "arn:aws:bedrock:us-east-1:123456789012:data-automation-library-ingestion-job/job-12345" }

AWS コンソールの例:

  1. 「ライブラリの詳細」ページに移動する

  2. 「カスタム語彙リストの追加」を選択します。

  3. 「手動で追加」を選択します。