View a markdown version of this page

カスタム語彙 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタム語彙

言語ごとにドメイン固有の単語やフレーズを指定できるため、BDA はオーディオやビデオコンテンツの抽出精度を向上させることができます。ブランド名、頭字語、適切な名詞、専門用語など、業界やドメインに固有の用語を含めることができます。これにより、BDA は処理されたコンテンツからこれらの用語を正確に認識して抽出できます。

重要

Bedrock Data Automation Library を使用する際は、独自のデータの整合性について責任を負います。機密情報、個人情報 (PII)、または保護対象の医療情報 (PHI) をカスタム語彙に入力しないでください。

カスタム語彙でサポートされている言語のリストは、こちらで確認できます。カスタム語彙で使用できるのは、その言語の文字セットにリストされている文字だけであることに注意してください。

の使用方法

BDA プロジェクトでカスタム語彙を使用するには、データ自動化ライブラリを作成し、ターゲット言語のドメイン固有の語彙エンティティ/リストを追加し、プロジェクトの作成中にライブラリをプロジェクトに関連付けるか、既存のプロジェクトを更新します。これにより、そのプロジェクトを通じて実行されるすべてのオーディオおよびビデオ処理ジョブでカスタム語彙を適用できます。これにより、標準出力とカスタムブループリント出力の両方で、ドメイン固有の用語の抽出精度が向上します。

カスタム語彙を使用する場合の考慮事項:

  • 認識されないことが多いドメイン固有の用語に焦点を当てる

  • 重要な用語の一般的なバリエーションとスペルを含める

  • より良い管理のために言語別に語彙を整理する

  • 業界固有の専門用語と技術用語を優先する

  • ドメインで一般的に使用される頭字語と略語を含める