テキストファイルを使用して医療用カスタム語彙を作成する

カスタム語彙を作成するには、単語またはフレーズのコレクションを含むテキストファイルを準備しておく必要があります。 Amazon Transcribe Medical はこのテキストファイルを使用して、それらの単語またはフレーズの文字起こし精度を向上させるために使用できるカスタム語彙を作成します。CreateMedicalVocabulary API または Amazon Transcribe Medical コンソールを使用してカスタム語彙を作成できます。

を使用してカスタム語 AWS マネジメントコンソール彙を作成するには、単語またはフレーズを含むテキストファイルの Amazon S3 URI を指定します。

AWS マネジメントコンソールにサインインします。
ナビゲーションペインの Amazon Transcribe Medical で、カスタム語彙を選択します。
名前を使用する場合、語彙の設定で、カスタム語彙の名前を選択します。
Amazon S3で音声ファイルまたはビデオファイルの場所を指定します。
- 語彙の設定 の S3 の語彙入力ファイルの場所で、カスタムボキャブラリーの作成に使用するテキストファイルを識別する Amazon S3 URI を指定します。
- S3 の語彙入力ファイルの場所については、S3 の参照 を選択してテキストファイルを参照し、それを選択します。
[語彙の作成] を選択します。

カスタム語彙の処理ステータスが AWS マネジメントコンソールで確認できます。

医療用カスタム語彙を作成 (API)するには

StartTranscriptionJob API では、以下のものを指定します。
1. LanguageCode の場合、en-US を指定します。
2. ではVocabularyFileUri、カスタム語彙の定義に使用するテキストファイル Amazon S3 の場所を指定します。
3. VocabularyName の場合、カスタム語彙の名前を指定します。指定する名前は、内で一意である必要があります AWS アカウント。

カスタム語彙の処理状況を表示する場合、GetMedicalVocabulary API を使用します。

以下は、 AWS SDK for Python (Boto3) を使用してカスタム語彙を作成するリクエストの例です。



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

バッチ文字起こしジョブ (AWS CLI) で、スピーカーパーティショニングを有効にする

以下のコードを実行します。



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

医療用カスタム語彙のテキストファイルを作成する

医療用カスタム語彙を使用した音声ファイルの文字起こし