Aktivieren der Sprecherpartitionierung bei Batch-Transkriptionen - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aktivieren der Sprecherpartitionierung bei Batch-Transkriptionen

Sie können die Sprecherpartitionierung in einem Batch-Transkriptionsauftrag entweder mit der StartMedicalTranscriptionJob-API oder mit AWS Management Console aktivieren. So können Sie den Text in einem Arzt-Patienten-Gespräch nach Sprechern aufteilen und in der Transkriptionsausgabe feststellen, wer was gesagt hat.

AWS Management Console Um die Diarisierung von Sprechern in Ihrem Transkriptionsjob zu aktivieren, aktivieren Sie zunächst die Audioidentifikation und anschließend die Sprecherpartitionierung.

  1. Melden Sie sich an der AWS Management Console an.

  2. Wählen Sie im Navigationsbereich unter Amazon Transcribe Medizinisch die Option Transkriptionsaufträge aus.

  3. Wählen Sie Job erstellen aus.

  4. Geben Sie auf der Seite Auftragsdetails angeben Informationen zu Ihrem Transkriptionsauftrag an.

  5. Wählen Sie Weiter.

  6. Aktivieren Sie die Audio-Identifikation.

  7. Wählen Sie als Audio-Identifikationstyp die Option Sprecherpartitionierung.

  8. Geben Sie bei Maximale Anzahl der Sprecher die maximale Anzahl der Sprecher ein, die Ihrer Meinung nach in Ihrer Audiodatei sprechen.

  9. Wählen Sie Create (Erstellen) aus.

So aktivieren Sie die Sprecherpartitionierung in einem Batch-Transkriptionsauftrag (API)
  • Für die StartMedicalTranscriptionJob-API geben Sie Folgendes an.

    1. Geben Sie unter MedicalTranscriptionJobNameeinen Namen an, der in Ihrem AWS-Konto eindeutig ist.

    2. Geben Sie unter LanguageCode den Sprachcode an, der der Sprache entspricht, die in der Audiodatei gesprochen wird.

    3. Geben Sie unter MediaFileUri-Parameter des Media-Objekts den Namen der Audiodatei an, die Sie transkribieren möchten.

    4. Unter Specialty können Sie das medizinische Fachgebiet des Arztes angeben, der in der Audiodatei spricht.

    5. Legen Sie für Type die Option CONVERSATION fest.

    6. Geben Sie für den Amazon S3 Bucket anOutputBucketName, in dem die Transkriptionsergebnisse gespeichert werden sollen.

    7. Für das Settings-Objekt geben Sie Folgendes an.

      1. ShowSpeakerLabelstrue.

      2. MaxSpeakerLabels – Eine ganze Zahl zwischen 2 und 10, um die Anzahl der Sprecher anzugeben, von denen Sie glauben, dass sie in Ihrem Audio sprechen.

Die folgende Anfrage verwendet den AWS SDK für Python (Boto3) , um einen Batch-Transkriptionsauftrag für einen Patientendialog mit einem Arzt in der Grundversorgung zu starten, wobei die Lautsprecherpartitionierung aktiviert ist.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'amzn-s3-demo-bucket', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Der folgende Beispielcode zeigt die Transkriptionsergebnisse eines Transkriptionsauftrags mit aktivierter Sprecherpartitionierung.

{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Transkription einer Audiodatei eines Gesprächs zwischen einem Arzt, der in der Grundversorgung tätig ist, und einem Patienten (AWS CLI)
  • Führen Sie folgenden Code aus.

    aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    Der folgende Code zeigt den Inhalt von example-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }