Aktivieren der Sprecherpartitionierung bei Batch-Transkriptionen

Sie können die Sprecherpartitionierung in einem Batch-Transkriptionsauftrag entweder mit der StartMedicalTranscriptionJob-API oder mit AWS-Managementkonsole aktivieren. So können Sie den Text in einem Arzt-Patienten-Gespräch nach Sprechern aufteilen und in der Transkriptionsausgabe feststellen, wer was gesagt hat.

AWS-Managementkonsole Um die Diarisierung von Sprechern in Ihrem Transkriptionsjob zu aktivieren, aktivieren Sie zunächst die Audioidentifikation und anschließend die Sprecherpartitionierung.

Melden Sie sich an der AWS-Managementkonsole an.
Wählen Sie im Navigationsbereich unter Amazon Transcribe Medizinisch die Option Transkriptionsaufträge aus.
Wählen Sie Job erstellen aus.
Geben Sie auf der Seite Auftragsdetails angeben Informationen zu Ihrem Transkriptionsauftrag an.
Wählen Sie Weiter aus.
Aktivieren Sie die Audio-Identifikation.
Wählen Sie als Audio-Identifikationstyp die Option Sprecherpartitionierung.
Geben Sie bei Maximale Anzahl der Sprecher die maximale Anzahl der Sprecher ein, die Ihrer Meinung nach in Ihrer Audiodatei sprechen.
Wählen Sie Erstellen aus.

So aktivieren Sie die Sprecherpartitionierung in einem Batch-Transkriptionsauftrag (API)

Für die StartMedicalTranscriptionJob-API geben Sie Folgendes an.
1. Geben Sie unter MedicalTranscriptionJobNameeinen Namen an, der in Ihrem AWS-Konto eindeutig ist.
2. Geben Sie unter LanguageCode den Sprachcode an, der der Sprache entspricht, die in der Audiodatei gesprochen wird.
3. Geben Sie unter MediaFileUri-Parameter des Media-Objekts den Namen der Audiodatei an, die Sie transkribieren möchten.
4. Unter Specialty können Sie das medizinische Fachgebiet des Arztes angeben, der in der Audiodatei spricht.
5. Legen Sie für Type die Option CONVERSATION fest.
6. Geben Sie für den Amazon S3 Bucket anOutputBucketName, in dem die Transkriptionsergebnisse gespeichert werden sollen.
7. Für das Settings-Objekt geben Sie Folgendes an.
  1. ShowSpeakerLabels – true.
  2. MaxSpeakerLabels – Eine ganze Zahl zwischen 2 und 10, um die Anzahl der Sprecher anzugeben, von denen Sie glauben, dass sie in Ihrem Audio sprechen.

Die folgende Anfrage verwendet die AWS SDK für Python (Boto3) , um einen Batch-Transkriptionsjob für einen Patientendialog mit einem Arzt in der Grundversorgung zu starten, wobei die Lautsprecherpartitionierung aktiviert ist.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'amzn-s3-demo-bucket',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Der folgende Beispielcode zeigt die Transkriptionsergebnisse eines Transkriptionsauftrags mit aktivierter Sprecherpartitionierung.



{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}

Um eine Audiodatei eines Gesprächs zwischen einem Arzt, der in der Grundversorgung tätig ist, und einem Patienten zu transkribieren (AWS CLI)

Führen Sie folgenden Code aus.



                    
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

Der folgende Code zeigt den Inhalt von example-start-command.json.


{
    "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
     "Media": {
          "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "amzn-s3-demo-bucket",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",
      "Specialty": "PRIMARYCARE",
      "Type": "CONVERSATION",
      "Settings":{
          "ShowSpeakerLabels": true,
          "MaxSpeakerLabels": 2
        }
}

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Aktivieren der Sprecherpartitionierung

Partitionierung von Sprechern in Echtzeit-Streams