本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
轉錄醫療聽寫的音訊檔案
使用批次轉錄作業以轉錄醫療對話的音訊檔案。您可以使用此以轉錄臨床醫生與患者的對話。您可以使用 StartMedicalTranscriptionJob API 或 AWS Management Console開始批次轉錄作業。
您使用 StartMedicalTranscriptionJob API 開始醫學轉錄作業時,請指定 PRIMARYCARE 為Specialty 參數的值。
轉錄臨床醫生與患者的對話 (AWS Management Console)
若要使用 AWS Management Console 轉錄臨床醫生-患者對話,請建立轉錄任務,然後選擇音訊輸入類型的對話。
-
在導覽窗格的 Amazon Transcribe Medical 下,選擇轉錄任務。
-
選擇建立作業。
-
在指定作業詳細資訊頁面的工作設定下,指定下列項目。
-
名稱 — 轉錄作業的名稱。
-
音訊輸入類型 — 聽寫
-
-
針對其餘欄位,指定音訊檔案 Amazon S3 的位置,以及您要存放轉錄任務輸出的位置。
-
選擇 Next (下一步)。
-
選擇建立。
使用批次轉錄作業 (API) 轉錄醫療對話
-
對於
StartMedicalTranscriptionJobAPI,請指定以下項目。-
對於
MedicalTranscriptionJobName,請指定 AWS 帳戶的唯一名稱。 -
對於
LanguageCode,請指定與音訊檔案中所說的語言對應的語言代碼,以及詞彙篩選語言對應的語言。 -
在
Media對象的MediaFileUri參數中,指定您要轉錄的音訊檔案名稱。 -
對於
Specialty,請指定在音訊檔案中說話的臨床醫生的醫療專科。 -
對於
Type,請指定DICTATION。 -
對於
OutputBucketName,指定 Amazon S3 儲存貯體以存放轉錄結果。
以下是使用 適用於 Python (Boto3) 的 AWS SDK 來轉錄
PRIMARYCARE專科中臨床醫生醫療口述的範例請求。from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
下列範例程式碼顯示醫療聽寫的轉錄結果。
{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ {..."start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ]...}, "status": "COMPLETED" }
在批次轉錄作業中啟用發言者分隔 (AWS CLI)
-
執行下列程式碼。
aws transcribe start-medical-transcription-job \ --regionus-west-2\ --cli-input-json file://example-start-command.json下列程式碼顯示
example-start-command.json的內容。{ "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }