Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Identificación de la PHI en un archivo de audio
Utilice un trabajo de transcripción por lotes para transcribir archivos de audio e identificar la información médica protegida (PHI) que contienen. Cuando se activa la identificación de información médica protegida (PHI), Amazon Transcribe Medical etiqueta la PHI que se identificó en los resultados de la transcripción. Para obtener información sobre la PHI que Amazon Transcribe Medical puede identificar, consulte Identificación de información médica protegida (PHI) en una transcripción.
Puede iniciar un trabajo de transcripción por lotes en la API de StartMedicalTranscriptionJob o en Consola de administración de AWS.
Para usar Consola de administración de AWS para transcribir un diálogo entre el médico y el paciente, cree un trabajo de transcripción y elija Conversación como Tipo de entrada de audio.
Para transcribir un archivo de audio e identificar su PHI (Consola de administración de AWS)
-
Inicie sesión en Consola de administración de AWS
. -
En el panel de navegación, en Amazon Transcribe Medical, elija Trabajos de transcripción.
-
Seleccione Crear trabajo.
-
En la página Especificar detalles de la base de datos, en Configuración del trabajo, especifique las opciones siguientes.
-
Nombre: el nombre del trabajo de transcripción que es exclusivo para su Cuenta de AWS.
-
Tipo de entrada de audio: conversación o Dictado.
-
-
Para el resto de los campos, especifique la ubicación de Amazon S3 del archivo de audio y dónde desea almacenar el resultado del trabajo de transcripción.
-
Elija Siguiente.
-
En Configuración de audio, seleccione Identificación PHI.
-
Seleccione Crear.
Para transcribir un archivo de audio e identificar su PHI mediante un trabajo de transcripción por lotes (API)
-
Para la API
StartMedicalTranscriptionJob, especifique lo siguiente.-
Para
MedicalTranscriptionJobName, especifique un nombre que sea exclusivo de su Cuenta de AWS. -
Para
LanguageCode, especifique el código de idioma que corresponda al idioma hablado en el archivo de audio. -
En el parámetro
MediaFileUridel objetoMedia, especifique el nombre del archivo multimedia que desea transcribir. -
Para
Specialty, especifique la especialidad médica del profesional que habla en el archivo de audio comoPRIMARYCARE. -
En
Type, especifiqueCONVERSATIONoDICTATION. -
Para
OutputBucketName, especifique el bucket de Amazon S3 en el que desee almacenar los resultados de la transcripción.
El siguiente es un ejemplo de solicitud que utiliza AWS SDK para Python (Boto3) para transcribir un archivo de audio e identificar la PHI de un paciente.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = {'MediaFileUri': job_uri}, LanguageCode = 'en-US', ContentIdentificationType = 'PHI', Specialty = 'PRIMARYCARE', Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation. OutputBucketName = 'amzn-s3-demo-bucket' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
El siguiente código de ejemplo muestra los resultados de la transcripción con la PHI del paciente identificada.
{ "jobName": "my-medical-transcription-job-name", "accountId": "111122223333", "results": { "transcripts": [{ "transcript": "The patient's name is Bertrand." }], "items": [{ "id": 0, "start_time": "0.0", "end_time": "0.37", "alternatives": [{ "confidence": "0.9993", "content": "The" }], "type": "pronunciation" }, { "id": 1, "start_time": "0.37", "end_time": "0.44", "alternatives": [{ "confidence": "0.9981", "content": "patient's" }], "type": "pronunciation" }, { "id": 2, "start_time": "0.44", "end_time": "0.52", "alternatives": [{ "confidence": "1.0", "content": "name" }], "type": "pronunciation" }, { "id": 3, "start_time": "0.52", "end_time": "0.92", "alternatives": [{ "confidence": "1.0", "content": "is" }], "type": "pronunciation" }, { "id": 4, "start_time": "0.92", "end_time": "0.9989", "alternatives": [{ "confidence": "1.0", "content": "Bertrand" }], "type": "pronunciation" }, { "id": 5, "alternatives": [{ "confidence": "0.0", "content": "." }], "type": "punctuation" }], "entities": [{ "content": "Bertrand", "category": "PHI*-Personal*", "startTime": 0.92, "endTime": 1.2, "confidence": 0.9989 }], "audio_segments": [ { "id": 0, "transcript": "The patient's name is Bertrand.", "start_time": "0.0", "end_time": "0.9989", "items": [ 0, 1, 2, 3, 4, 5 ] } ] }, "status": "COMPLETED" }
Para transcribir un archivo de audio e identificar su PHI mediante un trabajo de transcripción por lotes (AWS CLI)
-
Ejecute el siguiente código.
aws transcribe start-medical-transcription-job \ --medical-transcription-job-namemy-medical-transcription-job-name\ --language-code en-US \ --media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \ --output-bucket-nameamzn-s3-demo-bucket\ --specialty PRIMARYCARE \ --typetype\ # ChooseCONVERSATIONto transcribe a medical conversation. ChooseDICTATIONto transcribe a medical dictation. --content-identification-type PHI