Identificación de la PHI en un archivo de audio

Utilice un trabajo de transcripción por lotes para transcribir archivos de audio e identificar la información médica protegida (PHI) que contienen. Cuando activa la identificación de información de salud personal (PHI), Amazon Transcribe Medical etiqueta la PHI que identificó en los resultados de la transcripción. Para obtener información sobre la PHI que el Amazon Transcribe médico puede identificar, consulteIdentificación de información médica protegida (PHI) en una transcripción.

Puede iniciar un trabajo de transcripción por lotes en la API de StartMedicalTranscriptionJob o en Consola de administración de AWS.

Para usar el Consola de administración de AWS para transcribir un diálogo entre el médico y el paciente, cree un trabajo de transcripción y seleccione Conversación como tipo de entrada de audio.

Para transcribir un archivo de audio e identificar su PHI (Consola de administración de AWS)

Inicie sesión en la Consola de administración de AWS.
En el panel de navegación, en Amazon Transcribe Medicina, seleccione Trabajos de transcripción.
Seleccione Crear trabajo.
En la página Especificar detalles del trabajo, en Configuración del trabajo, especifique lo siguiente.
1. Nombre: el nombre del trabajo de transcripción que es exclusivo para usted Cuenta de AWS.
2. Tipo de entrada de audio: conversación o Dictado.
Para el resto de los campos, especifique la Amazon S3 ubicación del archivo de audio y dónde desea almacenar el resultado del trabajo de transcripción.
Elija Siguiente.
En Configuración de audio, seleccione Identificación PHI.
Seleccione Crear.

Para transcribir un archivo de audio e identificar su PHI mediante un trabajo de transcripción por lotes (API)

Para la API StartMedicalTranscriptionJob, especifique lo siguiente.

Para MedicalTranscriptionJobName, especifique un nombre que sea exclusivo de su Cuenta de AWS.
Para LanguageCode, especifique el código de idioma que corresponda al idioma hablado en el archivo de audio.
En el parámetro MediaFileUri del objeto Media, especifique el nombre del archivo multimedia que desea transcribir.
Para Specialty, especifique la especialidad médica del profesional que habla en el archivo de audio como PRIMARYCARE.
En Type, especifique CONVERSATION o DICTATION.
Para OutputBucketName, especifique el bucket de Amazon S3 en el que desee almacenar los resultados de la transcripción.

El siguiente es un ejemplo de solicitud que utiliza el AWS SDK para Python (Boto3) para transcribir un archivo de audio e identificar la PHI de un paciente.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
transcribe.start_medical_transcription_job(
      MedicalTranscriptionJobName = job_name,
      Media = {'MediaFileUri': job_uri},
      LanguageCode = 'en-US',
      ContentIdentificationType = 'PHI',
      Specialty = 'PRIMARYCARE',
      Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
      OutputBucketName = 'amzn-s3-demo-bucket'
  )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

El siguiente código de ejemplo muestra los resultados de la transcripción con la PHI del paciente identificada.



{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}

Para transcribir un archivo de audio e identificar la PHI mediante un trabajo de transcripción por lotes (AWS CLI)

Ejecute el siguiente código.


aws transcribe start-medical-transcription-job \
--medical-transcription-job-name my-medical-transcription-job-name\
--language-code en-US \
--media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \
--output-bucket-name amzn-s3-demo-bucket \
--specialty PRIMARYCARE \
--type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
--content-identification-type PHI

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Identificar la PHI en una transcripción

Identificar la PHI en una secuencia en tiempo real