

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Identification des PHI dans un fichier audio
<a name="phi-id-batch"></a>

Utilisez une tâche de transcription par lots pour transcrire des fichiers audio et identifier les renseignements personnels sur la santé (PHI) qu’ils contiennent. Lorsque vous activez l'identification par les informations de santé personnelles (PHI), Amazon Transcribe Medical étiquette le PHI identifié dans les résultats de transcription. Pour plus d'informations sur le PHI que Amazon Transcribe Medical peut identifier, consultez[Identification des renseignements personnels sur la santé (PHI) dans une transcription](phi-id.md).

Vous pouvez démarrer une tâche de transcription par lots à l’aide de l’API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) ou de la AWS Management Console.

## AWS Management Console
<a name="batch-med-phi-console"></a>

**Pour utiliser le AWS Management Console pour transcrire un dialogue clinicien-patient, créez une tâche de transcription et choisissez le type d'entrée **Conversation for Audio**.**

**Pour transcrire un fichier audio et identifier ses PHI (AWS Management Console)**

1. Connectez-vous à la [AWS Management Console](https://console.aws.amazon.com/transcribe/).

1. Dans le volet de navigation, sous Amazon Transcribe Medical, sélectionnez **Transcription jobs**.

1. Choisissez **Créer une tâche**.

1. Sur la page **Spécifier les détails de la tâche**, sous **Paramètres de la tâche**, indiquez les valeurs suivantes :

   1. **Nom** — Le nom de la tâche de transcription qui est propre à votre Compte AWS.

   1. **Type d’entrée audio** – **Conversation** ou **Dictée**.

1. Pour les autres champs, spécifiez l' Amazon S3 emplacement de votre fichier audio et l'endroit où vous souhaitez stocker le résultat de votre travail de transcription.

1. Choisissez **Suivant**.

1. Sous **Paramètres audio**, choisissez **Identification des PHI**.

1. Choisissez **Créer**.

## API
<a name="batch-med-phi-api"></a>

**Pour transcrire un fichier audio et identifier ses PHI à l’aide d’une tâche de transcription par lots (API)**
+ Pour l’API [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html), spécifiez ce qui suit.

  1. Pour `MedicalTranscriptionJobName`, spécifiez un nom unique pour votre Compte AWS.

  1. Pour `LanguageCode`, spécifiez le code de langue correspondant à la langue parlée dans votre fichier audio.

  1. Pour le paramètre `MediaFileUri` de l’objet `Media`, spécifiez le nom du fichier audio que vous souhaitez transcrire.

  1. Pour `Specialty`, indiquez `PRIMARYCARE` comme spécialité médicale du médecin qui parle dans le fichier audio.

  1. Pour `Type`, spécifiez `CONVERSATION` ou `DICTATION`.

  1. Pour `OutputBucketName`, spécifiez le compartiment Amazon S3 dans lequel stocker les résultats de transcription.

  Voici un exemple de demande qui utilise le AWS SDK pour Python (Boto3) pour transcrire un fichier audio et identifier le PHI d'un patient.

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe')
  job_name = "{{my-first-transcription-job}}"
  job_uri = "s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-audio-file}}.{{flac}}"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {'MediaFileUri': job_uri},
        LanguageCode = 'en-US',
        ContentIdentificationType = 'PHI',
        Specialty = 'PRIMARYCARE',
        Type = '{{type}}', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
        OutputBucketName = '{{amzn-s3-demo-bucket}}'
    )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

L’exemple de code suivant montre les résultats de transcription avec les PHI du patient identifiés.

```
{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**Pour transcrire un fichier audio et identifier les PHI à l’aide d’une tâche de transcription par lots (AWS CLI)**
+ Exécutez le code suivant.

  ```
  aws transcribe start-medical-transcription-job \
  --medical-transcription-job-name {{my-medical-transcription-job-name}}\
  --language-code en-US \
  --media MediaFileUri="s3://{{amzn-s3-demo-bucket}}/{{my-input-files}}/{{my-audio-file}}.{{flac}}" \
  --output-bucket-name {{amzn-s3-demo-bucket}} \
  --specialty PRIMARYCARE \
  --type {{type}} \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
  --content-identification-type PHI
  ```