기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 오디오 파일에서 PHI 식별
<a name="phi-id-batch"></a>

배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 그 안에 있는 개인 건강 정보(PHI)를 식별할 수 있습니다. 개인 건강 정보(PHI) 식별을 활성화하면 Amazon Transcribe Medical은 트랜스크립션 결과에서 식별한 PHI에 레이블을 지정합니다. Amazon Transcribe Medical에서 식별할 수 있는 PHI에 대한 자세한 내용은 섹션을 참조하세요[트랜스크립션의 개인 건강 정보(PHI) 식별](phi-id.md).

[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API 또는 AWS Management Console을 사용하여 배치 트랜스크립션 작업을 시작할 수 있습니다.

## AWS Management Console
<a name="batch-med-phi-console"></a>

 AWS Management Console 를 사용하여 임상의-환자 대화를 트랜스크립션하려면 트랜스크립션 작업을 생성하고 **오디오 입력 유형에** 대한 **대화를** 선택합니다.

**오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(AWS Management Console)**

1. [AWS Management Console](https://console.aws.amazon.com/transcribe/)에 로그인합니다.

1. 탐색 창의 Amazon Transcribe Medical에서 **트랜스크립션 작업을** 선택합니다.

1. **작업 생성**을 선택합니다.

1. **DB 세부 정보 지정** 페이지의 **작업 설정**에서 다음을 지정합니다.

   1. **이름** - 고유한 트랜스크립션 작업의 이름입니다 AWS 계정.

   1. **오디오 입력 유형** – **대화** 또는 **구술**.

1. 나머지 필드에는 오디오 파일의 Amazon S3 위치와 트랜스크립션 작업의 출력을 저장할 위치를 지정합니다.

1. **다음**을 선택합니다.

1. **오디오 설정**에서 **PHI 식별**을 선택합니다.

1. **생성(Create)**을 선택합니다.

## API
<a name="batch-med-phi-api"></a>

**배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 해당 PHI를 식별하려면(API)**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API의 경우 다음을 지정하세요.

  1. `MedicalTranscriptionJobName`에서 AWS 계정의 고유한 이름을 지정합니다.

  1. `LanguageCode`에는 오디오 파일에서 사용하는 언어에 해당하는 언어 코드를 지정합니다.

  1. `Media` 객체의 `MediaFileUri` 파라미터에서 트랜스크립션할 오디오 파일의 이름을 지정합니다.

  1. `Specialty`에는 오디오 파일에서 말하는 임상의의 전문 분야를 `PRIMARYCARE`로 지정합니다.

  1. `Type`에서 `CONVERSATION` 또는 `DICTATION`를 지정합니다.

  1. `OutputBucketName`에서 트랜스크립션 결과를 저장할 Amazon S3 버킷을 지정합니다.

  다음은를 사용하여 오디오 파일을 AWS SDK for Python (Boto3) 트랜스크립션하고 환자의 PHI를 식별하는 요청의 예입니다.

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe')
  job_name = "my-first-transcription-job"
  job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {'MediaFileUri': job_uri},
        LanguageCode = 'en-US',
        ContentIdentificationType = 'PHI',
        Specialty = 'PRIMARYCARE',
        Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
        OutputBucketName = 'amzn-s3-demo-bucket'
    )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

다음 예시 코드는 환자 PHI를 식별한 트랜스크립션 결과를 보여줍니다.

```
{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**배치 트랜스크립션 작업을 사용하여 오디오 파일을 트랜스크립션하고 PHI를 식별하려면(AWS CLI)**
+ 다음 코드를 실행합니다.

  ```
  aws transcribe start-medical-transcription-job \
  --medical-transcription-job-name my-medical-transcription-job-name\
  --language-code en-US \
  --media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \
  --output-bucket-name amzn-s3-demo-bucket \
  --specialty PRIMARYCARE \
  --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
  --content-identification-type PHI
  ```