翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 文字起こしにおける個人の健康情報 (PHI) の特定
<a name="phi-id"></a>

*個人の健康情報の識別*を使用して、文字起こし結果に個人の健康情報 (PHI) にラベル付けします。ラベル付けを確認することで、患者の識別に使用できる PHI を見つけることができます。

リアルタイムストリームまたはバッチ文字起こしジョブを使用して PHI を識別できます。

独自の後処理を使用して、文字起こし出力で識別された PHI を編集できます。

個人の健康情報の識別を使用して、次のタイプの PHI を識別します。
+ 個人の PHI:
  + 名前 — 氏名または姓とイニシャル
  + 性別
  + 年齢
  + 電話番号
  + 患者に直接関係する日付 (年を含まない)
  + [E メールアドレス]
+ 地理的 PHI:
  + 物理アドレス
  + ZIP コード
  + 医療センターまたは診療所の名前
+ PHI アカウント :
  + ファックス番号
  + 社会保障番号 (SSN)
  + 健康保険受取人番号
  + 口座番号
  + 証明書/免許証番号
+ 車両 PHI:
  + 車両識別番号 (VIN)
  + ナンバープレート番号
+ その他の PHI:
  + ウェブユニフォームリソースの場所 (URL)
  + インターネットプロトコル (IP) アドレス番号

Amazon Transcribe Medical は、1996 年の医療保険の相互運用性と説明責任に関する法律 (HIPAA) の対象となるサービスです。詳細については、「[Amazon Transcribe Medical](transcribe-medical.md)」を参照してください。音声ファイル内の PHI の識別については、「[音声ファイル内の PHI の識別](phi-id-batch.md)」を参照してください。ストリーミング内の PHI の識別については、「[リアルタイムストリームでの PHI の識別](phi-id-stream.md) 」を参照してください。

**Topics**
+ [音声ファイル内の PHI の識別](phi-id-batch.md)
+ [リアルタイムストリームでの PHI の識別](phi-id-stream.md)

# 音声ファイル内の PHI の識別
<a name="phi-id-batch"></a>

バッチ文字起こしジョブを使用して、音声ファイルを書き起こし、その中の個人の健康情報 (PHI) を特定します。個人健康情報 (PHI) 識別を有効にすると、 Amazon Transcribe Medical は文字起こし結果で識別した PHI にラベルを付けます。 Amazon Transcribe Medical が識別できる PHI の詳細については、「」を参照してください[文字起こしにおける個人の健康情報 (PHI) の特定](phi-id.md)。

[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API または AWS マネジメントコンソールでバッチ文字起こしジョブを開始できます。

## AWS マネジメントコンソール
<a name="batch-med-phi-console"></a>

を使用して臨床医と患者の対話を AWS マネジメントコンソール 文字起こしするには、文字起こしジョブを作成し、**音声入力タイプの****会話**を選択します。

**音声ファイルを書き起こし、PHI (AWS マネジメントコンソール) を識別するには**

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインの Amazon Transcribe Medical で、**文字起こしジョブ**を選択します。

1. [**ジョブの作成**] を選択します。

1. [**ジョブ詳細を指定**] ページ内の [**ジョブ設定**] で次の指定を行います。

   1. **名前** – に固有の文字起こしジョブの名前 AWS アカウント。

   1. **音声入力タイプ** – [**会話**] または [**ディクテーション**]。

1. 残りのフィールドでは、音声ファイル Amazon S3 の場所と、文字起こしジョブの出力を保存する場所を指定します。

1. [**次へ**] を選択します。

1. [**音声設定**]で、[**PHI 識別**] を選択します。

1. [**作成**] を選択します。

## API
<a name="batch-med-phi-api"></a>

**バッチ文字起こしジョブ (API) を使用して音声ファイルを書き起こし、その PHI を識別するには、**
+ [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html) API では、以下のものを指定します。

  1. `MedicalTranscriptionJobName` の場合、 AWS アカウントに一意の名前を指定します。

  1. `LanguageCode` の場合、音声ファイルで話されている言語に対応する言語コードを指定します。

  1. `MediaFileUri` パラメータがある`Media` オブジェクトの場合、文字起こしを行う音声ファイルの名前を指定します。

  1. `Specialty` の場合、音声ファイルで話す臨床医の専門分野を `PRIMARYCARE` として指定します。

  1. `Type` の場合、`CONVERSATION` または `DICTATION` のいずれかを指定します。

  1. `OutputBucketName` の場合、文字起こし結果を保存する Amazon S3 バケットを指定します。

  以下は、 を使用してオーディオファイルを書き起こし、患者の PHI AWS SDK for Python (Boto3) を識別するリクエストの例です。

  ```
  from __future__ import print_function
  import time
  import boto3
  transcribe = boto3.client('transcribe')
  job_name = "my-first-transcription-job"
  job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
  transcribe.start_medical_transcription_job(
        MedicalTranscriptionJobName = job_name,
        Media = {'MediaFileUri': job_uri},
        LanguageCode = 'en-US',
        ContentIdentificationType = 'PHI',
        Specialty = 'PRIMARYCARE',
        Type = 'type', # Specify 'CONVERSATION' for a medical conversation. Specify 'DICTATION' for a medical dictation.
        OutputBucketName = 'amzn-s3-demo-bucket'
    )
  while True:
      status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
      if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
          break
      print("Not ready yet...")
      time.sleep(5)
  print(status)
  ```

次のコード例は、患者 PHI を識別した場合の文字起こし結果を示しています。

```
{
    "jobName": "my-medical-transcription-job-name",
    "accountId": "111122223333",
    "results": {
        "transcripts": [{
            "transcript": "The patient's name is Bertrand."
        }],
        "items": [{
                "id": 0,
            "start_time": "0.0",
            "end_time": "0.37",
            "alternatives": [{
                "confidence": "0.9993",
                "content": "The"
            }],
            "type": "pronunciation"
        }, {
                "id": 1,
            "start_time": "0.37",
            "end_time": "0.44",
            "alternatives": [{
                "confidence": "0.9981",
                "content": "patient's"
            }],
            "type": "pronunciation"
        }, {
                "id": 2,
            "start_time": "0.44",
            "end_time": "0.52",
            "alternatives": [{
                "confidence": "1.0",
                "content": "name"
            }],
            "type": "pronunciation"
        }, {
                "id": 3,
            "start_time": "0.52",
            "end_time": "0.92",
            "alternatives": [{
                "confidence": "1.0",
                "content": "is"
            }],
            "type": "pronunciation"
        }, {
                "id": 4,
            "start_time": "0.92",
            "end_time": "0.9989",
            "alternatives": [{
                "confidence": "1.0",
                "content": "Bertrand"
            }],
            "type": "pronunciation"
        }, {
                "id": 5,
            "alternatives": [{
                "confidence": "0.0",
                "content": "."
            }],
            "type": "punctuation"
        }],
        "entities": [{
            "content": "Bertrand",
            "category": "PHI*-Personal*",
            "startTime": 0.92,
            "endTime": 1.2,
            "confidence": 0.9989
        }],
        "audio_segments": [
            {
                "id": 0,
                "transcript": "The patient's name is Bertrand.",
                "start_time": "0.0",
                "end_time": "0.9989",
                "items": [
                    0,
                    1,
                    2,
                    3,
                    4,
                    5
                ]
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="batch-med-conversation-cli"></a>

**バッチ文字起こしジョブ (AWS CLI) を使用して音声ファイルを書き起こし、その PHI を識別するには**
+ 以下のコードを実行します。

  ```
  aws transcribe start-medical-transcription-job \
  --medical-transcription-job-name my-medical-transcription-job-name\
  --language-code en-US \
  --media MediaFileUri="s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" \
  --output-bucket-name amzn-s3-demo-bucket \
  --specialty PRIMARYCARE \
  --type type \ # Choose CONVERSATION to transcribe a medical conversation. Choose DICTATION to transcribe a medical dictation.
  --content-identification-type PHI
  ```

# リアルタイムストリームでの PHI の識別
<a name="phi-id-stream"></a>

HTTP/2 ストリーミングまたは WebSocket ストリーミングのいずれかで、個人の健康情報 (PHI) を識別できます。PHI 識別をアクティブ化すると、 Amazon Transcribe Medical は文字起こし結果で識別した PHI にラベルを付けます。 Amazon Transcribe Medical が識別できる PHI の詳細については、「」を参照してください[文字起こしにおける個人の健康情報 (PHI) の特定](phi-id.md)。


## マイクで話されるディクテーションで PHI を識別する
<a name="console-stream-phi"></a>

を使用してマイクによって取得された音声 AWS マネジメントコンソール を文字起こししし、PHI を特定するには、オーディオ入力タイプとして**ディクテーション**を選択し、ストリームを開始し、コンピュータのマイクで話し始めます。

**を使用してディクテーション内の PHI を識別するには AWS マネジメントコンソール**

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**リアルタイム文字起こし**] を選択します。

1. [**音声入力タイプ**] で、[**ディクテーション**] を選択します。

1. **追加設定**の場合、[**PHI の識別**] を選択します。

1. [**ストリーミングの開始**] を選択し、マイクに向かって話してください。

1. [**ストリーミングの停止**] を選択すると、ディクテーションが終了します。

## HTTP/2 ストリーミング内の PHI の識別
<a name="http2-stream-phi"></a>

PHI 識別をアクティブにして HTTP/2 ストリーミングを開始するには、[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) API を使用し、以下を指定してください。
+ `LanguageCode` の場合、ストリーミング内の言語に対応する言語コードを指定してください。米国英語の場合は、[`en-US`] を指定してください。
+ `MediaSampleHertz` の場合、音声のサンプルレートを指定します。
+ `content-identification-type` の場合、`PHI` を指定します。

## WebSocket ストリーミング内の PHI の識別
<a name="websocket-phi-id"></a>

 PHI 識別を有効にした状態で WebSocket ストリーミングを開始するには、次の形式を使用して、署名付き URL を作成します。

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256 
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request 
&X-Amz-Date=20220208T235959Z 
&X-Amz-Expires=300 
&X-Amz-Security-Token=security-token 
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host 
&language-code=en-US
&media-encoding=flac 
&sample-rate=16000 
&specialty=medical-specialty
&content-identification-type=PHI
```

パラメータ定義は [API リファレンス](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)にあります。すべての AWS API オペレーションに共通のパラメータは、[「共通パラメータ](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)」セクションに記載されています。