

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# バッチジョブで PII を編集する
<a name="pii-redaction-batch"></a>

バッチ文字起こしジョブ中に文字起こしから個人を特定できる情報 (PII) を編集すると、 は、識別された PII の各インスタンスを文字起こしの本文`[PII]`の Amazon Transcribe に置き換えます。また、文字起こし出力の単語ごとの部分で、編集された PII の種類を表示することもできます。出力サンプルについては、「[編集された出力例 (バッチ)](pii-redaction-output.md#pii-redaction-output-batch)」を参照してください。

米国英語 (`en-US`) および英国スペイン語 (`es-US`) では、バッチ文字起こしによるリダクションが可能です。リダクションは[言語識別](lang-id-batch.md)と互換性がありません。

秘匿化されたトランスクリプトと秘匿化されていないトランスクリプトの両方が同じ出力 Amazon S3 バケットに保存されます。 は、指定したバケット、またはサービスによって管理されるデフォルトの Amazon S3 バケットにトランスクリプト Amazon Transcribe を保存します。


**バッチ文字起こしで認識 Amazon Transcribe できる PII のタイプ**  

| PII タイプ | 説明 | 
| --- | --- | 
| ADDRESS | 実際の住所、*米国、エニータウン市。メインストリート 100 番地*や、*ビル 123 番、スイート 12 番*など。住所には、通り、ビル、場所、市区町村、州、国、郡、郵便番号、管区、近隣などを含めることができます。  | 
| ALL | この表に記載されているすべての PII のタイプを編集または特定します。 | 
| BANK\$1ACCOUNT\$1NUMBER | 米国の銀行口座番号 この番号は通常 10～12 桁の長さですが、 Amazon Transcribe は下 4 桁のみの銀行口座番号も認識します。 | 
| BANK\$1ROUTING | 米国の銀行口座の支店コード この番号は通常 9 桁の長さですが、 Amazon Transcribe は下 4 桁のみの支店コードも認識します。 | 
| CREDIT\$1DEBIT\$1CVV | VISA、MasterCard、Discover のクレジットカードとデビットカードに記載されている 3 桁のカード確認コード (CVV)。American Express のクレジットカードまたはデビットカードでは、4 桁の数字コードです。 | 
| CREDIT\$1DEBIT\$1EXPIRY | クレジットカードまたはデビットカードの有効期限日 この番号は通常 4 桁で、「月/年」または「MM/YY」という形式になっています。たとえば、 は *01/21*、*01/2021*、Jan *202*1 などの有効期限を認識 Amazon Transcribe できます。 | 
| CREDIT\$1DEBIT\$1NUMBER | クレジットカードまたはデビットカードの番号。これらの番号の長さは 13 桁から 16 桁までさまざまですが、最後の 4 桁のみが存在する場合はクレジットカード番号またはデビットカード番号 Amazon Transcribe も認識されます。 | 
| EMAIL | *efua.owusu@email.com* などのメールアドレス。 | 
| NAME | 個人の名前。このエンティティタイプには、Mr.、Mrs.、Miss、Dr. Amazon Transcribe などのタイトルは含まれません。このエンティティタイプは、組織または住所の一部である名前には適用されません。例えば、 は *John Doe Organization* を組織として認識し、*Jane Doe Street* を住所として Amazon Transcribe 認識します。 | 
| PHONE | 電話番号 このエンティティタイプには、ファックス番号とポケットベル番号も含まれます。 | 
| PIN | 銀行口座情報へのアクセスを可能にする 4 桁の個人識別番号 (PIN)。 | 
| SSN | 社会保障番号 (SSN) は、米国市民、永住者、一時的な労働居住者に発行される 9 桁の番号です。 は、最後の 4 桁のみが存在する場合に社会保障番号 Amazon Transcribe も認識します。 | 

バッチ文字起こしジョブは AWS マネジメントコンソール、、 AWS CLI、または AWS SDK を使用して開始できます。

## AWS マネジメントコンソール
<a name="redaction-console-batch"></a>

1. [AWS マネジメントコンソール](https://console.aws.amazon.com/transcribe/) にサインインします。

1. ナビゲーションペインで、[**文字起こしジョブ**] を選択後、[**ジョブの作成**] (右上) を選択します。これにより、**ジョブの詳細を指定** ページが開きます。

1. **ジョブの詳細を指定する** ページで必要な項目を入力したら、[**次へ**] を選択して、**ジョブの設定 - *オプション*** ページに進みます。ここには **PII リダクション**切り替えが付いた**コンテンツ削除**パネルがあります。  
![\[Amazon Transcribe コンソールのスクリーンショット: 「ジョブの設定」ページの「コンテンツ削除ペイン」。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/content-redact.png)

1. [**PII リダクション**] を選択すると、編集したいすべての PII タイプを選択するオプションがあります。「**未編集のトランスクリプトをジョブ出力に含める**」ボックスを選択した場合は、未編集のトランスクリプトを選択することもできます。  
![\[Amazon Transcribe コンソールのスクリーンショット: PII オプションを示す「コンテンツの削除」ペイン。\]](http://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/images/content-redact-select.png)

1. **[ジョブの作成]** を選択して、文字起こしジョブを実行します。

## AWS CLI
<a name="redaction-cli"></a>

この例では、[start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) コマンドと `content-redaction` パラメータを使用します。詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)」および「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html)」を参照してください。

```
aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--content-redaction  RedactionType=PII,RedactionOutput=redacted,PiiEntityTypes=NAME,ADDRESS,BANK_ACCOUNT_NUMBER
```

以下は [start-transcription-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/transcribe/start-transcription-job.html) メソッドを使用した別の例で、リクエストボディはそのジョブの PII を編集します。

```
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-redaction-job.json
```

ファイル *my-first-redaction-job.json* には、次のリクエストボディが含まれています。

```
{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
      "MediaFileUri":  "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "ContentRedaction": {
      "RedactionOutput":"redacted",
      "RedactionType":"PII",
      "PiiEntityTypes": [
           "NAME",
           "ADDRESS",
           "BANK_ACCOUNT_NUMBER"	
      ]
  }
}
```

## AWS SDK for Python (Boto3)
<a name="redaction-python-batch"></a>

この例では AWS SDK for Python (Boto3) 、 を使用して[、start\$1transcription\$1job](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/transcribe.html#TranscribeService.Client.start_transcription_job) メソッドの `ContentRedaction`引数を使用してコンテンツを編集します。詳細については、「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartTranscriptionJob.html)」および「[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_ContentRedaction.html)」を参照してください。

機能固有の例、シナリオ例、クロスサービス例など、 AWS SDKs[SDK を使用した Amazon Transcribe のコード例 AWS SDKs](service_code_examples.md)「」の章を参照してください。

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    ContentRedaction = { 
        'RedactionOutput':'redacted',
        'RedactionType':'PII', 
        'PiiEntityTypes': [
            'NAME','ADDRESS','BANK_ACCOUNT_NUMBER'
        ]
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

**注記**  
バッチジョブの PII リダクションは、アジア AWS リージョンパシフィック (香港）、アジアパシフィック (ムンバイ）、アジアパシフィック (ソウル）、アジアパシフィック (シンガポール）、アジアパシフィック (シドニー）、アジアパシフィック (東京）、 GovCloud (米国西部）、カナダ (中部）、欧州 (フランクフルト）、欧州 (アイルランド）、欧州 (ロンドン）、欧州 (パリ）、中東 (バーレーン）、南米 (サンパウロ）、米国東部 (バージニア北部）、米国東部 (オハイオ）、米国西部 (オレゴン）、および米国西部 (北カリフォルニア) でのみサポートされています。