

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在实时音频流中编辑或识别 PII
<a name="pii-redaction-stream"></a>

当编辑流式转录中的个人身份信息 (PII) 时， Amazon Transcribe 会将转录中识别到的每个 PII 替换为 `[PII]`。

为流式转录提供的另一个选项是 *PII 识别*。激活 PII 识别后，会将转录结果中的 PII Amazon Transcribe 标记在对象下。`Entities`有关输出示例，请参见[经过编辑的流式转录输出示例](pii-redaction-output.md#pii-redaction-output-stream)和[PII 识别输出示例](pii-redaction-output.md#pii-redaction-output-id)。

批量转录中的 PII 编辑和识别功能支持以下方言：英语方言：苏格兰英语（`en-AB`）、澳大利亚英语（`en-AU`）、加拿大英语（`en-CA`）、英国英语（`en-GB`）、爱尔兰英语（`en-IE`）、印度英语（`en-IN`）、新西兰英语（`en-NZ`）、美国英语（`en-US`）、威尔士英语（`en-WL`）和南非英语（`en-ZA`）；西班牙语方言：美国西班牙语（`es-US`）、西班牙西班牙语（`es-ES`）；法语方言：法国法语（`fr-FR`）、加拿大法语（`fr-CA`）；葡萄牙语方言：葡萄牙葡萄牙语（`pt-PT`）、巴西葡萄牙语（`pt-BR`）；意大利语方言：意大利意大利语（`it-IT`）；德语方言：德国德语（`de-DE`）、瑞士德语（`de-CH`）。

流式转录作业的 PII 识别和编辑只有在音频片段完成转录后才会执行。


**个人身份信息的类型 Amazon Transcribe 可以识别直播转录**  

| PII 类型 | 说明 | 
| --- | --- | 
| ADDRESS | 实际地址，例如 *100 Main Street, Anytown, USA* or *Suite \#12, Building 123*。地址可以包括街道、办公大楼、地点、城市、州、国家、县、邮政编码、辖区和社区等信息。 | 
| ALL | 编辑或识别此表中列出的所有 PII 类型。 | 
| BANK\_ACCOUNT\_NUMBER | 美国银行账号。这些账号的长度通常介于 10-12 位数之间，但当只有最后 4 位数字时， Amazon Transcribe 也可以识别银行账号。 | 
| BANK\_ROUTING | 美国银行账户的路由号码。这些账号的长度通常为 9 位数，但当只有最后 4 位数字时， Amazon Transcribe 也可以识别路由号码。 | 
| CREDIT\_DEBIT\_CVV | VISA、 MasterCard、Discover 信用卡和借记卡上显示的 3 位数信用卡验证码 (CVV)。在美国运通信用卡或借记卡中，这是一个 4 位数的数字代码。 | 
| CREDIT\_DEBIT\_EXPIRY | 信用卡或借记卡的到期日期。此数字的长度通常为 4 位数字，格式为 month/year 或 MM/YY。例如， Amazon Transcribe 可以识别到期日期 *01/21*，例如*01/2021*、和 *2021 年 1 月*。 | 
| CREDIT\_DEBIT\_NUMBER | 信用卡或借记卡的号码。这些数字的长度可以从 13 到 16 位数字不等，但当只有最后 4 位数字存在时， Amazon Transcribe 也可以识别信用卡或借记卡号。 | 
| EMAIL | 电子邮件地址，例如 *efua.owusu@email.com*。 | 
| NAME | 个人的名字。此实体类型不包括头衔，例如 “先生”、“女士”、“小姐” 或 “博士”， Amazon Transcribe 不将此实体类型应用于属于组织或地址的姓名。例如，将 *John Doe 组织 Amazon Transcribe 识别为组织*，将 *Jane Doe Stre* et 识别为地址。 | 
| PHONE | 电话号码。该实体类型还包括传真号码和寻呼机号码。 | 
| PIN | 一个 4 位数的个人识别码 (PIN)，允许他人访问其银行账户信息。 | 
| SSN | 社会安全号码 (SSN) 是发给美国公民、永久居民和临时在职居民的 9 位数字。 Amazon Transcribe 当只有最后 4 位数字存在时，还可以识别社会安全号码。 | 
| AGE | 个人的年龄，包括数量和时间单位。例如，在 “我已经 40 岁了” 这句话中， Amazon Transcribe 将 “40 岁” 视为一个年龄。 | 
| DATE\_TIME | 日期可以包括年、月、日、一周中的某一天或一天中的某个时间。例如，将 “2020 年 1 月 19 日” 或 “上午 11 点” Amazon Transcribe 识别为日期。 Amazon Transcribe 将识别部分日期、日期范围和日期间隔。它还可以识别年代，例如“九十年代”。 | 
| LICENSE\_PLATE | 车辆牌照由车辆登记的所在州或国家签发。乘用车的格式通常为 5 到 8 位数，由大写字母和数字组成。格式因签发州或国家的不同而异。 | 
| PASSPORT\_NUMBER | 分配给个人护照的唯一标识符。格式通常是字母和数字的组合，并且因国家/地区而异。 | 
| PASSWORD | 用作密码的字母数字字符串，例如“\*very20special\#pass\*”。 | 
| USERNAME | 用于标识帐户的用户名，例如登录名、屏幕名称、昵称或句柄。 | 
| VEHICLE\_IDENTIFICATION\_NUMBER | 车辆识别号码 (VIN) 是车辆的唯一标识。ISO 3779 规范规定了 VIN 内容和格式。每个国家/地区都有特定的 VIN 代码和格式。 | 

您可以使用 AWS 管理控制台、 WebSocket或 HTTP/2开始直播转录。

## AWS 管理控制台
<a name="redaction-console-stream"></a>

1. 登录到 [AWS 管理控制台](https://console.aws.amazon.com/transcribe/)。

1. 在导航窗格中，选择**Real-time 转录。**向下滚动到**内容移除设置**，如果该字段已最小化，则将其展开。  
![Amazon Transcribe 控制台屏幕截图：“实时转录” 页面。](http://docs.aws.amazon.com/zh_cn/transcribe/latest/dg/images/redaction-stream1.png)

1. 开启 **PII 识别和编辑**。  
![Amazon Transcribe 控制台屏幕截图：扩展的 “内容删除设置” 面板。](http://docs.aws.amazon.com/zh_cn/transcribe/latest/dg/images/redaction-stream2.png)

1. 选择**仅限识别**或**识别和编辑**，然后在转录中选择要识别或编辑的 PII 实体类型。  
![Amazon Transcribe 控制台屏幕截图：可以选择的 PII 类型列表。](http://docs.aws.amazon.com/zh_cn/transcribe/latest/dg/images/redaction-stream3.png)

1. 您现在已准备就绪，可以转录音频流了。选择**开始流式转录**并开始讲话。要结束口述，请选择**停止流式转录**。

## WebSocket 直播
<a name="redaction-websocket"></a>

此示例创建了一个在直播中使用 PII 密文（或 PII 识别）的预签名 URL。 WebSocket 为了便于阅读，已增加了换行符。有关将 WebSocket 直播与配合使用的更多信息 Amazon Transcribe，请参阅[设置直 WebSocket 播](streaming-setting-up.md#streaming-websocket)。有关参数的更多详细信息，请参阅 [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)。

```
GET wss://transcribestreaming.{{us-west-2}}.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential={{AKIAIOSFODNN7EXAMPLE}}%2F{{20220208}}%2F{{us-west-2}}%2F{{transcribe}}%2Faws4_request
&X-Amz-Date={{20220208}}T{{235959}}Z
&X-Amz-Expires={{300}}
&X-Amz-Security-Token={{security-token}}
&X-Amz-Signature={{string}}
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code={{en-US}}
&media-encoding={{flac}}
&sample-rate={{16000}}    
&pii-entity-types={{NAME}},{{ADDRESS}}
&content-redaction-type=PII (or &content-identification-type=PII)
```

不能在同一个请求中同时使用 `content-identification-type` 和 `content-redaction-type`。

参数定义可在 [API 参考](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)中找到；所有 AWS API 操作的通用参数列在[常用参数](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)部分中。

## HTTP/2 直播
<a name="redaction-http2"></a>

此示例创建了一个启用 PII 识别或 PII 编辑功能的 HTTP/2 请求。有关将 HTTP/2 直播与配合使用的更多信息 Amazon Transcribe，请参阅[设置直 HTTP/2 播](streaming-setting-up.md#streaming-http2)。有关特定于的参数和标题的更多详细信息 Amazon Transcribe，请参阅[https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartStreamTranscription.html)。

```
POST /stream-transcription HTTP/2
host: transcribestreaming.{{us-west-2}}.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.{{StartStreamTranscription}}
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: {{string}}
X-Amz-Date: {{20220208}}T{{235959}}Z
Authorization: AWS4-HMAC-SHA256 Credential={{access-key}}/{{20220208}}/{{us-west-2}}/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature={{string}}
x-amzn-transcribe-language-code: {{en-US}}
x-amzn-transcribe-media-encoding: {{flac}}
x-amzn-transcribe-sample-rate: {{16000}}      
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII)
x-amzn-transcribe-pii-entity-types: {{{{NAME}},{{ADDRESS}}}}
transfer-encoding: chunked
```

不能在同一个请求中同时使用 `content-identification-type` 和 `content-redaction-type`。

参数定义可在 [API 参考](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_Reference.html)中找到；所有 AWS API 操作的通用参数列在[常用参数](https://docs.aws.amazon.com/transcribe/latest/APIReference/CommonParameters.html)部分中。

**注意**  
仅亚太地区（首尔）、亚太地区（悉尼）、亚太地区（悉尼）、亚太地区（东京）、加拿大（中部）、欧洲（法兰克福）、欧洲（爱尔兰）、欧洲（伦敦）、美国东部（弗吉尼亚北部）、美国东部（俄亥俄州）和美国西部（俄勒冈）支持直播个人身份信息编辑。 AWS 区域