

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 检测 PHI
<a name="textanalysis-phi"></a>

如果在扫描临床文本时只想检测受保护健康信息 (PHI) 数据，请使用 **DetectPHI** 操作。要检测临床文本中的所有可用实体，请使用 **DetectEntitiesV2**。

本 API 最适合只需要检测 PHI 实体的使用场景。要了解非 PHI 类别的信息，请参阅[检测实体（版本 2）](textanalysis-entitiesv2.md)。

**重要**  
 Amazon Comprehend Medical 提供置信度分数，该分数表明对检测到的实体的准确性的信心。请评估这些置信度分数，为您的使用场景确定正确的置信度阈值。对于特定的合规使用场景，我们建议您通过额外的人工审查或其他方法来确认检测到的 PHI 的准确性。

根据 HIPAA 法案，我们必须特别谨慎对待与 18 个标识符对应的 PHI。Amazon Comprehend Medical 会检测与这些标识符关联的实体，但这些实体并不会与 Safe Harbor 方法指定的列表一一对应。并非所有标识符都包含在非结构化临床文本中，但是 Amazon Comprehend Medical 能够检测所有相关的标识符。这些标识符由可用于识别患者身份的数据组成，显示在以下列表中。有关更多信息，请参阅*美国政府卫生与公共服务网站*上的[健康信息隐私](https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html)。

每个 PHI 相关实体都包含一个分数（响应中的 `Score`），用来表明 Amazon Comprehend Medical 对检测准确性的置信度。请为您的使用场景确定正确的置信度阈值，并筛选出不符合阈值的实体。在识别 PHI 时，最好使用低置信度阈值进行筛选，以便检测到更多实体。在合规使用场景中不使用检测到的实体的值时，这一点尤其重要。

**通过运行 **detectPhi 或 DetectEntities V2 操作可以检测到以下与 PHI** 相关的实体：**


**检测到的 PHI 实体**  

|  实体  |  说明  |  HIPAA 类别  | 
| --- | --- | --- | 
|  AGE  |  临床记录中提及的患者、家属或其他人的所有年龄信息、年龄范围或任何年龄。除非另有说明，否则默认单位为岁。  |  3. 与个人相关的日期  | 
| DATE | 与患者或患者护理相关的任何日期。 | 3. 与个人相关的日期 | 
|  NAME  |  临床记录中提及的所有姓名，通常属于患者、家属或提供者。  |  1. 姓名  | 
|  PHONE\$1OR\$1FAX  |  任何电话、传真、寻呼机号码；不包括指定电话号码，例如 1-800-QUIT-NOW 和 911。  |  4. Phone number（电话号码） 5. 传真号码  | 
|  EMAIL  |  任何电子邮件地址。  |  6. 电子邮件地址  | 
|  ID  |  与患者身份相关的任何数字。其中包括其社会保障号码、病历号、机构识别号、临床试验号、证书或执照号、车辆或设备号。还包括生物识别数字以及识别护理地点或提供者的数字。  |  7. 社会保障号码  8. 病历号 9. 健康计划号码 10. 账户号码 11。 Certificate/License 数字 12. 车辆识别号 13. 设备号 16. 生物识别信息 18。任何其他识别特征  | 
|  URL  |  任何网址。  |  14。 URLs  | 
|  ADDRESS  |  其中包括任何机构、指定医疗机构或机构内的病房的地址的所有地理细分信息。  |  2. 地理位置  | 
|  PROFESSION  |  包括临床记录中提及的与患者或患者家属有关的任何职业或雇主。  |  18。任何其他识别特征  | 



**示例**  


文本“病人名叫 John Smith，是一位 48 岁的教师，居住在华盛顿州西雅图。” 返回：
+ “John Smith”是 `PROTECTED_HEALTH_INFORMATION` 类别中的 `NAME` 类型的*实体*。
+ “48”是 `PROTECTED_HEALTH_INFORMATION` 类别中的 `AGE` 类型的*实体*。
+ “教师”是 `PROTECTED_HEALTH_INFORMATION` 类别中的 `PROFESSION` 类型（识别特征）的*实体*。
+ “华盛顿州西雅图”是 `PROTECTED_HEALTH_INFORMATION` 类别中的 `ADDRESS` *实体*。

在 Amazon Comprehend Medical 控制台中，其显示方式如下：

![\[Patient information card displaying name, age, profession, and address details.\]](http://docs.aws.amazon.com/zh_cn/comprehend-medical/latest/dev/images/patient.png)


使用 **DetectPHI** 操作时，响应如下所示。当您使用 “**启动作PHIDetection业**” 操作时，Amazon Comprehend Medical 会在输出位置创建一个具有这种结构的文件。

```
{
    "Entities": [
        {
            "Id": 0,
            "BeginOffset": 11,
            "EndOffset": 21,
            "Score": 0.997368335723877,
            "Text": "John Smith",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "NAME",
            "Traits": []
        },
        {
            "Id": 1,
            "BeginOffset": 25,
            "EndOffset": 27,
            "Score": 0.9998362064361572,
            "Text": "48",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "AGE",
            "Traits": []
        },
        {
            "Id": 2,
            "BeginOffset": 37,
            "EndOffset": 44,
            "Score": 0.8661606311798096,
            "Text": "teacher",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "PROFESSION",
            "Traits": []
        },
        {
            "Id": 3,
            "BeginOffset": 61,
            "EndOffset": 68,
            "Score": 0.9629441499710083,
            "Text": "Seattle",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        },
        {
            "Id": 4,
            "BeginOffset": 78,
            "EndOffset": 88,
            "Score": 0.38217034935951233,
            "Text": "Washington",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        }
    ],
    "UnmappedAttributes": []
}
```