

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 要避免的标记实践
<a name="tagging-practices-to-avoid"></a>

虽然在 AWS 上标记对象或基础设施时需要实施一些实践，但也需要避免一些实践。

## 不一致的标记
<a name="inconsistent"></a>

如[目标](objectives.md)一节所述，如果没有标记，就无法实现高水平的自动化、清理或监控。同样，如果标签不完整或不一致，自动化或监控所需的信息就不完整，从而导致结果不可靠。

想象一个场景：您使用标记策略来计算所有项目的总成本。该策略从概念验证阶段（PoC）开始，到生产阶段结束。考虑以下场景，将标签应用到销售预测项目 P1、D1 和 Pr1 示例以及售后维护项目 P2、D2 和 Pr2 示例的数据和资源。

**销售预测**

示例 P1：PoC 项目（缺少领域和时间戳）。

```
env: "poc"
project: "sales forecasting"
```

示例 D1：开发阶段（缺少领域）。

```
env: "dev"
project: "sales forecasting"
timestamp: 20210505T12:34:55
```

示例 Pr1：生产阶段（所有值都存在）。

```
env: "prod"
project: "sales forecasting"
domain: "machine learning"
timestamp: 20210505T12:34:55
```

对于销售预测项目：
+ 示例 P1 没有提及对象来自哪个领域或时间戳。
+ 示例 D1 也没有提及项目的领域。
+ 示例 Pr1 包含所有所需的数据。

由于未定义领域，示例 P1 和 D1 将导致规划的报告或估算不正确。

**售后维护**

示例 P2：PoC 项目（缺少所有标签）。

示例 D2：开发阶段（缺少项目）。

```
env: "dev"
domain: "machine learning"
timestamp: 20210505T12:34:55
```

示例 Pr2：生产阶段（所有值都存在）。

```
env: "prod"
project: "post sales maintenance"
domain: "machine learning"
timestamp: 20210505T12:34:55
```

对于售后维护项目：
+ 示例 P2 没有任何信息，因此无法对其进行跟踪。
+ 示例 D2 没有提及项目名称，因此无法对其进行跟踪。
+ 示例 Pr2 包含所有所需的数据。

示例 P2 和 D2 将由于缺少标签或标签不一致而导致报告不正确、计划不足或报告不足。

因此，一致地实施标签策略非常重要。

## 标签中的错误和敏感数据
<a name="incorrect-sensitive"></a>

如果使用不正确、敏感或私密的信息，则标记可能适得其反。错误的标签可能会产生误导性的结果。使用包含个人身份信息（PII）等敏感数据的标签，可能会使客户和员工面临安全风险。

**标签中含有错误信息**

想象一个场景：您使用标记策略来计算每个领域或每个部门的总成本。您刚刚完成数据摄取阶段，正在向机器学习迈进。以下示例包括从项目上一阶段复制的自定义标签。

```
env: "development"
project: "sales prediction"
domain: "data ingestion"
timestamp: 20210505T12:34:55
```

领域被错误地标记为上一个项目阶段的 `data ingestion`，而不是正确的领域（即 `machine learning`）。现在，`data ingestion` 领域的报告将显示更高的成本、时间范围和资源分配。`machine learning` 领域的这些报告将显示较低值。这将导致规划、预算分配和截止日期估算不正确。

拥有正确的标签对于职能系统至关重要。

**标签中含有敏感信息**

AWS 提供多种用于识别对象中 PII 的工具。这些工具包括 [Amazon Macie](https://docs.aws.amazon.com/macie/latest/user/what-is-macie.html) 和 [AWS Glue 敏感数据检测](https://docs.aws.amazon.com/glue/latest/ug/detect-PII.html)，用于找出可用于识别个人的数据。但是，切勿在标签中使用 PII 或敏感数据。

考虑以下 Amazon S3 中已脱敏或匿名化 PII 的文件为例。

```
{
  firstName: "67A1790DCA55B8803AD024EE28F616A2",
  lastName: "DRG54654DFHJGDYYRD",
  age: 21,
  city : "Frankfurt",
  probability_of_purchase: 48.858093,
  veggieName: "broccoli",
  creditcard: false
}
```

您可以看到客户的名字和姓氏已被哈希处理。但是，在本例中，该记录具有以下自定义标签。

```
owner: "Company XYZ"
about: "John Doe"
contact: "johnthegreat@email.com"
timestamp: 20210505T12:34:55
```

在这种情况下，尽管文件本身不包含 PII，但标签确实包含敏感信息。这会增加信息泄露的可能性，因为当您共享或传输文件或对象时，也会共享或传输其元数据。这也适用于数据库、表、作业和函数等其他 AWS 资源。

因此，避免在标签中使用私有信息极其重要。同样的概念也适用于关键或非公开信息。