View a markdown version of this page

最佳实践 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

最佳实践

使用标签时,了解当前或潜在的公司和使用案例结构非常重要。使用这些信息,您可以选择合适的标签。例如,如果您正在为售前部门构建数据湖,并且知道有计划扩展数据湖以包括来自售后部门的数据,那么使用标签 department 将有助于分别确定每个部门的成本和绩效。可以更准确地识别代码或数据的规划、成本分配和优化。如果没有 department 标签,售前数据需要 15 分钟进行数据建模,而售后数据需要 45 分钟,则开发人员必须花更多的时间进行根本原因分析。有了 department 标签,开发人员就可以准确了解该从哪里入手。

标记本体

业务和技术在识别合适的标签方面共同发挥着重要作用。从业务角度来看,公司和项目将始终遵循一定的结构。例如,在欧洲、中东和非洲区域,HR 部门可能有一个预测招聘需求的项目。在这种情况下,包括来自现有结构的元数据对于报告、监控、清理和推出非常重要。同时,技术部门明白,该项目将需要以下内容:

  • 通过由数据摄取、清理和处理组成的数据管线收集数据的各个阶段

  • 用于进行预测数据建模的 ML 团队

  • 用于代码编排的 DevOps 管线,覆盖开发、测试和生产环境

所有斜体关键字均为业务和技术组结构,这些结构务必与应用程序的组件关联。以下是典型的标记本体示例。使用该示例,下表显示了标签对应的键值对。

department

human resources

region

EMEA

project

hiring forecast

phase

3

process

data ingestion data cleaningprocessingmodeling、或 sales forecasting

domain

machine learning 或者data pipeline

creation

cdk x frameworkingest pipeline、或 manual - empty

status

development testingproduction accessreporting、或 onboarding

标签治理

设置治理机制有助于使标记在所有 AWS 资源上保持一致且可编程: