数据工程原则 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据工程原则

我们建议您在为现代数据管线构建架构时,采用下表中的原则。

原则

示例

使用案例

弹性

使用微服务

FastGo 凭借 AWS 上的微服务架构,享有灵活性和可扩展性(AWS 案例研究)

可重复性

使用基础设施即代码(IaC)部署您的服务

第 3 部分:NatWest Group 如何使用 Amazon SageMaker 构建可审计、可重现和可解释的机器学习模型(AWS 机器学习博客)

可重复使用性

以共享方式使用库和参考文献

使用新的“数据集即源”功能在 Amazon QuickSight 中创建和重复使用受监管的数据集(AWS 大数据博客)

可扩展性

选择服务配置以适应任何数据负载

在 AWS 云上设计数据湖以实现增长和扩展(AWS 规范指引)

可审计性

使用日志、版本和依赖关系保留审计跟踪记录

Parametric 如何使用 AWS 数据湖架构构建审计监控(AWS 架构博客)