数据仓库架构

数据仓库是基于“写时模式”方法的集中式存储库，可聚合来自多个来源的结构化历史数据（SAP 数据和非 SAP 数据），以支持高级分析、报告和商业智能（BI）。它使组织能够使用针对复杂查询（而非事务处理）优化的架构，分析海量集成数据以做出明智的决策。

业务分析师、数据工程师、数据科学家和决策者可通过商业智能（BI）工具、SQL 客户端及其他分析应用程序访问数据仓库。架构包含多个层：用于呈现结果的前端客户端、用于数据访问与分析的分析引擎，以及用于数据加载与存储的数据库服务器。

数据以表和列的形式存储在数据库中，并按模式进行组织。数据仓库整合来自多个来源的数据，支持历史数据分析，并确保数据质量、一致性和准确性。将分析处理与事务数据库分开可以增强两个系统的性能，通过高效存储数据来支持报告、仪表板和分析工具，从而最大限度地减少 I/O 查询结果并将其快速提供给大量并发用户。

主要特征

架构组件

数据仓库利用分层架构对不同粒度的数据进行组织，这有助于确保数据的一致性和灵活性。最常见的数据仓库架构层包括源层、暂存层、仓库层和使用层。SAP 系统的数据仓库同样采用基于层的架构。在构建 SAP 云数据仓库的背景下 AWS。该架构涉及用于数据采集、存储、转换和消费的几个关键层和组件。

企业级存储

Amazon S3 Intelligent-Tiering 是一种存储类，它根据不断变化的访问模式在访问层之间移动数据，从而自动优化存储成本。这可确保频繁访问的数据随时可用，同时将访问频率较低的数据或“冷”数据存储在成本更低的层中。有关更多详细信息，您可以参阅 Amazon S3 存储类别。

操作型数据存储层

Amazon Redshift 用于实现操作型数据存储、传播和数据集市功能。提供脚本以创建数据模式并部署数据定义语言（DDL），且包含加载 SAP 源数据所需的结构。可以对这些 DDL 进行自定义，使其包含 SAP-specific 字段。

数据传播层

通过 Glue 作业加载到 S3 中的增量数据可用于生成 Slowly Changing Dimension Type 2（SCD2）表，此表将保留完整变更历史记录。

数据集市层

利用 Redshift 中的实体化视图构建结构化的数据集市模型。事务数据通过主数据（属性和文本）进行扩充，从而构建出可直接用于数据使用的分析模型。

《在 AWS 解决方案基础上构建 SAP 数据仓库指南》提供了详细的架构、实施步骤以及快速跟踪 SAP 数据仓库实施的加速措施。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

数据湖架构

代理式人工智能