1. Domain-Oriented Decentralized Data Ownership 2. Data as a Product 3. Self-Service Data Platform 4. Federated Computational Governance Business Outcomes Accelerated Innovation Improved Efficiency Enhanced Compliance Better Decision-Making

Data mesh principles

1. Domain-Oriented Decentralized Data Ownership

Empower domain teams to own and manage their data products:

Customer Experience Domain: Owns customer profiles, interactions, satisfaction metrics
Vehicle Engineering Domain: Owns telemetry, diagnostics, quality data
Service Operations Domain: Owns service records, warranty claims, parts inventory
Sales Domain: Owns sales transactions, dealer data, inventory

Each domain team becomes a data product owner, responsible for data quality, documentation, and SLAs.

Benefits of Domain Ownership

Domain Expertise: Teams closest to the data understand its nuances and business context
Faster Iteration: No dependency on central IT for data product changes
Clear Accountability: Single team responsible for data quality and availability
Scalability: Multiple teams can work in parallel without coordination overhead

Implementation in Automotive

In an automotive organization, domain ownership might look like:

Vehicle Engineering Domain publishes telemetry data products with sensor readings, diagnostic codes, and vehicle health metrics
Customer Experience Domain publishes customer profile data products with demographics, preferences, and interaction history
Service Operations Domain publishes service history data products with maintenance records, parts replacements, and technician notes
Sales Domain publishes transaction data products with sales, financing, and dealer performance metrics

Each domain team uses Amazon DataZone to register their data products, define access policies, and track usage metrics.

2. Data as a Product

Treat data like a product with clear ownership and quality standards:

Discoverable: All data products registered in a central catalog
Addressable: Consistent APIs and access patterns
Trustworthy: Quality metrics, SLAs, and data lineage tracked
Self-Describing: Rich metadata and documentation
Secure by Default: Encryption, access controls, and audit logging built-in

Data Product Characteristics

A well-designed data product has:

Clear Purpose: Solves specific business problems or enables specific use cases
Quality Metrics: Completeness, accuracy, timeliness, and consistency tracked
SLA Commitments: Uptime, latency, and freshness guarantees
Comprehensive Documentation: Schema, business glossary, usage examples
Versioning: Backward-compatible changes with deprecation notices
Access Controls: Role-based permissions with approval workflows

Example: Vehicle Telemetry Data Product

A vehicle telemetry data product might include:

Purpose: Enable predictive maintenance and quality analysis
Data: Tire pressure, battery voltage, engine temperature, diagnostic codes
Update Frequency: Hourly batch updates
Quality SLA: 99.9% completeness, <1% error rate
Retention: 7 years for regulatory compliance
Access: Engineering teams (read), Service teams (read), Customers (own data only)

3. Self-Service Data Platform

Provide teams with tools to independently create and consume data products:

Amazon SageMaker Unified Studio: Single interface for data engineering, ML, and analytics
AWS Glue: Serverless ETL for data transformation
Amazon Athena: SQL queries without managing infrastructure
Amazon DataZone: Catalog-based discovery with approval workflows
Infrastructure as Code: Automated provisioning of data pipelines and resources

Self-Service Capabilities

The platform enables teams to:

Discover Data: Search catalog by keywords, tags, or business terms
Request Access: Submit access requests through approval workflows
Create Pipelines: Build ETL jobs using visual or code-based tools
Train Models: Develop ML models using SageMaker notebooks
Build Dashboards: Create QuickSight visualizations without IT support
Deploy Products: Publish new data products to the catalog

Reducing Central IT Burden

Self-service reduces bottlenecks by:

Eliminating Tickets: No manual requests for data access or pipeline creation
Automated Provisioning: Infrastructure created on-demand via templates
Reusable Components: Blueprints for common patterns (ETL, ML, dashboards)
Guardrails: Policies enforce security and compliance automatically
Cost Controls: Budget limits and resource tagging prevent overspending

4. Federated Computational Governance

Balance autonomy with centralized governance:

Central Policies: Organization-wide security, privacy, and compliance rules
Distributed Enforcement: Policies applied automatically at domain level
Automated Compliance: Built-in checks for data quality and regulatory requirements
Complete Audit Trail: Lineage tracking and access logs across all domains
Cost Management: Resource tagging and budget controls per domain

Governance Framework

The governance model includes:

Global Policies: Encryption standards, data retention, PII handling
Domain Policies: Domain-specific quality rules and access controls
Automated Enforcement: Policies applied via AWS Lake Formation and IAM
Continuous Monitoring: CloudWatch and Config track compliance
Exception Handling: Approval workflows for policy exceptions

Balancing Control and Autonomy

Federated governance provides:

Consistency: Same security and privacy standards across all domains
Flexibility: Domains customize workflows within policy boundaries
Visibility: Central team sees all data products and access patterns
Accountability: Domain owners responsible for compliance within their domain
Scalability: Governance scales as new domains are added

Business Outcomes

Organizations that implement a data mesh architecture achieve measurable business outcomes:

Accelerated Innovation

Faster Time-to-Market: New data products deployed in days instead of months
Increased Experimentation: Domain teams can test hypotheses without central IT bottlenecks
Product Differentiation: Advanced features powered by comprehensive data integration

Improved Efficiency

Reduced Data Team Burden: Central team focuses on platform and governance, not individual requests
Reusable Data Products: Teams build on existing data products instead of recreating them
Automated Workflows: Self-service reduces manual data provisioning and access requests

Enhanced Compliance

Consistent Policies: Automated enforcement of security and privacy controls
Audit Readiness: Complete lineage and access logs for regulatory reporting
Risk Reduction: Centralized governance reduces compliance violations

Better Decision-Making

Democratized Data Access: More people can access data they need, when they need it
Trusted Data: Quality metrics and lineage build confidence in data products
Faster Insights: Self-service analytics reduce time from question to answer

Warning Javascript is disabled or is unavailable in your browser.

To use the Amazon Web Services Documentation, Javascript must be enabled. Please refer to your browser's Help pages for instructions.

Document Conventions

Strategy and challenges

AWS implementation options