Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWS arquitectura de datos moderna
Esta guía no describe cómo implementar un marco de estrategia de datos en AWS. Se trata de un tema extenso que se trata en AWS la documentación, las publicaciones de blog y otras guías (consulte la sección de Recursos). Sin embargo, el siguiente diagrama proporciona una descripción general de alto nivel. En él se ilustran los componentes principales de una arquitectura de datos moderna AWS y se describen la mayoría de los servicios que pueden incluirse en su hoja de ruta.

Los componentes principales de esta arquitectura respaldan los principios técnicos de una estrategia de datos moderna que se discutieron anteriormente:
-
Utilice una capa de almacenamiento integrada, rentable y escalable, de modo que todos los productores y consumidores de datos tengan las capacidades técnicas necesarias para interactuar con los datos.
Amazon Simple Storage Service (Amazon S3)
es un servicio de almacenamiento de objetos que proporciona integración, escalabilidad, disponibilidad de datos, seguridad y rendimiento a un bajo coste. -
La seguridad es obligatoria. Aplique las normas de privacidad de los datos, proteja los datos mediante el cifrado, habilite la auditoría y garantice el cumplimiento automatizado.
Para aplicar la privacidad, la protección y el cumplimiento de los datos de forma automatizada y para habilitar la auditoría, puede usar AWS Key Management Service (AWS KMS)
, AWS Identity and Access Management (IAM) y Amazon AWS Audit Manager Macie. AWS Secrets Manager -
Controle los datos para compartirlos con toda la empresa. Proporcione un catálogo de datos único y un glosario empresarial para que los usuarios puedan encontrar y utilizar los datos que necesitan.
AWS Lake Formation
le ayuda a gestionar los datos y a compartirlos en toda la empresa. Además, puedes crear un catálogo de datos único AWS Glue y un glosario empresarial mediante Amazon DataZone (en versión preliminar) para que tus empleados puedan encontrar los datos que necesitan. -
Selecciona el servicio adecuado para el puesto adecuado. Al elegir un componente, tenga en cuenta la funcionalidad, la escalabilidad, la latencia de los datos, el esfuerzo necesario para ejecutar el servicio, la resiliencia, la integración y la automatización.
Puede considerar Amazon Athena
, Amazon EMR, Amazon Service, AWS Glue Amazon Kinesis, OpenSearch Amazon Redshift, Amazon Managed Streaming for Apache Kafka (Amazon MSK) y Amazon para gestionar sus tareas. QuickSight Por ejemplo, puede realizar transmisiones en tiempo real con Kinesis o Amazon MSK, procesar datos con Amazon EMR o realizar búsquedas con OpenSearch Service AWS Glue, consultas ad hoc con Athena y almacenamiento de datos con Amazon Redshift. -
Utilice la inteligencia artificial (IA) y el aprendizaje automático (ML).
Puede habilitar el uso de la inteligencia artificial con los servicios de AWS IA
y el aprendizaje automático con Amazon SageMaker AI . -
Proporcione conocimientos básicos sobre datos y herramientas con abstracciones a los empresarios.
Los procesos para proporcionar alfabetización de datos, herramientas y abstracciones no forman parte de la arquitectura, pero puede usar Amazon DataZone
(en versión preliminar) y Amazon QuickSight como herramientas de abstracción de datos. AWS Lake Formation -
Pon a prueba las hipótesis de tus iniciativas de datos y mide sus resultados.
Puedes usar el panel de Amazon OpenSearch Service
o Amazon QuickSight para trabajar con las métricas de resultados empresariales y los resultados de las pruebas, y validar tus hipótesis.
Para ver ejemplos de arquitecturas de ejemplo para diferentes casos de uso, consulta los diagramas de arquitectura de referencia en el Centro de AWS Arquitectura