Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWS arquitectura de datos moderna
Esta guía no describe cómo implementar un marco de estrategia de datos en AWS. Se trata de un tema extenso que se trata en AWS la documentación, las publicaciones de blog y otras guías (consulte la sección de Recursos). Sin embargo, en el siguiente diagrama se ofrece información general de alto nivel. Se ilustran los componentes principales de una arquitectura de datos moderna en AWS y se trata la mayoría de los servicios que pueden incluirse en la hoja de ruta.
Los componentes principales de esta arquitectura admiten los principios técnicos de una estrategia de datos moderna que se trataron anteriormente:
-
Utilice una capa de almacenamiento integrada, rentable y escalable para que todos los productores y consumidores de datos tengan las capacidades técnicas necesarias para interactuar con los datos.
Amazon Simple Storage Service (Amazon S3)
es un servicio de almacenamiento de objetos que proporciona integración, escalabilidad, disponibilidad de datos, seguridad y rendimiento a un bajo precio. -
La seguridad es obligatoria. Aplique las reglas de privacidad de los datos, proteja los datos mediante cifrado, habilite la auditoría y garantice el cumplimiento automatizado.
Para aplicar la privacidad, la protección y el cumplimiento de los datos de forma automatizada y para habilitar la auditoría, puede usar AWS Key Management Service (AWS KMS)
, AWS Identity and Access Management (IAM) , AWS Secrets Manager , AWS Audit Manager y Amazon Macie . -
Gobierne los datos para compartirlos con toda la empresa. Proporcione un catálogo de datos único y un glosario empresarial para que los usuarios puedan encontrar y usar los datos que necesitan.
AWS Lake Formation
lo ayuda a gobernar los datos y compartirlos en toda la empresa. Además, puedes crear un catálogo de datos único AWS Glue y un glosario empresarial mediante Amazon DataZone (en versión preliminar) para que tus empleados puedan encontrar los datos que necesitan. -
Seleccione el servicio adecuado para el trabajo adecuado. Tenga en cuenta la funcionalidad, la escalabilidad, la latencia de los datos, el esfuerzo necesario para ejecutar el servicio, la resiliencia, la integración y la automatización cuando elija un componente.
Puede utilizar Amazon Athena
, Amazon EMR, Amazon Service, Amazon Kinesis, AWS Glue OpenSearch Amazon Redshift, Amazon Managed Streaming for Apache Kafka (Amazon MSK) y Amazon Quick Suite para gestionar sus tareas. Por ejemplo, puede realizar transmisiones en tiempo real con Kinesis o Amazon MSK, procesar datos con Amazon EMR o realizar búsquedas con OpenSearch Service AWS Glue, consultas ad hoc con Athena y almacenamiento de datos con Amazon Redshift. -
Use inteligencia artificial (IA) y machine learning (ML).
Puede habilitar el uso de la inteligencia artificial con los servicios de AWS IA
y el aprendizaje automático con Amazon SageMaker AI . -
Proporcione conocimientos básicos sobre datos y herramientas con abstracciones para empresarios.
Los procesos para proporcionar alfabetización de datos, herramientas y abstracciones no forman parte de la arquitectura, pero puede usar Amazon DataZone
(en versión preliminar) y Amazon Quick Suite como herramientas de abstracción de datos. AWS Lake Formation -
Pruebe las hipótesis de las iniciativas de datos y mida los resultados.
Puedes usar el panel de Amazon OpenSearch Service
o Amazon Quick Suite para trabajar con las métricas de resultados empresariales y los resultados de las pruebas, y validar tus hipótesis.
Para obtener ejemplos de arquitecturas de muestras para distintos casos de uso, consulte los diagramas de arquitecturas de referencia en el Centro de arquitectura de AWS