Prácticas recomendadas para diseñar e implementar casos de uso de arquitecturas modernas centradas en los datos - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prácticas recomendadas para diseñar e implementar casos de uso de arquitecturas modernas centradas en los datos

Apoorva Patrikar, Amazon Web Services (AWS)

mayo de 2023 (historial de documentos)

Las organizaciones están dejando de utilizar cada vez más las arquitecturas centradas en las aplicaciones para adoptar arquitecturas centradas en los datos, en las que la infraestructura de TI, el desarrollo de aplicaciones e incluso los procesos empresariales se diseñan según los requisitos de datos. En una arquitectura centrada en los datos, los datos son un activo de TI fundamental. Usted diseña los sistemas y los procesos de TI para optimizarlos.

Esta guía ofrece las prácticas recomendadas para diseñar una arquitectura moderna centrada en los datos para su caso de uso. Puede utilizar estas prácticas recomendadas para modernizar las canalizaciones de datos y las operaciones de ingeniería de datos que respaldan esa canalización. Esta guía también proporciona información general del ciclo de vida de los datos en una canalización de datos. Al comprender este ciclo de vida, podrá crear canalizaciones de datos que optimicen los datos.

Puede utilizar esta guía para superar los desafíos siguientes a los que se enfrentan muchas organizaciones al diseñar una arquitectura centrada en los datos para las canalizaciones de datos:

  • Aversión a almacenar varias versiones del mismo conjunto de datos: es frecuente procesar los datos varias veces, pero este enfoque tiene sus limitaciones. De hecho, evitar procesar los datos varias veces suele requerir menos recursos y es más rentable. En esta guía se muestran las ventajas de adoptar un enfoque distinto que se centre en almacenar los datos procesados en varias etapas.

  • Renuencia a adoptar los lagos de datos: puede resultar difícil discernir entre las afirmaciones de marketing sobre los lagos de datos. También puede ser complicado determinar si su organización cuenta con las habilidades y los recursos necesarios para incorporar un lago de datos a los sistemas y los procesos de TI. Esta guía puede serle útil para comprender cómo un lago de datos puede ser un componente útil en la arquitectura centrada en los datos.

  • Contratación de suficientes ingenieros de datos: las tendencias del mercado sugieren que se espera que los científicos de datos hagan tareas de ingeniería de datos en muchas organizaciones aunque no tengan las habilidades de ingeniería de datos correctas. Estas diferencias de habilidades pueden afectar a los planes de comercialización. Esta guía puede serle útil para comprender mejor qué habilidades de ingeniería de datos son esenciales para diseñar una arquitectura centrada en los datos.

  • Falta de conocimientos acerca del uso de los servicios de AWS para el procesamiento horizontal: el procesamiento horizontal o distribuido permite que un clúster procese fragmentos de datos en paralelo al asignar tareas a varios nodos y recopilar el resultado antes de enviarlo de manera transparente al usuario. La transición hacia el procesamiento horizontal representa un cambio en la manera en que se visualizan y procesan los datos. Este cambio afecta no solo a la lógica de la aplicación o a la propia aplicación, sino también a la manera en que trabajan las organizaciones con los datos. Por ejemplo, el procesamiento horizontal afecta al almacenamiento central, la distribución de tareas y la modularización. El procesamiento horizontal también favorece los fragmentos de datos más grandes para las operaciones de lectura y escritura. En esta guía, se explica cómo puede funcionar el procesamiento horizontal para la canalización de datos.