Evaluación técnica - Recomendaciones de AWS

Evaluación técnica

La evaluación técnica es importante porque proporciona un mapa de las capacidades técnicas actuales con las que cuenta la empresa. La evaluación abarca la gobernanza de datos, la ingesta de datos, la transformación de datos, el intercambio de datos, la plataforma de machine learning (ML), los procesos y la automatización. 

A continuación se muestran algunos ejemplos de preguntas que el equipo puede formular durante la evaluación técnica. Puede agregar preguntas en función de su contexto.

Equipo de ingeniería de datos

  • ¿Cuáles son los desafíos actuales asociados a la ingesta de datos para el equipo? 

  • ¿Hay algún origen de datos externo o interno que el equipo necesite y que no esté disponible para su ingesta? ¿Por qué no está disponible?

  • ¿De qué tipos de orígenes ingiere datos (por ejemplo, bases de datos MySQL, API de Salesforce, archivos recibidos, datos de navegación de sitios web)?

  • ¿Cuánto tiempo necesita para ingerir datos de un nuevo origen de datos?

  • ¿Los procesos de ingesta de datos de un nuevo origen están automatizados?

  • ¿Qué tan fácil es para un equipo de desarrollo publicar datos transaccionales para su análisis desde la aplicación?

  • ¿Dispone de herramientas para cargas completas o incrementales (en lotes o microlotes) desde el origen de datos?

  • ¿Cuenta con herramientas de captura de datos de cambios (CDC) para cargas continuas desde las bases de datos?

  • ¿Dispone de opciones de transmisión de datos para la ingesta de datos?

  • ¿Cómo se lleva a cabo la transformación de datos para datos por lotes y en tiempo real?

  • ¿Cómo administra la orquestación de los flujos de trabajo de transformación de datos?

  • ¿Qué actividades lleva a cabo con más frecuencia (detección y catalogación de datos, ingesta de datos, transformación de datos, ayuda a los analistas de negocios, ayuda a los científicos de datos, gobernanza de datos, formación de equipos y usuarios)?

  • Cuando se crea un conjunto de datos, ¿cómo se clasifica para la privacidad de los datos? ¿Cómo se limpia para que sea útil para los consumidores internos?

  • ¿La administración y la gobernanza de datos están centralizadas o descentralizadas?

  • ¿Cómo se aplica la gobernanza de datos? ¿Cuenta con un proceso automatizado?

  • ¿Quién es el propietario y el administrador de los datos en cada fase de la canalización (ingesta, procesamiento, uso compartido y uso de datos)? ¿Existe un concepto de dominio de datos para determinar los propietarios y los administradores?

  • ¿Cuáles son los principales desafíos al compartir conjuntos de datos dentro de la organización con el control de acceso?

  • ¿Utiliza la infraestructura como código (IaC) para implementar y administrar canalizaciones de datos?

  • ¿Cuenta con una estrategia de lago de datos? 

    • ¿El lago de datos está distribuido o centralizado en toda la organización? 

  • ¿Cómo se organiza el catálogo de datos? ¿Es para toda la empresa o por área?

  • ¿Cuenta con un enfoque de lago de datos?

  • ¿Utiliza conceptos de malla de datos o tiene previsto usarlos?

Puede complementar estas preguntas con la Lente de análisis de datos del Marco de AWS Well-Architected.

Equipo de análisis empresarial

  • ¿Cómo describiría las siguientes características de los datos disponibles para su trabajo?

    • Limpieza

    • Calidad

    • Clasificación

    • Metadatos

    • Significado empresarial

  • ¿El equipo participa en las definiciones en el glosario empresarial de los conjuntos de datos del dominio?

  • ¿Cuál es el impacto de no contar con los datos que necesita para llevar a cabo el trabajo en el momento en que los necesita?

  • ¿Tiene algún ejemplo de situaciones en las que no tenga acceso a los datos o tarde demasiado tiempo en obtenerlos? ¿Cuánto tiempo necesita para obtener los datos que le hacen falta?

  • ¿Con qué frecuencia utiliza un conjunto de datos más pequeño del que necesitaba a causa de problemas técnicos o el tiempo de procesamiento?

  • ¿Cuenta con un entorno de pruebas con la escala y las herramientas que necesita?

  • ¿Puede llevar a cabo pruebas A/B para validar las hipótesis?

  • ¿Le falta alguna herramienta que necesite para llevar a cabo el trabajo?

    • ¿Qué tipo de herramienta?

    • ¿Por qué no está disponible?

  • ¿Hay alguna actividad importante que no tenga tiempo de llevar a cabo?

  • ¿Qué actividades consumen más tiempo?

  • ¿Cómo se actualizan los puntos de vista empresariales?

    • ¿Se programan y administran automáticamente?

  • ¿En qué escenarios necesitaría datos más actualizados que los que obtiene?

  • ¿Cómo comparte los análisis? ¿Qué herramientas y procesos utiliza para compartirlos?

  • ¿Suele crear nuevos productos de datos y ponerlos a disposición de otros equipos?

    • ¿Cuál es el proceso para compartir productos de datos con otras áreas empresariales o con toda la empresa?

Equipos de ciencia de datos (para determinar la implementación del modelo)

  • ¿Cómo describiría las siguientes características de los datos disponibles para su trabajo?

    • Limpieza

    • Calidad

    • Clasificación

    • Metadatos

    • Significado

  • ¿Cuenta con herramientas automatizadas para entrenar, probar e implementar modelos de machine learning (ML)?

  • ¿Cuenta con opciones de tamaños de máquinas para llevar a cabo cada paso de la creación e implementación de un modelo de ML?

  • ¿Cómo se ponen en producción los modelos de ML?

  • ¿Qué pasos sigue para implementar un nuevo modelo? ¿Qué tan automatizados están?

  • ¿Cuenta con los componentes necesarios para entrenar, probar e implementar modelos de ML para datos por lotes y en tiempo real? 

  • ¿Puede usar y procesar un conjunto de datos que sea lo suficientemente grande como para representar los datos que necesita para crear el modelo?

  • ¿Cómo supervisa los modelos y toma medidas para volver a entrenarlos?

  • ¿Cómo se mide el impacto de los modelos en la empresa?

  • ¿Puede llevar a cabo pruebas A/B para validar las hipótesis de los equipos empresariales?

Para más preguntas, consulte AWS Well-Architected Framework Machine Learning Lens.