As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Avaliação técnica
Uma avaliação técnica é importante porque fornece um mapa dos recursos técnicos atuais que sua empresa possui. A avaliação abrange governança de dados, ingestão de dados, transformação de dados, compartilhamento de dados, plataforma de machine learning (ML), processo e automação.
Confira alguns exemplos de perguntas que você pode fazer durante a avaliação técnica, por equipe. Você pode incluir perguntas com base no seu contexto.
Equipe de engenharia de dados
-
Quais são os desafios atuais associados à ingestão de dados para sua equipe?
-
Há alguma fonte de dados externa ou interna de que sua equipe precisa que não esteja disponível para ingestão? Por que ela não está disponível?
-
De quais tipos de fontes de dados você ingere dados (por exemplo, bancos de dados MySQL, API do Salesforce, arquivos recebidos, dados de navegação do site)?
-
Quanto tempo leva para ingerir dados de uma nova fonte de dados?
-
Os processos de ingestão de dados de uma nova fonte são automatizados?
-
É fácil para uma equipe de desenvolvimento publicar dados transacionais para analytics de sua aplicação?
-
Você tem ferramentas para cargas completas ou incrementais (em lotes ou microlotes) da sua fonte de dados?
-
Você tem ferramentas de captura de dados de alteração (CDC) para cargas contínuas de seus bancos de dados?
-
Você tem opções de fluxo de dados para ingestão de dados?
-
Como você realiza a transformação de dados para dados em lote e em tempo real?
-
Como você gerencia a orquestração dos fluxos de trabalho de transformação de dados?
-
Quais atividades você realiza com mais frequência: descoberta e catalogação de dados, ingestão de dados, transformação de dados, ajuda a analistas de negócios, ajuda a cientistas de dados, governança de dados, treinamento de equipes e usuários?
-
Quando um conjunto de dados é criado, como ele é classificado quanto à privacidade dos dados? Como você limpa esse conjunto de dados para torná-lo significativo para seus consumidores internos?
-
A administração e a governança de dados são centralizadas ou descentralizadas?
-
Como você aplica a governança de dados? Você tem um processo automatizado?
-
Quem é o proprietário e o administrador dos dados em cada fase do pipeline: ingestão de dados, processamento de dados, compartilhamento de dados e uso de dados? Existe um conceito de domínio de dados para determinar os proprietários e administradores?
-
Quais são os principais desafios no compartilhamento de conjuntos de dados dentro da organização com controle de acesso?
-
Você usa a infraestrutura como código (IaC) para implantar e gerenciar pipelines de dados?
-
Você tem uma estratégia de data lake?
-
Seu data lake está distribuído ou centralizado em toda a organização?
-
-
Como seu catálogo de dados é organizado? É corporativo ou por setor?
-
Você tem uma abordagem de data lakehouse em vigor?
-
Você usa ou planeja usar conceitos de data mesh?
Você pode complementar essas perguntas com o AWS Well-Architected Framework Data Analytics Lens.
Equipe de análise de negócios
-
Como você descreveria as seguintes características dos dados disponíveis para seu trabalho:
-
Limpeza
-
Qualidade
-
Classificação
-
Metadados
-
Significado dos negócios
-
-
Sua equipe participa das definições do glossário de negócios dos conjuntos de dados em seu domínio?
-
Qual é o impacto de não ter os dados necessários para realizar seu trabalho no momento em que você precisa?
-
Você tem algum exemplo de cenário em que você não tem acesso aos dados ou leva muito tempo para obter os dados? Quanto tempo leva para você obter os dados de que precisa?
-
Com que frequência você usa um conjunto de dados menor do que o necessário devido a problemas técnicos ou ao tempo de processamento?
-
Você tem um ambiente sandbox com a escala e as ferramentas de que precisa?
-
Você pode realizar testes A/B para validar hipóteses?
-
Você sente falta de alguma ferramenta necessária para realizar seu trabalho?
-
Quais tipos de ferramentas?
-
Por que elas não estão disponíveis?
-
-
Há alguma atividade importante que você não tem tempo para realizar?
-
Quais atividades consomem mais seu tempo?
-
Como as visões de negócio são atualizadas?
-
Elas são programadas e gerenciadas automaticamente?
-
-
Em quais cenários você precisaria de dados mais recentes do que os que você obtém?
-
Como você compartilha análises? Quais ferramentas e processos você usa para compartilhar?
-
Você costuma criar novos produtos de dados e disponibilizá-los para outras equipes?
-
Qual é o seu processo para compartilhar produtos de dados com outras áreas de negócios ou em toda a empresa?
-
Equipes de ciência de dados (para determinar a implantação do modelo)
-
Como você descreveria as seguintes características dos dados disponíveis para seu trabalho:
-
Limpeza
-
Qualidade
-
Classificação
-
Metadados
-
Significado
-
-
Você tem alguma ferramenta automatizada para treinar, testar e implantar modelos de machine learning (ML)?
-
Você tem opções de tamanho de máquina para realizar cada etapa na criação e implantação de um modelo de ML?
-
Como os modelos de ML são colocados em produção?
-
Quais são as etapas para implantar um novo modelo? O quão automatizadas são elas?
-
Você tem os componentes para treinar, testar e implantar modelos de ML para dados em lote e em tempo real?
-
Você pode usar e processar um conjunto de dados grande o suficiente para representar os dados necessários para criar o modelo?
-
Como monitorar modelos e executar ações para treiná-los novamente?
-
Como você avalia o impacto dos modelos em sua empresa?
-
Você pode realizar testes A/B para validar hipóteses para as equipes de negócios?
Para perguntas adicionais, consulte o AWS Well-Architected Framework Machine Learning Lens.