As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Estratégia de dados
<a name="data-strategy"></a>


| **Pergunta** | **Exemplo de resposta** | 
| --- | --- | 
| Quais tipos de dados específicos são cruciais para suas cargas de trabalho generativas de IA e qual porcentagem delas está acessível atualmente? | Os registros de chamadas de clientes e os dados de avaliações de produtos são cruciais. Atualmente, 85% desses tipos de dados estão acessíveis para nossos projetos de IA generativa. | 
| Como você garante e mede a qualidade dos seus dados? | Implementamos métricas de qualidade de dados, incluindo integridade, precisão, consistência e pontualidade. Usamos ferramentas automatizadas para avaliar regularmente essas métricas e temos uma equipe dedicada para limpeza e enriquecimento de dados. | 
| Qual porcentagem de seus dados atende aos seus padrões de qualidade para uso generativo de IA? | Atualmente, 78% dos nossos dados atendem aos nossos padrões de qualidade. Nossa meta é atingir 95% nos próximos 12 meses por meio de processos aprimorados de limpeza de dados. | 
| Como você planeja criar confiança sobre o uso de dados em IA generativa entre suas partes interessadas? | Estamos implementando um conselho de ética de IA, fornecendo explicações claras sobre as decisões de IA e conduzindo auditorias trimestrais de IA para garantir transparência e justiça. | 
| Quão abrangente é sua documentação sobre fontes de dados e linhagem? | Mantemos um catálogo de dados detalhado que inclui metadados para todas as nossas fontes de dados, incluindo origem, frequência de atualização e uso. Usamos ferramentas de linhagem de dados para rastrear como os dados fluem e se transformam em nossos sistemas. | 
| Como você garante a diversidade em seus conjuntos de dados para evitar preconceitos nos modelos de IA? | Nós obtemos ativamente dados de diversos grupos demográficos e auditamos regularmente nossos conjuntos de dados em busca de viés representacional. Também usamos técnicas de geração de dados sintéticos para equilibrar categorias sub-representadas. | 
| Qual é sua taxa de atualização de dados para modelos críticos de IA generativa e como você determina essa frequência? | Os modelos críticos são atualizados semanalmente. Essa frequência é determinada pelas métricas de desempenho dos testes A/B, e nosso objetivo é uma degradação não superior a 2% entre as atualizações. | 
| Quantas versões de conjuntos de dados essenciais você mantém e por quanto tempo? | Mantemos as últimas cinco versões de cada conjunto de dados crítico, com um período de retenção de 18 meses para cada versão. | 
| Quantas equipes multifuncionais estão envolvidas em suas iniciativas de IA generativa e têm acesso aos seus dados? | Temos três equipes multifuncionais. Cada equipe inclui cientistas de dados, especialistas de domínio, especialistas em ética e analistas de negócios. | 
| Quais políticas e práticas de governança de dados você tem em vigor? | Temos um comitê multifuncional de governança de dados que supervisiona nossas políticas de dados. Implementamos controles de acesso baseados em funções, esquemas de classificação de dados e auditorias regulares para garantir a conformidade com nossa estrutura de governança. | 
| Quais medidas você tem em vigor para garantir a privacidade dos dados, obter o consentimento adequado e manter a confidencialidade? | Implementamos uma estrutura abrangente de privacidade de dados alinhada com o GDPR e a CCPA. Isso inclui obter consentimento explícito para o uso de dados, implementar técnicas de anonimização de dados e avaliações regulares do impacto na privacidade. | 
| Qual porcentagem de seus conjuntos de dados de treinamento de IA foi auditada quanto a preconceitos no último trimestre? | 70% de nossos conjuntos de dados de treinamento de IA foram auditados quanto a preconceitos no último trimestre. Estamos implementando ferramentas automatizadas de detecção de viés para alcançar 100% de auditorias trimestrais. | 
| Qual é a sua capacidade atual de processamento de dados e quanto você projeta que seja necessário para futuras cargas de trabalho de IA generativas? | Nossa capacidade atual é de 10 TB/day. We project needing 30 TB/day em um ano e estamos ampliando nossa infraestrutura para atender a essa demanda. | 
| Qual é sua estratégia para equilibrar a privacidade dos dados com as necessidades de dados dos modelos generativos de IA? | Estamos implementando técnicas avançadas de anonimização e geração de dados sintéticos. Nossa meta é aumentar nossos dados utilizáveis para IA em 40% e reduzir os riscos de privacidade em 60% no próximo ano. | 
| Qual porcentagem de seus conjuntos de dados de aprendizado de máquina (ML) está rotulada com precisão e qual é sua meta de taxa de precisão? | Atualmente, 85% dos nossos conjuntos de dados de ML são rotulados com precisão. Nossa meta é uma taxa de precisão de 95% no próximo trimestre, empregando técnicas de etiquetagem humana e automatizada. |